text-manipulation

    -2

    2答えて

    から類似した行を削除tbl.txt(150万行)は、のように構築された: 63 ; 193 ; 'Green' ; 'Color' 152 ; 162 ; 'Tall' ; 'Size' 230 ; 164 ; '130lbs' ; 'Weight' 249 ; 175 ; 'Green' ; 'Color' *duplicate on 'Value' and 'Attribu

    0

    2答えて

    Rで無効な列名を識別する方法はありますか?おそらく正規表現や別のテクニックを使っています。 私はDocumentTermMatrix(DTM)をテキスト列から生成し、このDTMをデータフレームに変換します。私は無効な名前の列に終わる。例えば "ノード" "CLASS" "️️️️" "️️️" "デ" "デ" "JE devais" "夜" "her目" "公認会計士chaud"「

    0

    1答えて

    itemsというデータフレームがあり、最初の列がItemNamesであると仮定します。 words = c("apple","Apple","Pear","pear") と、彼らは、言葉"confirmed"で文字列全体を置き換えない場合:私はitems$ItemNamesでの各項目を通過し、彼らがこれらの単語のいずれかを含むかどうかを確認したいと思います。 を、私はそれを行うにはforループとi

    1

    2答えて

    Iは、以下の様々な組み合わせを試してみた: awk -F" ||| " '{$0=$1}1' source_file.txt > column1.txt awk -F" ||| " '{$0=$1}2' source_file.txt > column2.txt 又は awk 'BEGIN {FS=" ||| ";}{print $1}' source_file.txt > column1.

    0

    2答えて

    私は私のスクリプトを使用する方法についてマニュアルページをシミュレートした出力として表示する予定の私と一緒に10のテキストファイルを持っています。しかし、私は、ページあたり10ページのページを表示するのに最適な方法を探しています。 例:ユーザーがキーボードで1を押すと、最初のページに移動し、キーボードで2を押すと2ページ目に移動します。もともとはcase構造を使用する予定でした。ユーザーが3を押す

    0

    1答えて

    私は、Editor.mとParameters.mの2つのファイルを持っています。 (例えばDT = 1) が何かでそれを置き換えることでParameters.mラインの 検索を読み取ります。私は、実行がない場合は、次のタスクがあることEditor.mでコードを書きたいですelse(例:dt = 0.6) パラメータmを保存します。 したがって、このプロセスの最後に、Parameters.mには、d

    0

    1答えて

    私はファイルを解析して情報を抽出する必要があるタスクがあります。私はこれをbashを使って簡単に行うことができますが、私はそれをunixコマンドでのみ行う必要があります。 Set<tab>one<tab>two<tab>three Set<tab>four<tab>five<tab>six ENDSET Set<tab>four<tab>two<tab>nine ENDSET Set

    1

    1答えて

    私のパイプラインのシーケンスが削除されたファイルを検索するスクリプトを作成しました。ここでのスクリプトは次のとおりです。 #!/usr/bin/python # -*- coding: utf-8 -*- q = open('eg-not-sec.bait').readlines() tm = open('eg_tm0_res').readlines() ph = open('eg_ph

    -3

    1答えて

    文字列 'object'が3回出現するテキストファイルがあります。 There is an object on the table The object is under the chair There might be an object in my pocket 私は、3つの要素の配列に格納されている別の文字列に「オブジェクト」のすべての発生を置き換えるためにPerlスクリプトを書きた

    6

    2答えて

    データベースにエンコードされているフィールドがあります。フィールド上from_base64使用した後は、それは次のようになります。パスの先頭に文字列の未知数があるかもしれません <string>//<string>//<string>/2017//06//21//<string>//file.txt 、しかし、日付(YYYY // MM // DD)は常に2つを持っています右のフィールド(ファ