gawk

    0

    2答えて

    2行の.txtファイルと1行しか含まない行があるので、1行しか含まないものを削除したい。 ラインの例では、救助に Iamnotyours:

    1

    3答えて

    Linux端末とGAWKで作業をしています。目的は正規表現のリストを抽出し、この表現に関連付けられた遺伝子のカウンタを作ることです。 すべての正規表現でこれを行うようにGAWK式を設定できましたが、リストのすべての式に対してこれを実行する必要があります。 このような条件を設定する方法はありますか?If(RegExp is RegExpList)i ++ 1? RegExpList["RegExp"

    0

    1答えて

    私は、ログファイルに2つの異なる時間の間に特定の文字列が含まれているかどうかを調べています。タイム・スタンプ2016-11-10 06:45:00と2016-11-10 10:45:00で始まる行の間にfooが存在する場合、threshold変数は時間を設定します。たとえば、240は4時間です。 current="$(date "+%Y-%m-%d %H:%M:%S")" threshold=2

    0

    1答えて

    私は、LinuxおよびAWKの使用に非常に新しいですし、私の次の質問のための答えを見つけることができませんでした: は私がAWKを使用したいと私のファイルには、そのように構成されています Date ID Size 2016-11-09 688 47 2016-11-09 688 56 2016-11-09 31640 55 ここで、日付とIDを持つ各行のサイズを集計し、.csvファイルに

    0

    1答えて

    "([:alnum][:alnum][:alnum]" and ")"と文字列自体の間の文字列を取得しようとしています。実際には、多くの望ましくない文字で汚染されたファイルをクリーニングするという考え方があります。例えば 私のようなもので、多くの行があります。 bÖÓÄÉ@@@@ø16/11/2016 15H03'09" (ACTA/BN940-RYR71ND/A4067-LIPH-NILDU/1

    0

    1答えて

    'control+M'文字と'\r'文字の違いは何ですか? どちらも同じではありません。 '\ r'と書くように、gawkにcontrol + M文字を書くにはどうすればいいですか? 私の目的はgawkに 'comtrol + M'文字をRS(レコード区切り文字)とすることです。私は上記のコードを使用して取る後 $ grep '\r' raw_file | wc 1468 44570 2

    0

    2答えて

    私は私の処分でのgawkを持っていると私はフォーマットしたい、次のテキストがあります。私は次のように表示させたい Trip.to.Washington.2004.08... Florida.1993.12... Aunt.Rose.2011.06... を: Trip to Washington (2004) Florida (1993) Aunt Rose (2011) タイトル

    0

    2答えて

    わかりましたので、基本的に私は1つのファイルcontaingてきた電子メール&別の100個のファイルをfound.txtに追加含まれている場合はそう 何からのラインかどうかを確認することが可能であった場合はされて思っていました100個の.txtファイルを含むフォルダには[email protected]が含まれています。 find.txtの例、 [email protected] [em

    0

    2答えて

    ゼロ以外の値を持つカラム/フィールドを取得するための良いアイデア。 データ col1 col2 col3 .... col50 1 0 1 1 ので、出力は col1 col3 .... col50 1 1 1 編集する必要があります:例が間違っていたので、それを編集しました。

    0

    1答えて

    なぜ以下のステートメントは終了の代わりに開始をゼロに追加するのですか? Cloudera-CentOS仮想マシンでこれを試してみてください。ありがとう。 head -n 20 ratings.csv | awk '{print $0"000"}' 000rId,movieId,rating,timestamp 000,3.5,1112486027 0009,3.5,1112484676 0