gawk

0熱

2答えて

2行の.txtファイルと1行しか含まない行があるので、1行しか含まないものを削除したい。ラインの例では、救助に Iamnotyours:

1熱

3答えて

Linux端末とGAWKで作業をしています。目的は正規表現のリストを抽出し、この表現に関連付けられた遺伝子のカウンタを作ることです。すべての正規表現でこれを行うようにGAWK式を設定できましたが、リストのすべての式に対してこれを実行する必要があります。このような条件を設定する方法はありますか？If（RegExp is RegExpList）i ++ 1？ RegExpList["RegExp"

0熱

1答えて

AwkとGrepを使用して、ログファイル内の2つの時間の間の線を見つける

私は、ログファイルに2つの異なる時間の間に特定の文字列が含まれているかどうかを調べています。タイム・スタンプ2016-11-10 06:45:00と2016-11-10 10:45:00で始まる行の間にfooが存在する場合、threshold変数は時間を設定します。たとえば、240は4時間です。 current="$(date "+%Y-%m-%d %H:%M:%S")" threshold=2

0熱

1答えて

gawkははっきりと合計欄

私は、LinuxおよびAWKの使用に非常に新しいですし、私の次の質問のための答えを見つけることができませんでした：は私がAWKを使用したいと私のファイルには、そのように構成されています Date ID Size 2016-11-09 688 47 2016-11-09 688 56 2016-11-09 31640 55 ここで、日付とIDを持つ各行のサイズを集計し、.csvファイルに

0熱

1答えて

（[：alnum] [：alnum] [：alnum]と[：alnum]の間のgawk文字列抽出

"([:alnum][:alnum][:alnum]" and ")"と文字列自体の間の文字列を取得しようとしています。実際には、多くの望ましくない文字で汚染されたファイルをクリーニングするという考え方があります。例えば私のようなもので、多くの行があります。 bÖÓÄÉ@@@@ø16/11/2016 15H03'09" (ACTA/BN940-RYR71ND/A4067-LIPH-NILDU/1

0熱

1答えて

コントロール+ M文字と '\ r'文字の違いは何ですか？そして、どうやってそれを書いていますか？

'control+M'文字と'\r'文字の違いは何ですか？どちらも同じではありません。 '\ r'と書くように、gawkにcontrol + M文字を書くにはどうすればいいですか？私の目的はgawkに 'comtrol + M'文字をRS（レコード区切り文字）とすることです。私は上記のコードを使用して取る後 $ grep '\r' raw_file | wc 1468 44570 2

0熱

2答えて

gawkとsedを使って日付を含むタイトルをどのようにフォーマットできますか？

私は私の処分でのgawkを持っていると私はフォーマットしたい、次のテキストがあります。私は次のように表示させたい Trip.to.Washington.2004.08... Florida.1993.12... Aunt.Rose.2011.06... を： Trip to Washington (2004) Florida (1993) Aunt Rose (2011) タイトル

0熱

2答えて

Grepの/ gawkは - ラインは、IP電話、電子メールcontaing

わかりましたので、基本的に私は1つのファイルcontaingてきた電子メール&別の100個のファイルをfound.txtに追加含まれている場合はそう何からのラインかどうかを確認することが可能であった場合はされて思っていました100個の.txtファイルを含むフォルダには[email protected]が含まれています。 find.txtの例、 [email protected] [em

0熱

2答えて

ゼロ以外の値を持つカラムを取得するAWK

ゼロ以外の値を持つカラム/フィールドを取得するための良いアイデア。データ col1 col2 col3 .... col50 1 0 1 1 ので、出力は col1 col3 .... col50 1 1 1 編集する必要があります：例が間違っていたので、それを編集しました。

0熱

1答えて

Awkコマンドは常に最初の文字列を追加します

なぜ以下のステートメントは終了の代わりに開始をゼロに追加するのですか？ Cloudera-CentOS仮想マシンでこれを試してみてください。ありがとう。 head -n 20 ratings.csv | awk '{print $0"000"}' 000rId,movieId,rating,timestamp 000,3.5,1112486027 0009,3.5,1112484676 0