2011-12-04 8 views
0

タブ区切りのテキストファイルを効率的にストリーミングする交差/結合を得るために、UNIXベースの高速ユーティリティ(理想的にはC言語で書かれています)をお勧めしますか?たとえば、「ファイルBの任意の列Kに表示されない列値Kを持つ、ファイルA内のすべてのエントリを与える」などのクエリを許可します。タブ区切りテキストファイルの高速交点、補数および和集合?

例えば、ファイルAの場合:

bob sally sue 
bob mary john 

とファイルBがある:

john sally sue 
foo bar quux 

後、カラム2にBへのファイルの相対を補完する "ボブメアリー・ジョン" を返します、以来、それは、ファイルBに表示されない2列目の値を持つファイルB内の唯一のファイルです。

私はデータベースを使用したくないが、コマンドラインベースのユーティリティが好きです。 awkは答えですか、それとももっと簡単なものがありますか?ありがとう。

答えて

0

特にそのクエリの場合のみ、私はおそらくawk、ハッシュBの2列、フィルタAのハッシュに基づいています。

関連する問題