read +サブセットではなく `data.table`を行のフィルタリングで読む

data.tableに巨大なデータセットを読み込む必要があります。実際には、私はすべてのデータセットを必要とせず、特定の列に特定の値を持つ行のみを必要とします。私は、読み取り+サブセットのプロセスでそれを実行することができます。read +サブセットではなく `data.table`を行のフィルタリングで読む

dt <- read.table(.......) 
df_filtered <- subset(dt, Hash == '1AB3F' | Hash == 'DC167' | Hash == 'BCBC5')

行だけを読み込む方法はありますがHash列の制限を満たしていますか？

出典

2016-05-23 Loom

データセット全体を高速で読み取るには 'fread'を試してください。 – Divi

@Divi - ありがとうございました – Loom

％c（ '1AB3F'、 'DC167'、 'BCBC5'）のハッシュ％は、複数の比較と同じです。 – thelatemail

grepでファイルを読み取るためにパイプを使用することもできます。たとえば、 "e"を含むすべての辞書単語を読み込むには：

w <- read.table(pipe("grep e /usr/share/dict/words"))

出典

2016-05-23 02:44:34

これはLinux、Unix、OS X、およびBSDプラットフォーム上の良い解決策ですが、Windowsコンピュータでは機能しないことに言及する価値があります。 – dww

'fread'は' pipe'コールを使わなくてもそれを行うことができます： 'fread（" grep e/usr/share/dict/words "）' – daroczig

質問に記述されているようにデータセットが大きい場合、 read.table'が適切です。 Rセッションが何時間も立ち往生する可能性があります。 – jangorecki

read +サブセットではなく `data.table`を行のフィルタリングで読む

答えて

関連する問題