私は、合計で約300万行の大きなテキストファイルのセットを持っています。大量のテキストファイルで一意の値をコンパイルする最も効率的な方法は?
私がしたいことは、各行から与えられた列の値を取り出して、メモリ内の配列に追加することです。値がすでにアレイに存在する場合は、それを無視します。私は、最速の方法を想定してい
ではありません:(配列のネイティブインデックスまたは何-持っている - あなたの方法を使用して)存在する場合
- は、その配列にプッシュ
- 値を読む
一致/検索のスピードを上げるために、値をアルファベット順に挿入する必要がありますか?
複数の配列を保持する必要がありますか?たとえば、アルファベットの各文字に1つずつ
本当に面白い、ありがとう –