私は100万語以上のファイルを持っています。私はコードを書こうとしています。単語が与えられた場合、その単語がファイルに存在するかどうかを調べる必要があります。ここのことは、各単語を26^(word.length()-1)
回確認する必要があります。したがって、ファイル内のすべての単語を調べることは良い解決策ではありません。私はアルゴリズムをオンラインで見つけようとしましたが、感知できる答えはまだ見つかりませんでした。私はHashMap
とTrie
の両方について考えている最速の方法は、百万語のリストを与えられた単語の編集距離を見つける
EDIT 。ここでの実際の問題は、私が単語abc
を持っていると言うことです。さて、私の仕事は、単語abc
の1文字を正確に追加、削除、または置換して単語Xを作成し、Xがファイルに含まれているかどうかを確認することです。したがって、どのソリューションがより良いアプローチになるのか混乱します。
あなたは特定のファイルシステム/ OSまたは多くの検索を実行していますか? –
私はそれを言ってくれましたが、あなたの言葉をデータベース(リレーショナル、キー/値、memcache)にすべて貼り付けて、それを調べる方がはるかに賢いでしょう。これは – ControlAltDel
のデータベースです@ LeonardoCooper:その1つのファイル、正確なテキストファイルです。 – noMAD