私は約500万語のテキストを保持する約100万行のテーブルを持っており、これらのテキスト内で単語を検索しています。テキストを繰り返して検索することは時間的に効率的ではありません。何か案が?テキスト検索アルゴリズム
答えて
私はこの希少な情報ではLuceneの
を示唆している、私はあなたがinverted indexesを見てお勧めします。私が言うことができる限り、簡単に構築し、あなたのケースのための高速検索。既にサポートしているデータベースに切り替えることができない場合に備えて、あらゆる種類のデータベース環境で実装するのも非常に簡単です。
さらに詳しい情報をお伝えいただければ、別の解決策が役立つかもしれません。
しかし、私はlevenshteinメソッド(edit_distance)を使って、2つの単語(ユーザが入力した単語とデータベーステキストの次の単語)がどれほど類似しているか調べています。同じ方法でどのように逆インデックスとレベンシュテインを使うことができますか?私はそれについて考えています。なぜなら、「猫」がテキストに見つからなければ、私は「帽子」を探しているかもしれませんし、「帽子」やユーザーが入力したquuteを含むテキストがあります。かなり "。 – Coenni
反転インデックスとレベンステインの両方を使用する場合は、トライ内で逆インデックスを実装できます。正確に行うと、Levenstheinルックアップをサポートしようとします。各リーフには、一致したすべてのドキュメントのリストが含まれます。次に他の人が良い答えを見つけることを可能にするために、質問の中でより詳細な情報を与えてください。 – LiKao
- 1. .net検索アルゴリズム?
- 2. 検索アルゴリズム
- 3. フットプリント検索アルゴリズム
- 4. 検索アルゴリズムは
- 5. 検索アルゴリズム
- 6. SQLAlchemy検索アルゴリズム
- 7. 単語検索アルゴリズム
- 8. 検索ロジックとアルゴリズム
- 9. Googleパンダ検索アルゴリズム
- 10. ウェブサイトの検索アルゴリズム
- 11. 最適点検索アルゴリズムの検索
- 12. グラフ/分子比較アルゴリズムのテキスト検索を適応させる
- 13. 検索文字列アルゴリズム
- 14. 一律コスト検索アルゴリズム
- 15. A *検索アルゴリズム無限ループ
- 16. アルゴリズムの並列検索
- 17. ファジー文の検索アルゴリズム
- 18. Googleのオンサイト検索アルゴリズム
- 19. マージ検索結果アルゴリズム
- 20. JTableの高速検索アルゴリズム
- 21. 文字列検索アルゴリズム
- 22. テキスト検索 - オートコンプリート
- 23. リニア検索とバイナリ検索を組み合わせた検索アルゴリズム
- 24. 検索 - テキスト処理
- 25. MongoDB - テキストの検索
- 26. javascript:テキストを検索
- 27. PDFテキスト検索C#
- 28. マングースのテキスト検索
- 29. CONTAINSTABLE/fulltテキスト検索
- 30. テキストのJava検索
テーブルデータの保存にはどのような方法を使用していますか?フラットファイル? MySQL?あなたの質問にはかなり重要な情報です – Seph
mssql varchar(max)in tableしかし、私はストレージメソッドを変更することができます。 C#、mssql私は使用しています。 – Coenni