2011-06-28 9 views
0

私は自分の検索にsolrを使用しています。これで私はsynonyms.textファイルを見つけました。あなたが望む言葉のために同義語を手動で含めることができます。solrに同義語を含める

しかし私のアプリケーションは大きなデータを持っているので、各単語に同義語を手動で含めるのは非常に難しいと思います。私が知りたい

このsynonym.textファイルはすべての辞書の単語ができない私見

答えて

0

ザッツを参照自動的に生成することをどのような方法があります。 2つの単語、つまりトークンの意味関係が少なくとも必要です。セマンティックシノニムの関係を含むデータベースのようなものがあれば、もちろんこのデータを生成することができます。

ソースの例はwiktonary(XML Dump:Link)です。しかし、おそらく他の使用可能な辞書がありますが、あなたが望むような完全なソースを手に入れられないと思います。 WiktonaryのXML Dumpを解析することはおそらく最良の選択であり、多言語索引があると、異なる言語間で同義語を整列することさえできます。

関連する問題