2012-05-07 9 views
1

私は自然言語モードでMySQLを使って情報検索システムを開発しています。 私が持っているデータは、さまざまなカテゴリを考慮して注釈が付けられています。例えば。猿、猫、犬は「動物」、アヒルは「鳥」として注釈されます。問題は、これらのタグの発生に基づいてドキュメントを取得していることです。全文検索のためにSphinxを使ってMySQLの関連性スコアを改善する

MySQLには、特定の用語がデータ全体で50%を超える場合、その用語は考慮されないという制限があります。私の要件を考慮して、データ全体で特定の用語が50%以上になっても一致するすべての用語にスコアを付けたいと思っています。

私は検索効率のためにSphinxとMySQLの組み合わせについていくつか読んだことがありますが、これが私の状況に適用できるかどうかはわかりません。

答えて

1

スフィンクスは非常に高速な全文検索で非常に良いですが、この問題の解決策を提供してください。 mySQLの50%ルールはありませんが、mySQLのフルテキスト検索の代わりにこのルールを使用する必要があります。基本的には、Sphinxをインストールし、すべてのmySQLデータをSphinxにコピーするためのインポートを設定することです。その後、SphinxSEを構築したり、ライブラリから直接Sphinxに問い合わせたりして結果を得ることができます。次に、mySQLを照会することによって、結果の詳細を取得できます。

私はSphinxを使用しています。これは、mySQLを使用してSphinxにクエリを実行し、mySQLテーブルを1つのクエリで結果に結合できるためです。それはかなり良いです。

+0

私はWindowsマシンにsphinxをインストールしましたが、MySQLからスフィンクスにデータをコピーする方法がわかりません。 SphinxSEを使用したいのですが、MySqlを50%使用せずに使用したいと思っています。また、SphinxSEを設定する方法を教えてもらえますか? – Pink

+0

インデックスの作成に関する文書を確認する必要があります。それはすべてsphinx設定ファイルで行われます。私はWindows上でSphinxSEを設定する方法はわかりませんが、通常はmySQL内でSphinxSEをコンパイルします。 – Hawkee

+0

すべてのお手伝いをありがとう!私はインストールとインデックスを把握します。私はプラグインのsphinx SEをインストールした後にもう1つ質問があります。MySQLデータベースをクエリできますが、MySQLが適用されない50%ルールがあり、取得したドキュメントの関連スコアを取得します – Pink

関連する問題