2012-01-16 7 views
1

私はボキャブラリーでは完全にはわかりませんが、私がしたいのは、Solrサーバー(Solrnetを使用)に文書(または実際には文字列)と一連のキーワードを送信し、ドキュメントがキーワードにマッチするかどうかはわかりませんが、ドキュメントがサーバーに格納されたり索引付けされたりすることはありません。Solrを使用して、ドキュメントを保存せずにキーワードと照合することはできますか?

これは可能ですか、もしそうなら、私はどうしますか?

いいえ、良い方法の提案はありますか?考え方は、文書を保存する前に一致するかどうかをチェックすることです。最初はソフトコミットで保存することができますか?一致しない場合は、もう一度削除してください。これはインデックスにどのような影響を及ぼしますか?

答えて

3

ランキング文書 - トークン化及び分析するのSolrに送信し、得ストリングが格納

ストア文書 - 変更せず、そのままで格納するのSolrに送信

文書を検索可能にしたい場合は、まずそれを索引付けする必要があります。
ドキュメント(フィールド)を元の形式で取得可能にするには、ドキュメントを保存する必要があります。

あなたは正確に何を達成しようとしていますか?重複する文書は避けてください。あなたのケースを少し拡張することができます...

+1

アイデアは関心のない文書を保存するのを避けることでしたが、今や「ねえ、それは検索エンジンです。すべてを保存/索引付けし、その後私たちが興味を持っているものを見つけることができます。これには、当初興味のない文書を検索して検索できるという利点があります。 –

+0

右のディスク容量は安いです。インデックス作成プロセスの速度を遅くするよりも確かに良いです... –

+0

補足:ドキュメントとそれにアクセスするためのユニークなキーがすでにある場合は、再度保存する必要はありません。 –

関連する問題