私はLucene/Solr 4をさまざまな機能をテストするために実行しています。 "クラスタリング"もあります。 現在、100万のドキュメントがインデックスに登録されています。すべてのドキュメントには、次のフィールドがあります。どのように(人参)クラスタリングsolrで動作しますか?
ID (unique Key) Example1: 10245
Example2: 24974
TOPIC (Keywords of the document) Example1: "disaster/japan/nuclear power station"
Example2: "world/japan/nuclear power"
HEADLINE (1 line of text): Example1: "explosion at nuclear power plant in japan"
Example2: "news about japans nuclear power plant"
TEXT (the full text): "In the Japanese nuclear power plant in Fukushima..."
すべてのフィールドがインデックスに登録され、格納されています.exapt TEXTは索引付きであり、格納されません。あなたはあなたが見るの例を探している場合TOPICは異なりますが、日本は同じであることを、
<str name="carrot.title">TOPIC</str>
<str name="carrot.snippet">HEADLINE</str>
: は、私は、次の特定の構成を使用しています。このようにsolr/carrotを設定することは可能ですか?example1とexample2は1つのクラスタになりますか?一致する "日本"のために!
さらに、「ニュース/原子力」のような3番目のTOPICがありますが、内部に「japan」はありませんが、HEADLINEとTEXTは「japans power plant」という言葉を使用しています。 1つのクラスターで3つのニュースを受け取るには、どのようなソル/ニンジンの設定が関係していますか?
ありがとうございました!
ありがとう、面白いアイデアがたくさんあります。私は試してみます。 –