2012-03-31 6 views
-1

私は、luceneで索引付けする用語集の組を収集しています。 は、各単語をカウント回数だけ複製した「文書」を作成せずにこれを行う方法はありますか?luceneの用語集ペアのファイルを索引する

私のクエリも同様の形式です。


私の質問はおそらく明確ではありませんでした。私が意味するのは、完全な文書ではなく、用語カウントの値があるということです。代わりに、文書のEg、「薔薇は薔薇でバラされ」私は、フォームのファイルがあります:私は、フォーム「バラのクエリを持っている場合は

は3 ローズが2

です私はそれを表現するでしょう バラ2

私はこの種のデータのインデックスを作成するためにluceneを使用できますか?そして、このタイプのクエリでクエリを実行できますか?

ありがとうございました!

答えて

1

これは達成するのが簡単なはずです。 2つのフィールドを持つ文書を作成します.1つは用語を保持し、もう1つはカウントを保持します。カウントにNumericFieldを使用すると、おそらくメリットがあります。

関連する問題