2012-02-09 7 views
0

Lucene.netと同様にテキストで(単語「何か」、すなわちフレーズ「こんにちはどのようにあなたは」ないフレーズが満たされた回数を数えます?Lucene.Netフレーズ数

私の英語は申し訳ありません。

答えて

0

これを行う1つの方法は、TermPositionVectorsを使用することです。

基本的には、各クエリ用語の位置を取得し、それらのクエリがドキュメント内で同じ順序で出現した回数を、クエリ内にあった回数を数えます。

+0

**ありがとうございました。 :)** 申し訳ありませんが、適合しません。TermPositionVectorは** words **で分割します。 文字列= "テスト不良ワードテスト不良ワード不良" TermPositionVectorからの返信:{内容:不良/ 4、テスト/ 2、ワード/ 2} フレーズを分割する必要があります。または** "悪いテスト" **、それはLucene.Netからの応答でした: "悪い単語": "テキストで2回会った" "悪いテスト": " –

+0

私はTermPositionVectorが単語であることを知っていますが、各Termのポジションを持っている場合は、ドキュメント内のフレーズを確実に見つけてカウントすることができます。 IndexesOf()メソッドとGetTermPositions()メソッドを見てください。私は過去にそれをやったのであなたができることは分かっていますが、サンプルを投稿するためのコードは用意されていません。 –

+0

**ありがとうございました!** –