Luceneの単語(トークン)のバイグラムを索引付けする必要があります。私はnグラムを生成し、それらのインデックスを作成することができますが、私にこれを行う何かがLuceneにあるかどうか疑問に思っています。 私はLuceneインデックスがcharのn-gramだけを索引することを発見しました。 アイデアLuceneのインデックストークンbigrams
6
A
答えて
0
バイグラムのインデックスを作成する必要がある理由に応じて、SpanQueryおよび/またはSnowballAnalyzerが役立ちます。
2
1
あなたが探しているクラスがShingleFilterです:http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/analysis/shingle/ShingleFilter.html
関連する問題
- 1. Luceneクエリの任期文書のLuceneと
- 2. luceneの
- 3. luceneの
- 4. Lucene。
- 5. Luceneのバージョン
- 6. LuceneのHive
- 7. Luceneのマージインデックス
- 8. LuceneのAnalyzerUtilエラー
- 9. TermFreqVector luceneの.NET
- 10. LuceneのConstantScoreRangeQuery
- 11. Luceneの性能
- 12. Luceneのクエリは
- 13. Luceneの「やクエリ」
- 14. トラブルluceneの
- 15. AndroidのLucene
- 16. lucene/python
- 17. Luceneチェックインデックスサイズ
- 18. Luceneフルテキストクエリスペルチェック
- 19. Lucene Jackrabbit
- 20. Lucene TermFrequenciesVector
- 21. Luceneユニットテスト
- 22. Lucene KeywordAnalyzer
- 23. Lucene BooleanQuery
- 24. Luceneのツイートのツイート
- 25. がどのようにLuceneのバージョン3.9までのLucene 4.0
- 26. Luceneクエリーパーサーエラーの処理
- 27. Luceneのクエリ得点
- 28. Luceneフィールドのグループ化
- 29. Luceneスコアの結果
- 30. データベース内のLuceneインデックス