2016-09-01 6 views
0

私はSOLRでKStem Filter Factory(KStemFF)を使用しています。私はKStemFFが100%正確ではないことに気付きました。なぜSOLR KStemFilterFactoryは「カード」を「カード」と言いますか?

例では、「カード」を「カード」に置き換えません。

「サウンドカード」と「サウンドカード」が異なる結果を返します。

これはKStemFFだけで動作する方法はありますか?私は、ポーター・ステマーのような他のステムマーを使うことがこの場合に役立つかもしれないことに気付きましたが、私は実際にプロジェクトで複数のステマーを使用したくありません。

+0

KStemFilterを使用しているフィールドの定義は何ですか? – MatsLindh

+0

@MatsLindh私は単純なtext_enを使用しています。 マイフィールドタイプは次のとおりです。 マイフィルタクラスがある: <フィルタクラス=」 solr.KStemFilterFactory "/> –

答えて

0

KStemは、ステミングワードでPorterStemよりも攻撃的ではないため、特定の複数の変換をスキップすることがあります。 選択する前に、パフォーマンスと結果に基づいていくつかのステマーを比較することができます。 1つのステムマーで100%の精度と望ましい結果を得ることはできません。結果に基づいて最適化されている必要があります。

+1

ありがとうございます。私はSOLRの "EngMinStem"を使ってしまった。これは他のものよりよく見えます。元の質問には、正確な100%正確な語幹はありません。 –

関連する問題