porter-stemmer

    1

    1答えて

    これに似た質問[1] porter stemming algorithm implementation question?が展開されましたが、 feedないfeにfeedステムを行い、なぜ私の質問がある Step1b `(m>0) EED -> EE feed -> feed agreed -> agree (*v*) ED -> plastered

    6

    3答えて

    私はステーミングを実行するためにluceneの雪球アナライザーを使用します。結果は意味のある言葉ではありません。私はこれを参照しましたquestion。 解決策の1つは、単語のステムバージョンと単語の安定バージョンの間のマップを含むデータベースを使用することです。 (コミュニティーからコミュニティーへの例(コミュニティ/その他の単語)) このような機能を実行するデータベースがあるかどうかを知りたい

    4

    3答えて

    と矛盾している私は、このフィールドを食い止めています <fieldtype name="textes" class="solr.TextField"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <filter class="solr.WordDelimite

    8

    5答えて

    私はアラビア語のJavaステマーを探しています。 "AraMorph"と呼ばれるライブラリが見つかりましたが、その出力は制御不能であり、望ましくない単語を形成します。 アラビア語の他の語幹はありますか?

    0

    1答えて

    lancasterまたはporterのどれがステミングに最適ですか? ポーターstemmerはステミングには古すぎますか?

    2

    2答えて

    幹( 'リンゴ')= 'リンゴ' 幹( 'リンゴ')= 'APPL' 幹( 'APPL')= 'APPL' は、これは欠陥ではありませんステミングアルゴリズム? より多くのあなたが使用しているアルゴリズムの実装のバグのようになっていることを