私は最近、ドイツ語テキストのセンチメント分析プロジェクトに取り掛かりましたが、結果を改善するためにステマーを使用する予定です。Python NLTKにおける感情分析のためのドイツ語ステミング
NLTKにはドイツのSnowball Stemmerが付属していますが、すでに使用しようとしていますが、結果は不明です。多分それはこのようにすべきですが、言語学者ではなくコンピュータ科学者であるため、私は動詞の形が異なる幹につながってしまう問題があります。
"suchen"(検索する)という単語をとります。これは第1人の単数は「such」、第三者singularは「sucht」に由来します。
私も知っているが、ドイツ語のリーマライザは、私が知る限りNLTKに統合されていません。 GermaNetがありますが、NLTKの統合は中止されたようです。
要点:私は、同じ時制の中の普通の動詞では、変わった動詞の形を同じ形にしたいと思います。これが私の目標にとって有益な要件でない場合は、理由を教えてください。そうであれば、この目標を達成するのに役立つ追加のリソースを知っていますか?
編集:忘れてしまったのは、ソフトウェアは教育目的や研究目的に自由に使用できることです。
お返事ありがとうございます。お返事いただければ幸いです。 – Florian