OpenNLPツールスイートよりも優れた結果をもたらす統計エンジンはありますか?私が探しているのは、テキストからキーワードを選び、その動詞にステミングを与えるエンジンです。&名詞、おそらく自然言語処理はここに行く方法ではありません。エンジンは異なる言語でも動作するはずです。純粋な統計または自然言語処理エンジン?
2
A
答えて
2
LingPipeはおそらく完全なNLPツールと見なす価値があります。
しかし、すべてを行う必要がある場合は動詞と名詞を見つけて、それを幹、そしてあなただけの 1)トークン化テキスト 2)POSタガーを実行できる 3)ステマ
スタンフォードツールを実行します私は信じている複数の言語のためにこれを行うことができ、NLTKはそれを試してみる素早い方法です。
しかし、動詞と名詞の後につけてください。名詞句や複数語名詞についてはどうしますか?理想的には、nlpパッケージでこれを処理することができますが、その多くは作業しているドメインによって異なります。残念ながら、多くのNLPはデータがどれだけ良いかを示しています。
1
私はTreeTaggerとの良好な経験を持っていた:
http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
それは速くスタンフォードのものよりも、使いやすく、そしてそこに「良い」ステマー/タガーに属します。すべての操作を一度に行います:トークン化/ステミング/タグ付け。
2
Javaコードをお探しの場合は、Stanford's set of toolsをお勧めします。彼らのPOS taggerは、英語、ドイツ語、中国語、アラビア語で動作しますが(私は英語でのみ使用しました)、(英語のみの)字句解析ツールが含まれています。
これらのツールはすべて無料で、精度はかなり高く、Javaベースのソリューションではそれほど悪くはありません。主な問題はフレークなAPIと高いメモリ使用です。
3
多分異なる言語のステマーを開発したSnowballプロジェクトを探しているかもしれません。
関連する問題
- 1. 自然言語処理データベースクエリ
- 2. 自然言語処理 - Truecaserクラシファイア
- 3. トピックの自然言語処理
- 4. iPhone用の自然言語処理
- 5. PHPでの自然言語処理
- 6. 自然言語クエリ処理のデータベース
- 7. Android用自然言語処理
- 8. Python対自然言語処理のためのJava
- 9. 自然言語処理のためのARFF
- 10. SQLクエリコンバータへの自然言語統計クエリ
- 11. 自然言語コマンド言語
- 12. 名前付きエンティティのPython自然言語処理
- 13. 自然言語処理/テキスト構造解析の開始点
- 14. 自動タグ付けのための自然言語処理ライブラリ(.NET)
- 15. 機能的で純粋なプログラミング言語
- 16. 数値データを認識するための自然言語処理
- 17. 自然言語処理では、チャンキングの目的は何ですか?
- 18. SQlへの自然言語
- 19. 自然言語処理におけるチャンクとは何ですか?
- 20. 自然言語処理による論理フォアシー検出および/または識別
- 21. 自然言語処理を使用してウェブサイトを解析する
- 22. 自然言語処理のためのviterbiアルゴリズム遷移値はどこにありますか?
- 23. 処理対純粋なJavascriptを使用したHTML5キャンバス
- 24. 純粋に機能的なマップとセットの統計的性能
- 25. 自然言語処理を使用して文章から特定の単語を抽出します。
- 26. 純粋なjsでnet :: ERR_CONNECTION_REFUSEDを処理できません
- 27. 自然言語文構造の検索
- 28. PHPでの自然言語生成
- 29. 自然言語の識別を解除
- 30. 述語論理の自然減算
NLPはどのように「ここに行く」方法ではありませんか?あなたが言うことは、まさにNLPの問題です。 –
使用しようとしている技術について統計的に何も表示されません。 –
NLPとテキストマイニングが初めてです。テキストマイニングにNLPを使用する人がいると聞いていますが、これらは各言語のモデルに依存しています。私は、ほとんどの言語で動作する純粋な統計エンジンがあり、各言語のモデルは必要ないと聞いています。私はすべての必要な言語のモデルを見つけることができないことを心配しています。私はノルウェー人でOpenNLPは私の言語のモデルを持っていません。 –