2011-10-27 8 views
0

私は多くのカテゴリ(日付、年、時、名前、句読点、電子メールなど)でそれらの単語に合ったタイプを見つけようとしています。私はこれを検出する独自のコードを作っていましたが、ANTLRやJavaCCのようなライブラリが見つかりました。Javaで単語を解析するために使用できるライブラリは何ですか?

私がしたいことは、これらのライブラリのためのタックスですか?はいの場合、私は何を使うべきですか?そうでない場合は、私がこれに使うことができるものがありますか?

どのような勧告ですか? JavaCC、ANTRL、もう少しありますか?私はJavaCCがいくつかのクラスを生成しているのを見ていますが、トークン化のようにしたくないものがあります。

+0

もし、あなたがJythonを使うオプションを持っていれば、それを使ってNLTKを使うことができると思いますので、あなたのJavaプロジェクトで使ってください。 –

答えて

2

あなたが必要とするパーサーがどれほど強力かによって異なります。非常に強力なもの(JavaCCやANTLRなど)が必要な場合は、それらを使用してください。

シンプルなものが必要な場合は、regular expressions in Java、またはStringTokenizer(例が非常に単純化されていても)以上の単純な辞書検索パーサーを構築できます。

+0

はい、私は自然言語処理のために強力なものが必要です。私は質問の例のようなものを検出することができますか? –

+0

自然言語処理は、単に日付や名前などを見つけるよりも深いテーマです.NLPは、言語の要素だけでなく、言語の意味や意図と関係しています。 NLPの場合は、おそらくその問題に近づくように設計されたAPI /ライブラリを探すことになります。 – jefflunt

+0

はい、私は多くのNLPライブラリを勉強しましたが、私が探しているものではありません。この特定の識別は、私がやっている主要なプロセスの一部にすぎません。私はこれらの図書館が私をもっと助けてくれるはずです。 –

関連する問題