私は多くのカテゴリ(日付、年、時、名前、句読点、電子メールなど)でそれらの単語に合ったタイプを見つけようとしています。私はこれを検出する独自のコードを作っていましたが、ANTLRやJavaCCのようなライブラリが見つかりました。Javaで単語を解析するために使用できるライブラリは何ですか?
私がしたいことは、これらのライブラリのためのタックスですか?はいの場合、私は何を使うべきですか?そうでない場合は、私がこれに使うことができるものがありますか?
どのような勧告ですか? JavaCC、ANTRL、もう少しありますか?私はJavaCCがいくつかのクラスを生成しているのを見ていますが、トークン化のようにしたくないものがあります。
もし、あなたがJythonを使うオプションを持っていれば、それを使ってNLTKを使うことができると思いますので、あなたのJavaプロジェクトで使ってください。 –