大量のテキストデータをインポートして分類する方法を探しているクライアントがあります。このデータを分類する必要があり、これを行う最も簡単な方法は、説明フィールドを見てそこに保持されている単語を一致させて、その特定のレコードに対してカテゴリを導出できるかどうかを調べることです。シノニムスタイルのテキストの参照と解析
これを行う最良の方法は、単語を各カテゴリに対して保持されているキーワードに一致させることであり、それが失敗した場合は、何らかの同義語を使用してこれを代わりに使用できるかどうかを調べることです。たとえば、特定のレコードに「自動車」という単語が含まれていた場合、同義語検索はその単語をカテゴリ「車両」に対して保持される単語「car」に一致させることができます。
誰かが特定の単語の同義語を見つけるために辞書を検索するWebサービスやその他の手段を知っていますか?プロジェクトマネージャーは、このためにGoogle Enterprise Searchのライセンスを購入することを提案しましたが、私が作ることができるものは、これらのユーザーが探しているものを提供していません。
クライアントが探しているものを取得するという提案は、喜んで受け入れられます。
ありがとう!私はWordnetを調べます。
他の種類のテキスト分類ソフトウェア製品がありますか。私はこれにBayasianアルゴリズムを使用する議論があることを知っていますが、実際の例を見ることはできません。