2011-01-12 16 views
1

目的:アポストロフィを適切に形成された単語に変換できる必要があります。 - 少なくともアポストロフィを持つ最も一般的な言葉について。これを理想的に行うためには、単語のリストと暗示されたコンターパート(つまり「しない」と「しない」)が必要です。アポストロフィが正しいテキストに変換されましたか?

問題:自然言語処理に基づいて検索アルゴリズムを作成していますが、ユーザーがアポストロフィを使用してコンテンツ(または検索)を作成すると、問題が発生します。ほとんどの場合、アポストロフィを削除するだけで、正式には英語ではなく、NLPシステムで翻訳することはできません(しないでください - >しません)。

これらのアイテムを変換する必要があるものの1対1のマッピングが理想的なソリューションですが、そのようなリストは認識しません。

私が知っている場合、私はそれを見つけることができるかもしれない場所を教えてください。

THX

+0

NLPシステムの辞書に収縮を追加するだけではどうですか? –

答えて

3

これはかなり良いリストのようになります。 http://www.textfixer.com/resources/english-contractions-list.php

は、あなたのシステムを作りたいどのように良いに依存します。それは、 "行くつもり"と "やった"ことは理解できます...まあ、それは厳しいものです。それは、 "持っていなければならない"、 "持っている"、 "持っている"という意味になります。

ああ、私たちがコンピュータに通信するよう教えるときに学ぶこと。

関連する問題