これはかなりの質問であり、具体的な実装を探しているわけではありません(この問題を解決するものが既に存在すれば、それはすばらしいでしょう)。要求された情報がどのように取得されるかについて、誰かが私の考えを伝えることができれば、それは完璧です。情報の検索 - 用語の同義語を探して
この例で問題を説明します。私は大学(オックスフォード大学など)の名前を持っています。そして、私はこの大学に言及するtwitsを見つけるためにtwitterをフィルターにかけるつもりです。明らかに、彼らのほとんどは直接「Oxford大学」という言葉を含んでいないでしょうが、代わりに「Oxon」、「Oxf」または単に「Oxford」のようなものが使用されるかもしれません。
私の質問は、単語のすべての同義語を自動的に見つける方法です(正確には、私は大学の名前にのみ興味があります)。
私は、人々がTwitterで使っている言葉のすべての変種ではなく、同義語を探しているわけではないと思いますか?同義語が必要な場合は、WordNetのような辞書を使用して、類義語、反意語などを見つけることができます! –