2009-07-03 9 views
1

ユーザーの投稿を分析して分類する必要があります。たとえば、すべての投稿をテキストに基づいて「購入」ポストまたは「売り」ポストとして分類する必要があります。「売る私の家」は「売り」と分類されます。問題はしばしばその単純ではない - 「私の古い家を取り除こうとしている」もまた「売る」と分類する必要があるということです。 「私は家を探しています」が「購入」になります。また、問題のアイテムに基づいてこれらの投稿を分類したいと思います。たとえば、上記の投稿は「購入」と「家」に分類されます。PHPでテキストを分析する最良の方法は?

ユーザーの入力を分析して理解するには、良いアプローチ/良いフレームワーク/手法をお勧めしますか?おかげさまで

+0

なぜ購入/売りラジオボタンのコンボは含まれませんか? – Residuum

+0

私が言ったように、私は売り買いだけでなく、どんなタイプの商品でもある必要があります。 ラジオボタンとドロップダウンリストを追加することができましたが、もっと賢明なものが必要でした。 おそらく、システムが男が書いたことを理解できなかった場合のフォールバックとして。 – daniel

答えて

2

あなたはそうです。それは難しいことです。

Yahoo!使用できるAPI/WebサービスはTerm Extractionです。それはあなた自身のために百万行のコードを書かなくても、あなた自身のテキスト上で言語解析を使うのは、かなり良い方法です。私はそれを使用していないので、あなたの質問が尋ねるように、それが同様の意味でどれくらいうまく機能しているか分かりません。

3

話題は基本的にはBayesian filtering problemで、スパムフィルタリングにも使用されています。 this talkも参照してください。これはかなり複雑な領域です。

関連する問題