2017-02-06 8 views
0

Hy、私はの商品評価の感想分析に基づいたプロジェクトに取り組んでいます。 いいえの単語は、除外する単語はです。製品のウェブサイトにユーザーのコメントがあると、それは自動的に10のうちレートされます だから私はは、クラスタリングのテクニックと混乱し、前に私の問題を解決する Plzzxヘルプ ありがとうございました。商品評価の感情分析

+0

質問が不明です。 – alfasin

+0

実際には、ユーザーのコメントが製品に良いか悪いかに応じて、製品の評価に使用されるWebサイトがあります。 – Luqman

答えて

1

基本的には、あなたのデータをどのように保存するかを考えなければならない間に、あなたのプログラムのクラシファイアとして使うのが最善であると頼んでいます。

ただし、正と負の2つのクラスしかないようです。また、データの単語分析に基づいて新しいデータを分類したいとします。

私はこのような問題の早い段階で作業していましたが、私はRocchioのTF-IDFアルゴリズムをそのような分類に使用しました。あなたはそれに一連の訓練データ(否定的および肯定的な言葉)を与え、それは後でシステムに来るものを分類します。

これは、ベクトル分類と余弦類似距離測定に基づいています。

詳しくは、paperをお読みください。 メソッドの動作例(非常に小さなデータの場合)hereを見つけることができます。

注:提供されている例は、私が取り組んでいるプロジェクトのセクションです。

+0

はい私は2つの別々のメモ帳ファイルを1つは良い単語用、もう1つは否定単語用です。私はそれらをC#でクラスター化したいと思います。ユーザーがコメント商品を書くのは非常にいいです。それはデータセット内の単語を検索し、その分類に従って評価します。 – Luqman

+0

これはほぼ正確に私が働いていたものです。 C#を使用し、私が話した方法を実装する。添付の論文は、TF-IDFベクターに基づく分類がどのように機能するかを記述する。肯定的な言葉のための重みのベクトルと、否定的な言葉のためのもう一つのベクトルを持つでしょう。新しいコメントが表示されると、コメントが処理されてベクトルが与えられます。したがって、3つのベクトル(正、負、新しいコメント)があります。新しいコメントがポジティブに近い場合は、ポジティブなコメントなどとみなします。 – Everyone

+0

は、段階的に実装するのに役立つ擬似コードまたは完全な羽ばたきアルゴリズムです – Luqman

関連する問題