2011-07-24 10 views
0

質問は曖昧であるかもしれませんが、私はできるだけベストに言おうとします。非公式の感情分析は、感情の変化を統計的に捕捉するのに役立つ必要があります

文章(レビュースニペットの一部)が肯定的であるか否定的であるか(文章に対してこのEQと呼ぶ)を計算するための粗アルゴリズムを思いつきました。ですから、5つの文に対して[-100,100]に基づいて文の評価をいくつか行います。レビュー

[0,5]基礎

(0、39.88) (1、73.07) (2、69.65) (3、51.43) (4、76.74)で評価されなければなりません私が苦労している選択肢は、レビュースニペットの総合評価を計算するためにどの方法を選択すべきかです。

Iは少し研究と二つのオプション

1を試した)50%パーセンタイル:だから0~5スケール上にマッピングする4.2判明70として上記データポイントの私はそれを得ました。結果は良いですが、悲しいことに、パーセンタイルは、ある文から別の文にスニペットのEQがどのように変化したかを捕捉しません(ソートされたデータに作用するので、変化が失われます)。 2)ラグランジュ多項式:ここでは69に近づきました。しかし、このアプローチの問題は、X範囲の中間(この場合は2)で計算することが多いためです。センテンスのEQ(ここでのエンドポイントは重要ではありませんが、ほとんどの場合ミッドレンジ値を与えます)。

スニペットでEQバリエーションをキャプチャし、全体的な感想を得るために使用できる適切な値を与える方法を選択する必要があります。

おそらくexcelのようなものがトレンドラインを描きます。

+1

これについて慎重な科学的研究を行い、すべての数学を試した人々によって書かれた多くの論文の一部を読むことを検討するとよいでしょう。 – bmargulies

+0

私はあなたが正しい道を歩んでいると思います。私はまた、第2のbmarguliesのアドバイスをしたいと思います。 – wprl

答えて

1

あなたが訓練を受けていない/教師なしセンチメント分析に興味がある場合は、約75%の精度を達成し、教師なしアプローチを使用しているピーター・ターニーで、この古典的な論文を読んで - http://nparc.cisti-icist.nrc-cnrc.gc.ca/npsi/ctrl?action=rtdoc&an=8914166

評判分析は楽しいです!

関連する問題