2017-08-25 2 views
0

私はVaderTextBlobを使って、ニュースの見出しの感情を混在させた結果を分析しています。ここではいくつかの例です:ニュース見出しの感情分析の精度を向上させるにはどうすればよいですか?

Who wants to live in an artificially intelligent future? 
# Vader: {'compound': 0.4588, 'pos': 0.273, 'neu': 0.727, 'neg': 0.0} 
# TextBlob: Sentiment(polarity=0.2840909090909091, subjectivity=0.40625) 

The internet and social media provide huge opportunities for the coming generation, but there’s a dark side from which it must be protected. 
# Vader: {'compound': 0.743, 'pos': 0.278, 'neu': 0.722, 'neg': 0.0} 
# TextBlob: Sentiment(polarity=0.09444444444444448, subjectivity=0.45555555555555555) 

For three months I’ve lived without tech and now realise we need to question its ever-encroaching invasion – before we end up in bed with a sex robot. 
# Vader {'compound': 0.0, 'pos': 0.0, 'neu': 1.0, 'neg': 0.0} 
# TextBlob Sentiment(polarity=0.0, subjectivity=0.0) 

私は、最初の文は、いずれかの方法を読み取ることができると思いますが、次の二つは間違いなく彼らに負の要素を持っている:「そこにダークサイドだ」と「その絶えず侵入侵略」、私はVaderが負の0の痛みとTextBlobの両方を与えて極性が0以上になるのを見て驚いています。

この種のテキストは、感情分析アルゴリズムにとって根本的に難しいですか、それとも私が検討できる別のアプローチがありますか?

私が言及したライブラリの魅力は、私自身の分類データセットを作る必要がないということですが、私がよりよい結果を得る可能性があると思うかもしれません。

答えて

1

現在のツールのほとんどは、個々の単語の感情指標に作用するという点が基本的な違いです。例えば、テキストのどこかの「好き」や「優秀」を見つけると、肯定的な評価が得られます。あなたの例は、構文解析を最小限に抑えるために、フレーズの「理解」に依存しています。これはより詳細なプロセスであり、言語セマンティクスをより深く理解する必要があります。

片方向攻撃これは、索引付きフレーズ(単語として挿入)と単語でレキシコンを埋めることです。次に入力を前処理して、これらのフレーズをレキシコンで使用したことを示すものに変換します。たとえば、それらのフレーズをアンダースコアで結合します。「dark_side」は、負のインデックスを持つレキシコンにあります。

これはあなたに役立つ方向性を示してくれることを期待しています。

+0

返信いただきありがとうございます。私の質問は非常に曖昧です。私はVaderやTextBlobのレキシコンに用語を追加することを考えています...将来のGoogleのために、私は[このページ](http://sentiment.christopherpotts.net/lexicon/textscores_results/)がどのように異なるレキシコンテキストを扱います。 – user2950747

関連する問題