2012-04-19 18 views
28

感情分析に焦点を当てたRパッケージはありますか?私は、ユーザーがWebツールを使用した経験についてのコメントを書くことができる小さな調査をしています。私は数値的なランク付けをお願いし、コメントを入れることもできます。感情分析R

私は、コメントの正当性や否定性を評価する最良の方法が何であるか疑問に思っています。私はR.

に感情分析にコードをやった仕事は決して、であるR.

+2

ここでJeffery Breenの作品をチェックしてください:http://www.slideshare。net/jeffreybreen/r-by-example-mining-twitter- – mweylandt

+0

@myylandtの場合、Jeffrey仲間として自分自身は「r-e-y」です。しかし、それは単純で、きちんとした方法のように思えます。 –

+0

Jeffrey Breenは、とりわけ、私のようなテキストマイニングの初心者にとって優れたガイドを提供します。 Parasさんが共有するリンクを訪問するように促します。 そのリンクから、件名に特化したBing Liu教授のウェブサイト[] [Opinion Mining、Sentiment Analysis、Opinion Spam Detection] [1] [1]:http://www.cs.uicにアクセスできます。 edu /〜liub/FBS/sentiment-analysis.htmlよろしくね、ロッド – rodobastias

答えて

26

そしてthis packageがあります:

sentiment: Tools for Sentiment Analysis

感情はポジティブ/ネガティブ感情分類のためのベイジアン分類を含む評判分析のためのツールとのRパッケージです。

アップデート2012年12月14日:それはarchiveに削除されました...

アップデート2013年3月15日:qdapパッケージには、ジェフリー・ブリーンの仕事

+1

このパッケージはR 3.3で利用できません。 –

18

Here'sを使用して、ユーザーが提供する数値のランキングにそれを比較できるようにしたいと思い、磨かれているか、または丁寧にパッケージ化されていますが、posted it on Githubの基本的なドキュメントがあります。私はViralHeat sentiment APIを使用しました。これはJSONを返すだけなので、感情分析を行う実際の関数はかなり簡単です(コードhereを参照)。

ご使用に問題がある場合は、私に連絡してください。また、ViralHeatを使用するには、その前にAPIキーを登録する必要があります。クォータがあまりにも制限されているとわかっている場合は、私はそれらに連絡していました。APIを使いながら数ヶ月間クエリを提供してくれました。

5

に基づいて、polarity機能を持っているステップバイステップガイドのためには、 1)ウィルスヒートAPI 2)ジェフリーブリーンのアプローチ3)センチメントパッケージを使用して、このリンクをチェックしてください:https://sites.google.com/site/miningtwitter/questions/sentiment

0

あなたはまだ感情パッケージを使用することができます。以下のスクリプトに従ってインストールしてください。

R 3.xが必要な場合があります。

require(devtools) 
install_url("http://cran.r-project.org/src/contrib/Archive/sentiment/sentiment_0.2.tar.gz") 
require(sentiment) 
ls("package:sentiment") 
+1

setimentパッケージはrstemパッケージに依存しています。これはR 3.0.2でもサポートされていません –

+0

はい、サイト:https://sites.google.com/site/miningtwitter/home警告:twitter APIの変更により、 このGoogleサイトのコードはサポートされなくなりました... 内容 – Matt

2

私は再構成し、凝集感情分析パッケージhereを提供しようとしました。 SentRには単語のステミングと前処理が含まれており、デフォルトの集約関数であるViralHeat APIや、より高度なNaive Bayesメソッドにアクセスできます。

インストールは比較的簡単です:

install.packages('devtools') 
require('devtools') 
install_github('mananshah99/sentR') 
require('sentR') 

、簡単な分類の例:以下の出力を提供

# Create small vectors for happy and sad words (useful in aggregate(...) function) 
positive <- c('happy', 'well-off', 'good', 'happiness') 
negative <- c('sad', 'bad', 'miserable', 'terrible') 

# Words to test sentiment 
test <- c('I am a very happy person.', 'I am a very sad person', 
'I’ve always understood happiness to be appreciation. There is no greater happiness than appreciation for what one has- both physically and in the way of relationships and ideologies. The unhappy seek that which they do not have and can not fully appreciate the things around them. I don’t expect much from life. I don’t need a high paying job, a big house or fancy cars. I simply wish to be able to live my life appreciating everything around me. 
') 

# 1. Simple Summation 
out <- classify.aggregate(test, positive, negative) 
out 

# 2. Naive Bayes 
out <- classify.naivebayes(test) 
out 

score 
1  1 
2 -1 
3  2 

    POS    NEG     POS/NEG    SENT  
[1,] "9.47547003995745" "0.445453222112551" "21.2715265477714" "positive" 
[2,] "1.03127774142571" "9.47547003995745" "0.108836578774127" "negative" 
[3,] "67.1985217685598" "35.1792261323723" "1.9101762362738" "positive" 

貢献すること自由に感じてください:)を希望それは助ける!

+0

こんにちはManan、私はあなたの解決策が好きです。私は試してみて、もっと実験します。他の人が使用するために公開したプロジェクトのようなユースケースはありますか? Thx – seakyourpeak

+0

@seakyourpeakコメントありがとう!私は、Twitterの感情抽出リポジトリのサンプル(github.com/manans99)を扱っていますが、当分の間、各関数のドキュメントにはサンプルの使用例が含まれています。さらなるご質問がある場合は、PMまでお気軽にお問い合わせください。 – manan

+0

@manan私は現在、Facebookの投稿データに取り組んでいます。私は投稿を抽出してワードクラウドを構築することができました。私はあなたのリストが否定的で肯定的なものとして最も一般的な言葉を使うのが良い考えだと思っているのだろうかと思っていました。例:私のワードクラウドの中で私が好き、悪い、偉大な、愛、幸せ、悲しい、飛行機、車、交通手段を見つけたら....私は好きな、好きな、愛、肯定的な分類子として幸せ、 ? –

関連する問題