私は、それらが陽性であるかどうかを判断する簡単な分類子を構築しています。これは私がtextblobを使って分類器を訓練する方法です。Textblobロジックヘルプ。 NaiveBayesClassifier
train = [
'i love your website', 'pos',
'i really like your site', 'pos',
'i dont like your website', 'neg',
'i dislike your site', 'neg
]
cl.NaiveBayesClassifier(train)
#im clasifying text from twitter using tweepy and it goes like this and
stored into the databse and using the django to save me doing all the hassle
of the backend
class StdOutListener(StreamListener)
def __init__(self)
self.raw_tweets = []
self.raw_teets.append(jsin.loads(data)
def on_data(self, data):
tweets = Htweets() # connection to the database
for x in self.raw_data:
tweets.tweet_text = x['text']
cl.classify(x['text'])
if classify(x['text]) == 'pos'
tweets.verdict = 'pos'
elif classify(x['text]) == 'neg':
tweets.verdict = 'neg'
else:
tweets.verdict = 'normal'
ロジックは非常に簡単に見えるが、私は1が正または負である分類器を訓練されたときには、データベースへのつぶやきと一緒に評決を保存しなければなりません。
しかし、これはケースではなく、私は多くの方法で論理を変更していて、まだ不十分です。問題は、ツイートが肯定的であるか否定的なものか、アルゴリズムがそれを認識しているかどうかです。
しかし、私はそれがそうでない場合、これをやっていない "正常な"を保存したい。分類器は正または負の2つのものしか認識しないと認識していますが、テキストがこのカテゴリに該当しないかどうかを確認する必要があります。
textblobを使用すると、これはどのように可能ですか?サンプルの代替ロジックと助言はすばらしいおかげです。
:コンセプトに反映するように設定最小限のトレーニングで 例は、実際の使用のためにあなたは大きなトレーニングセットを使用しなければなりません。 –
私はtextblobが3番目のクラスを受け入れると思っていません。それはあまりにも多くの値をアンパックエラー – johnobc
を受け入れると、2つのバイナリクラシファイアを作成することができます。ニュートラルは、「感情は表現されていない」または「バランスのとれた感情」を表しています。したがって、同じインスタンスがそれぞれのクラシファイアによって正と負の両方に分類される可能性があります(中立か4番目のカテゴリかどうかを判断するまで) –