目標はセンチメント分類です。手順は、3 xlsxファイルを開いて読み込み、gensim.doc2vecメソッドで処理し、SGDClassificatorで分類することです。 this code on doc2vecを繰り返してみてください。 Pythonの2.7 with open('C:/doc2v/trainpos.xlsx','r') as infile:
pos_reviews
つぶやきを使用してDoc2Vecモデルを準備しています。各つぶやきの単語列を別の文書としてみなされ、「SENT_1」と表示され、SENT_2" SENT_2を 『など
taggeddocs = []
for index,i in enumerate(cleaned_tweets):
if len(i) > 2: # Non empty tweets
sentence =
私はgensimからdoc2vecを実装しようとしていますが、いくつかのエラーがあり、Web上で十分なドキュメンテーションやヘルプがありません。ここ は私の作業のコードの一部です: from gensim.models import Doc2Vec
from gensim.models.doc2vec import LabeledSentence
class LabeledLineSente
Gensimのdoc2vecメソッドを使用して、1行に1文を含むテキストファイルを読み込んでいます。私のファイルを辞書に読み込みます。ここで、キーはトークン化された用語リストで、値は文番号です。ここ が私のコードです:新しいファイルの from gensim import utils
from gensim.models.doc2vec import LabeledSentence,Ta