text-analysis

    1

    2答えて

    こんにちは私はPython 2.xでNaive Bayesクラシファイアを使ってセンチメント解析をしようとしています。 txtファイルを使用してセンチメントを読み取り、サンプルのtxtファイルの感情に基づいて、正または負の出力を行います。 出力を入力と同じ形式にします。私は1000の生のセンチメントを座らせて、それぞれの感情に対して肯定的または否定的な結果を出させたいというテキストファイルを持って

    0

    1答えて

    私はすべての品詞タグを1行に数えて合計します。今では は、私は2つの出力に達し: 1)/ DTの質問を/ NNでした/ VBDは、/、どのような/ WPは/ VBPあなた/ PRP// VBをカットするために/ VBGを行く/ですか?。 "VB"、 "VBP"、 "PRP"、 "VBG"、 "TO"、 "VB"、 "VB"、 "VB"、 "VB"、 "VB"、 "VB"、。 「) この特定の例では

    1

    2答えて

    大きなプログラムの一部として、文字列のすべての句読点を削除する必要があります。私はこのような各マークのためserepatlyそれを書くとき、それが働いている : words = [word.replace(".", "") for word in words] しかし、私はループの中でそれを行うにしようとしています、それが機能していません。 line = "I was going to lea

    0

    1答えて

    私はcsvファイルを2つの列 - 文とラベルがあります。 私は、これらの文章のための文書用語行列を作りたいと思います。私はPythonで新しいですし、これまでのところ、私はこれを達することができる: import nltk import csv import numpy from nltk import sent_tokenize, word_tokenize, pos_tag reade

    0

    2答えて

    from nltk import word_tokenize list_1 = [a, b, c, d, e, f] list_2 = [[aa, bb, cc], [dd, ee], [ff], [gg, hh, ii, jj], [kk, ll], [mm, nn, oo]] text = 'The lazy aa moves along the hh' text_token = w

    2

    1答えて

    最初の行が品詞になる行列を作成します。最初の行に文が入ります。行列内の値は、文中のそのようなPOSの数を示す必要があります。 だから私はこのようにPOSタグを作成しています: data = pd.read_csv(open('myfile.csv'),sep=';') target = data["label"] del data["label"] data.sentence = dat

    1

    1答えて

    せずに自分の周波数を持つすべての可能な2つの単語の組み合わせを取得するにはどうすればこのようなテキストを持っています。 tmパッケージを使用することはできませんので、他の解決策がありがとうございます。組み合わせはdatを分割して、連続した2つのワードの組み合わせを抽出することにより生成することができ two words freq this is 2 is my 2 my farm 1

    1

    1答えて

    私は現在、ユーザープロファイルに基づいてユーザーをジョブに接続できるソフトウェアを開発中です。私は仕事の説明にテキスト分析を実行し、そこから重要なキーワードを導き出しました。私は彼らのプロフィールからユーザー情報も収集しました。ジョブをユーザープロファイルに照合するのは難しい作業のようです。マッチメイキングに使用できる機械学習アルゴリズムはありますか?

    0

    1答えて

    私は2つの同様の使用例で苦労しています。 ここに私のインデックスから文書例です: { "id":"E850AC8D844010AFA76203B390DD3135", "brand_txt_en":"Tom Ford", "catch_all":["Tom Ford", "FT 5163", "Tom Ford", "F

    0

    3答えて

    初めての投稿はこちら私は、私がテキスト分析に関して達成しようとしていることについて少し助けを見つけることができればと願っています。 まず、私はこれをPythonでやっていますが、この機能は私が満足しているより大きな、そうでなければ健全なツールの一部になるので、Pythonにとどまりたいと思います。 NLKTとAnacondaもすべてセットアップされているので、これらのリソースを利用することも可能で