text-analysis

1熱

2答えて

テキスト解析 - csvまたはxlsファイルにPythonプログラムの出力を書き込めません

こんにちは私はPython 2.xでNaive Bayesクラシファイアを使ってセンチメント解析をしようとしています。 txtファイルを使用してセンチメントを読み取り、サンプルのtxtファイルの感情に基づいて、正または負の出力を行います。出力を入力と同じ形式にします。私は1000の生のセンチメントを座らせて、それぞれの感情に対して肯定的または否定的な結果を出させたいというテキストファイルを持って

0熱

1答えて

列ごとのPOSタグのカウント

私はすべての品詞タグを1行に数えて合計します。今ではは、私は2つの出力に達し： 1）/ DTの質問を/ NNでした/ VBDは、/、どのような/ WPは/ VBPあなた/ PRP// VBをカットするために/ VBGを行く/ですか？。 "VB"、 "VBP"、 "PRP"、 "VBG"、 "TO"、 "VB"、 "VB"、 "VB"、 "VB"、 "VB"、 "VB"、。「）この特定の例では

1熱

2答えて

Pythonのすべての句読点マークを削除する

大きなプログラムの一部として、文字列のすべての句読点を削除する必要があります。私はこのような各マークのためserepatlyそれを書くとき、それが働いている： words = [word.replace(".", "") for word in words] しかし、私はループの中でそれを行うにしようとしています、それが機能していません。 line = "I was going to lea

0熱

1答えて

トークン化とdtMatrixとPythonでnltk

私はcsvファイルを2つの列 - 文とラベルがあります。私は、これらの文章のための文書用語行列を作りたいと思います。私はPythonで新しいですし、これまでのところ、私はこれを達することができる： import nltk import csv import numpy from nltk import sent_tokenize, word_tokenize, pos_tag reade

0熱

2答えて

入れ子リストから検索する

from nltk import word_tokenize list_1 = [a, b, c, d, e, f] list_2 = [[aa, bb, cc], [dd, ee], [ff], [gg, hh, ii, jj], [kk, ll], [mm, nn, oo]] text = 'The lazy aa moves along the hh' text_token = w

2熱

1答えて

データフレームからのPOSタグのカウント（列）行列の文（行）の作成

最初の行が品詞になる行列を作成します。最初の行に文が入ります。行列内の値は、文中のそのようなPOSの数を示す必要があります。だから私はこのようにPOSタグを作成しています： data = pd.read_csv(open('myfile.csv'),sep=';') target = data["label"] del data["label"] data.sentence = dat

1熱

1答えて

は、TMパッケージ

せずに自分の周波数を持つすべての可能な2つの単語の組み合わせを取得するにはどうすればこのようなテキストを持っています。 tmパッケージを使用することはできませんので、他の解決策がありがとうございます。組み合わせはdatを分割して、連続した2つのワードの組み合わせを抽出することにより生成することができ two words freq this is 2 is my 2 my farm 1

1熱

1答えて

雇用機会と一致するユーザープロフィール

私は現在、ユーザープロファイルに基づいてユーザーをジョブに接続できるソフトウェアを開発中です。私は仕事の説明にテキスト分析を実行し、そこから重要なキーワードを導き出しました。私は彼らのプロフィールからユーザー情報も収集しました。ジョブをユーザープロファイルに照合するのは難しい作業のようです。マッチメイキングに使用できる機械学習アルゴリズムはありますか？

0熱

1答えて

連結された単語のSolrインデックスの検索

私は2つの同様の使用例で苦労しています。ここに私のインデックスから文書例です： { "id":"E850AC8D844010AFA76203B390DD3135", "brand_txt_en":"Tom Ford", "catch_all":["Tom Ford", "FT 5163", "Tom Ford", "F

0熱

3答えて

テキストブロック内の[名前のリストからの任意の名前] + [特定の姓]をカウントするにはどうすればよいですか？

初めての投稿はこちら私は、私がテキスト分析に関して達成しようとしていることについて少し助けを見つけることができればと願っています。まず、私はこれをPythonでやっていますが、この機能は私が満足しているより大きな、そうでなければ健全なツールの一部になるので、Pythonにとどまりたいと思います。 NLKTとAnacondaもすべてセットアップされているので、これらのリソースを利用することも可能で