単語の頻度を数えるためにプロジェクトをスピードアップしようとしています。私は360以上のテキストファイルを持っており、単語の総数と単語の別のリストから各単語が出現する回数を取得する必要があります。私は単一のテキストファイルでこれを行う方法を知っています。Python - テキストファイル内の単語リストの単語頻度を見つける
>>> import nltk
>>> import os
>>> os.chdir("C:\Users\Cameron\Desktop\PDF-to-txt")
>>> filename="1976.03.txt"
>>> textfile=open(filename,"r")
>>> inputString=textfile.read()
>>> word_list=re.split('\s+',file(filename).read().lower())
>>> print 'Words in text:', len(word_list)
#spits out number of words in the textfile
>>> word_list.count('inflation')
#spits out number of times 'inflation' occurs in the textfile
>>>word_list.count('jobs')
>>>word_list.count('output')
「インフレ」、「ジョブ」、「出力」個人の頻度を取得するのはあまりにも面倒です。これらの単語をリストに入れて、リスト内のすべての単語の頻度を同時に見つけることはできますか?基本的にthisとPython。この代わりに::
例は
>>> word_list.count('inflation')
3
>>> word_list.count('jobs')
5
>>> word_list.count('output')
1
私はこれをしたい(私はこれが実際のコードではありません知っている、これは私が上で助けを求めているものです):
>>> list1='inflation', 'jobs', 'output'
>>>word_list.count(list1)
'inflation', 'jobs', 'output'
3, 5, 1
私の言葉のリストは10-20語を持っているので、数を得るためにはPythonを単語のリストに向ける必要があります。出力は、行
例として、列や周波数などの単語でExcelスプレッドシートに貼り付ける+コピーすることができた場合にもいいだろう。
inflation, jobs, output
3, 5, 1
そして最後に、誰もがこれを自動化することができますすべてのテキストファイルは?私はちょうどそのフォルダの方にPythonを指していると私は360 +の各テキストファイルの新しいリストから上記の言葉を数えることができます。十分に簡単だと思われますが、私はちょっと立ち往生しています。どんな助け?
このような出力は幻想のようになります。 FILENAME1 インフレ、雇用、出力 3、5、1
Filename2
inflation, jobs, output
7, 2, 4
Filename3
inflation, jobs, output
9, 3, 5
ありがとう!
私は今、数時間カウンターをだましてきた、そしてまだそれを得ることができません。 – CoS
上記の例は、私のテキストファイル内のユニークな単語すべて(私の場合は3000以上のユニークな単語)を集計します。私は、テキストファイルに10〜20個の特定の単語の集計が必要です。 – CoS
私はそれがリストのために働くと思う、大変ありがとう!私は時間カウンターのページでhaha – CoS