2011-12-19 13 views
0

私のコーパスの各ファイル内の特定の単語を数えたいと思います。 ここは自分のコードです。Python:コーパスのファイル内の特定の単語を数える

num= nltk.FreqDist(
     (target,fileid) 
     for fileid in reader.fileids() 
     for w in reader.words(fileid) 
     for target in ['have']) 

が、結果は次のように..です FreqDist: '2009.txt':141205、'20 .TXT ':43201、 '2.txt':41232、 '4.txt':40859、 '5.txt':40805、.....

すべての値を1行ずつ表示したいと思います。 「私はさらに

for results in num: 
     print results 

このコードを試してみました。しかし、それだけを示し43201

' ''、' 200 'を有する2009.txt' 141205

'20 .txtのような..

.txt '... no FreqDist番号が表示されます。

はまた、私は(もnltk.ConditionalFreqDistを試してみました)..それは.. が私を助けてください、なぜ私にはわからない... FOREVER

をとります。私はこの問題を世話するためにほぼ4-5時間を費やしました。

ありがとうございます。

答えて

2

私はNLTKに精通していませんが、dict-likeオブジェクトをトラバースしているようです。

これはどうですか?

for file, n in num.iteritems(): 
    print file, n 
+0

WOW it works !!!!大変ありがとうございました!ああ! – user976856

関連する問題