私のコーパスの各ファイル内の特定の単語を数えたいと思います。 ここは自分のコードです。Python:コーパスのファイル内の特定の単語を数える
num= nltk.FreqDist(
(target,fileid)
for fileid in reader.fileids()
for w in reader.words(fileid)
for target in ['have'])
が、結果は次のように..です FreqDist: '2009.txt':141205、'20 .TXT ':43201、 '2.txt':41232、 '4.txt':40859、 '5.txt':40805、.....
すべての値を1行ずつ表示したいと思います。 「私はさらに
for results in num:
print results
このコードを試してみました。しかし、それだけを示し43201
' ''、' 200 'を有する2009.txt' 141205
'20 .txtのような..
.txt '... no FreqDist番号が表示されます。
はまた、私は(もnltk.ConditionalFreqDistを試してみました)..それは.. が私を助けてください、なぜ私にはわからない... FOREVER
をとります。私はこの問題を世話するためにほぼ4-5時間を費やしました。
ありがとうございます。
WOW it works !!!!大変ありがとうございました!ああ! – user976856