単語と出現回数を印刷しようとしています。そのような:リストジェネレータを使用して単語とその発生数のカップルを行う方法は?
a aba aaa
dd ddd dd
私のうちSHOLDが含まれています:
[[a,1],[dd,2],[aba ,1],[ddd,1],[aaa,1]]
が、それは次のとおりです。
:ここ[[a,1],[dd,2],[aba ,1],[dd,2],[ddd,1],[aaa,1]]
は完全なコードである1.TXTで
import re
def get_words_from_string(s):
return (re.findall(re.compile('\w+'), s.lower()))
def merge(seq):
merged = []
for s in seq:
for x in s:
merged.append(x)
return merged
fp1 = open('1.txt' , 'r');
set1 = set(line.strip() for line in fp1);
l1 =[]
for x in set1:
x.split()
x = get_words_from_string(x)
l1.append(x)
l1= merge(l1);
out = []
out = [[word , l1.count(word)] for word in l1 if (1 > out.count(word))]
単語が最初のオカレンスの外に出ていない場合、問題が発生します。 リストに項目が含まれているかどうかを確認する安全な方法はありますか?
それが機能しないと思われる理由を理解してから、結果を含めるように質問を修正してください。 –
このコードを実行すると何が起こりますか? – Blender