2017-12-28 14 views
-1

欠落しているデータをcsvから作成したデータフレームがありますか?シンボル。どのくらいの行があるかをチェックしたいですか?発生回数とともに発生する。 これまでのところ、私はこれを作ったが、それはすべての行の数を示しているだけでなく、発生する。データフレームの何行に疑問符記号が含まれています

print(sum([True for idx,row in df.iterrows() if 
any(row.str.contains('[?]'))])) 

答えて

0

あなたは、すべての列が文字列であると仮定すると、+ str.containsapplyを使用することができます。

c = np.sum(df.apply(lambda x: x.str.contains('\?')).values) 

あなたは、文字列のみの列を選択select_dtypes使用する必要がある場合 - その中?を含む行のを見つけるために、また

i = df.select_dtypes(exclude=['number']).apply(lambda x: x.str.contains('\?')) 
c = np.sum(i.values) 

を、

c = df.apply(lambda x: x.str.contains('\?')).any(axis=1).sum() 

を使用

デモ -

df 

     A  B 
0 aaa ?xyz 
1 bbb que!? 
2  ? ddd 
3 foo? fff 
df.apply(lambda x: x.str.contains('\?')).any(1).sum() 
4 
+0

しかし、これはすべての疑問符ない疑問符と行数の番号が表示されます。 2つの疑問符が付いた行がある場合は2を追加します。 – kurbielp

+0

@ kurbielpあなたはそのような問題を説明しました。あなたの修正された問題については、 'df.apply(lambda x:x.str.contains( '\?'))を使用してください。any(1).sum()' –

関連する問題