2016-07-04 5 views
0

大きなデータフレームの列を、列の1つに数ナノ/ inf値でサブセット化しようとしています。Dato SFramesでnan/inf値をサブセット化する方法

私はこのような例を試しました。私は、カラム内の値のこれらのタイプを参照するにはどうすればよい

df = df[df['a'] == 'NaN'] 

それとも

df = df[df['a'] == 'Inf'] 

答えて

0

NaNの特殊な値です。それは何にも等しくなく、それ自体でさえありません。ここではNaNでフィルタする一つの方法です:

import math 
df = df[df['a'].apply(lambda x: math.isnan(x))] 

Infのが少し楽です:

df = df[df['a'] == float('inf')] 
0

はあなたが理解を使用することはできませんので、それは辞書だ知っていますが、繰り返すことができます:

subset = {} 

for d in df: 
    if d['a']=='Nan': 
     subset.update(d) 

print subset 
関連する問題