2016-12-20 3 views
0

目標は、 '%Renewable'列の値が中央値以上の場合は1でdfから新しい列を作成し、値は中央値を下回ります。Python Pandas:しきい値に従って数値変数からダミー変数を生成

df = pd.DataFrame({'% Renewable': [np.NaN, 12, np.NaN, 11, 17, 62, 18, 15, np.NaN, 2, np.NaN, np.NaN, 6, np.NaN, 70]}, 
index=['China', 'United States', 'Japan', 'United Kingdom', 'Russian Federation', 'Canada', 'Germany', 'India', 'France', 'South Korea', 'Italy', 'Spain', 'Iran', 'Australia', 'Brazil']) 

私は中央値だ:

median = df['% Renewable'].median() 

しかし、今何を? get_dummies関数を使うべきですか?またはおそらくカット?

答えて

1

これはトリックを行う必要があります。

df['new_column'] = df['% Renewable'] >= median 
+0

うわー!それは非常に簡単です。ありがとう;) –

+0

これはブール値の列を返します。結果を乗算してintを作る必要があります。 –

関連する問題