Pythonでバイナリダミー変数を作成するには、人の給与が平均給与水準を下回っている場合に0
の値をとり、それ以外の場合は1
に設定しますか?私は給料が上または下のときにそれを作る方法を理解していません。Pythonでダミー変数を作成するにはどうすればいいですか?
私はこの
df['Salary'] = (df['Salary'] > df['Salary'].median()) & (df['Salary'] < df['Salary'].median())
を試みたが、出力はありません。その前に
私はこの試みた:
df['Salary'].median()
df_Salary = pd.get_dummies(df['Salary'].median())
df_new = pd.concat([df, df_Salary], axis=1)
df_new
をそして、私はあなたがこの(あなたの表記と変数名を使用して)のような何かをしたいと思います。この
Gender Exp Salary 74000.0
0 Female 15 78200 1
1 Female 12 66400 NaN
2 Female 3 6000 NaN
...
おかげでたくさん!しかし、私があなたがエラーが発生したと言ったようにしてみました。 'ValueError:Seriesの真理値はあいまいです。 a.empty、a.bool()、a.item()、a.any()またはa.all() 'を使用します。 – jul094
それでは、それは 'df ['Salary']'と 'df ['Salary']の問題で、median()は問題です。それらが何であるかわからなければ、私はあなたにもっと具体的な助けを与えることはできませんが、df ['Salary'] 'は値の配列であり、PythonはTrueとFalsesの配列の妥当性を評価する方法を知らない。あなたはdf ['Salary'] = [0 salary
zephyr