これは初心者の質問かもしれませんが、これを行う方法を理解するのに数時間を費やしました。 Okie、私は150の変数とターゲットを持つデータフレームを持っています。以下のようにサンプル:Pythonを使用してデータフレームに新しい計算カラムを追加する方法
train
Out[1]:
var1 var2 target
0 A C 10.5
1 A D 13.5
2 B D 2.5
ターゲットの平均を持つ追加された列で新しいデータフレームを作成したいと思います。 var1_newのrow1は、var1 == A、つまり12((10.5 + 13.5)/ 2)の平均を持つ必要があります。
私はこれをpythonで把握することができません。 ご協力いただければ幸いです。
train_new
Out[2]:
var1 var2 target var1_new var2_new
0 A C 10.5 12 10.5
1 A D 13.5 12 8
2 B D 2.5 2.5 8
コードスニペット – user2693928
@Nim Jを提供してください、あなたは何をしたいの詳細は明らかにしてください。 2列目の手段を3列目にしますか?あなたは(12.5 + 13.5)/ 2の例を挙げていますが、あなたのデータに12.5という数字はありません。 var1とvar2は数値で、それらが平均から欲しい列か、ターゲットから2つの新しい列を作成するときの平均値ですか? – ivan7707
謝罪@ ivan7707。私はそれを訂正した。新しい変数は目標値の平均値を持つ必要があります。 Var1とVar2はカテゴリです。 –