2016-06-21 9 views
0

こんにちは私はdfとしてインポートされたデータセット上でランダムなフォレストを開始しました。今私は、結果(0-1予測)と予測確率(2次元配列)の両方をエクスポートし、それらを私のデータセットdfにマッチさせたいと思います。それは可能ですか?今まで私はcsvに別の方法でエクスポートする方法を考え出しました。そして、はい、私はパンダの専門家ではありません。何かヒント?Pythonモデルの結果をエクスポートする

# Import the `RandomForestClassifier` 
from sklearn.ensemble import RandomForestClassifier 


# Create the target and features numpy arrays: 

target = df["target"].values 


features =df[["var1", 
"var2","var3","var4","var5"]] 


features_forest = features 

# Building and fitting my_forest 
forest = RandomForestClassifier(max_depth = 10, min_samples_split=2, n_estimators = 200, random_state = 1) 
my_forest = forest.fit(features_forest, target) 

# Print the score of the fitted random forest 
print(my_forest.score(features_forest, target)) 


print(my_forest.feature_importances_) 


results = my_forest.predict(features) 

print(results) 

predicted_probs = forest.predict_proba(features) 

#predicted_probs = my_forest.predict_proba(features) 

print(predicted_probs) 

id_test = df['ID_CONTACT'] 


pd.DataFrame({"id": id_test, "relevance": results, "probs": predicted_probs }).to_csv('C:\Users\me\Desktop\python\data\submission.csv',index=False) 


pd.DataFrame(predicted_probs).to_csv('C:\Users\me\Desktop\python\data\submission_2.csv',index=False) 
+0

することができるはず - 'DataFrame'sを作成し、' to_csv'を使用しています。 – jezrael

+0

ありがとうございます。しかし、私が言いたいのは、これらの結果をオリジナルのdfに直接追加できれば、本当に.csvは必要ないということです – progster

答えて

1

あなたはそれは素敵なアプローチである第一印象について

df['results] = results 
df = pd.concat([df, pd.DataFrame(predicted_probs, columns=['Col_1', 'Col_2'])], axis=1) 
関連する問題