2017-02-17 8 views
2
from pyspark.ml.regression import RandomForestRegressionModel 
rf = RandomForestRegressor(labelCol="label",featuresCol="features", numTrees=5, maxDepth=10, seed=42) 
rf_model = rf.fit(train_df) 
rf_model_path = "./hdfsData/" + "rfr_model" 
rf_model.save(rf_model_path) 

のためには機能しませんモデルを保存しようとすると、これらの行が機能しました。しかし、モデルをパスに保存し直したいときは、次のエラーが表示されます。 Py4JJavaError:o1695.saveの呼び出し中にエラーが発生しました。 :java.io.IOException:パス./hdfsData/rfr_modelがすでに存在します。上書きするにはwrite.overwrite()。save(path)を使用してください。モデルは、ランダムフォレスト回帰pyspark ml

は、次に私が試した:

rf_model.write.overwrite().save(rf_model_path) 

をそれが与えた: はAttributeError: '関数' オブジェクトを何属性 '上書き' を持っていない

pyspark.mllibモジュールが上書き機能ではなく、pysparkを与えているようです。 mlモジュール。古いモデルを新しいモデルで上書きしたい場合、誰かがこれを解決する方法を知っていますか?ありがとう。

答えて

4

表示されるメッセージは、Javaエラーメッセージであり、Pythonのメッセージではありません。最初にwriteメソッドに電話する必要があります。

rf_model.write().overwrite().save(rf_model_path) 
関連する問題