モデルは、ランダムフォレスト回帰pyspark ml

from pyspark.ml.regression import RandomForestRegressionModel 
rf = RandomForestRegressor(labelCol="label",featuresCol="features", numTrees=5, maxDepth=10, seed=42) 
rf_model = rf.fit(train_df) 
rf_model_path = "./hdfsData/" + "rfr_model" 
rf_model.save(rf_model_path)

のためには機能しませんモデルを保存しようとすると、これらの行が機能しました。しかし、モデルをパスに保存し直したいときは、次のエラーが表示されます。 Py4JJavaError：o1695.saveの呼び出し中にエラーが発生しました。：java.io.IOException：パス./hdfsData/rfr_modelがすでに存在します。上書きするにはwrite.overwrite（）。save（path）を使用してください。モデルは、ランダムフォレスト回帰pyspark ml

は、次に私が試した：

rf_model.write.overwrite().save(rf_model_path)

をそれが与えた：はAttributeError： '関数' オブジェクトを何属性 '上書き' を持っていない

pyspark.mllibモジュールが上書き機能ではなく、pysparkを与えているようです。 mlモジュール。古いモデルを新しいモデルで上書きしたい場合、誰かがこれを解決する方法を知っていますか？ありがとう。

出典

2017-02-17 Veronica Wenqian Cheng

表示されるメッセージは、Javaエラーメッセージであり、Pythonのメッセージではありません。最初にwriteメソッドに電話する必要があります。

rf_model.write().overwrite().save(rf_model_path)

出典

2017-02-17 17:49:44 user6910411

モデルは、ランダムフォレスト回帰pyspark ml

答えて

関連する問題