from pyspark.ml.regression import RandomForestRegressionModel
rf = RandomForestRegressor(labelCol="label",featuresCol="features", numTrees=5, maxDepth=10, seed=42)
rf_model = rf.fit(train_df)
rf_model_path = "./hdfsData/" + "rfr_model"
rf_model.save(rf_model_path)
のためには機能しませんモデルを保存しようとすると、これらの行が機能しました。しかし、モデルをパスに保存し直したいときは、次のエラーが表示されます。 Py4JJavaError:o1695.saveの呼び出し中にエラーが発生しました。 :java.io.IOException:パス./hdfsData/rfr_modelがすでに存在します。上書きするにはwrite.overwrite()。save(path)を使用してください。モデルは、ランダムフォレスト回帰pyspark ml
は、次に私が試した:
rf_model.write.overwrite().save(rf_model_path)
をそれが与えた: はAttributeError: '関数' オブジェクトを何属性 '上書き' を持っていない
pyspark.mllibモジュールが上書き機能ではなく、pysparkを与えているようです。 mlモジュール。古いモデルを新しいモデルで上書きしたい場合、誰かがこれを解決する方法を知っていますか?ありがとう。