1

私はRandomForest.trainClassifierを使用しています。PySpark環境でランダムフォレストモデルにチェックポイントを追加する方法は?

サポートされるパラメータは次のとおり

  • 入力
  • numClasses
  • categoricalFeaturesInfo
  • numTrees
  • featureSubsetStrategy
  • 不純物
  • MAXDEPTH
  • maxBins
  • useNodeIdCachecheckpointDir、およびcheckpointIntervalなどの種子

しかし、余分なパラメータは、Scalaでご利用いただけます。

どのようにこれらの機能をPySparkに実装できますか?

答えて

2

pyspark.mllibはメンテナンスモードであり、開発期間が長くなります(これらの機能へのアクセスは追加されません)。あなたは、フル機能のAPI pyspark.mlを使用する場合は提供する:

関連する問題