200KサンプルのトレーニングセットでMLlibランダムフォレスト(org.apache.spark.mllib.tree.RandomForest)を訓練するJavaアプリケーションがあります。私は、訓練中にCPUコアが1つしか使用されていないことに気付きました。ランダムフォレストがNデシジョンツリーのアンサンブルであることを考えれば、ツリーを並行して訓練し、すべての使用可能なコアを利用することができると考えるだろう。意思決定ツリーの並列訓練を可能にする構成オプションまたはAPIコール、または他に何かがありますか?Apache MLlibランダムフォレストの並列トレーニング
0
A
答えて
0
私はこれに対する答えを見つけました。この問題は、SparkConf.setMaster( "local")を使用してSparkの設定をどのようにセットアップするかで問題になりました。今、私たちは、はるかに高速ランニング、トレーニング、およびバージニア州のアマゾンのデータセンターはわずかである
を:私は、javadocのあたりとして、16個のスレッドを使用する(「[16]ローカル」)SparkConf.setMasterにこれを変更しますhotter :)
RTFMの典型的なケースですが、私の防衛では、このsetMaster()の使用は私にとってはちょっとハッキリです。より良い設計は、使用するローカルスレッド/コアの数を設定するための別個のメソッドを追加することです。
関連する問題
- 1. Apache Flinkの並列度
- 2. 列スパークMLlibに変換は
- 3. Apache Spark 2.0.0とmllibを使った分散型Word2Vecモデルトレーニング
- 4. ランダムフォレストは
- 5. ランダムフォレストのサブセット
- 6. スパークのランダムフォレスト
- 7. sklearnのランダムフォレスト
- 8. ランダムフォレストのパラレル化
- 9. Rリニアリグレッションテールのランダムフォレスト
- 10. OpenCV - ランダムフォレストの例
- 11. Spark MLlibリコメンダーエンジンのメソッド
- 12. Macbookのランダムフォレスト(R、キャレットを使用)の並列実行による小さなスピードのゲイン
- 13. JavaでApache Spark MLlibのLabeledPoint機能を構築する最善の方法
- 14. MLlib LogisticRegressionWithLBFGSエラーmodel.predict
- 15. ランダムフォレスト評価 - numpyの
- 16. sklearnランダムフォレストの精度
- 17. 加重ランダムフォレスト
- 18. OnevsrestClassifierとランダムフォレスト
- 19. MLlibで文字列値のデータフレームを使用してSPARKでモデルをトレーニングするにはどうすればよいですか?
- 20. ランダムフォレストためvarImp(キャレット)と重要性(ランダムフォレスト)との差
- 21. build.sbtブレーク火花mllib
- 22. spark-mllib retraining saved models
- 23. RDDをDStreamに変換してStreamingKMeansアルゴリズムをApache Sparkに適用するMlLib
- 24. apache spark 2.0.2でmllibを使用し、 "import org.apache.spark.mllibを解決できません"エラー
- 25. doSMPとforeachを使用した並列ランダムフォレストでは、メモリ使用量が大幅に増加します(Windows版)
- 26. Spark MLlibとSpark MLのPCA
- 27. Tensorflow TFlearn - ランダムフォレスト回帰
- 28. ランダムフォレストの層別サンプリング-Python
- 29. Rランダムフォレストの処理Posix値
- 30. プロットの凡例ランダムフォレストr
アクティブなスレッドが1つだけ表示された場合は、コードまたはコンフィグレーションで、org.apache.spark.mllib.tree.RandomForestではなく、 –
@LostInOverflow wikiの回答ですか? – eliasah
@eliasah Morten Jorgensenにこの質問を更新する時間を与えましょう。 –