xgboost

    3

    2答えて

    非常に大きなCSVファイルをPandasで使い始め、最終的にはXGBoostで機械学習ができるようになりました。 私のデータのチャンクを管理するために、mySQLまたはいくつかのsqlliteフレームワークを使用することに間違いがあります。私の問題は、後でマシンの学習面で、そしてモデルを訓練するために一度にチャンクで読み込むことです。 私の他の考えは、パンダをオフにして構築されたDaskを使うこと

    2

    1答えて

    私のモデルの精度を高めるためにXGBoostを使用しようとしています。私はxgboostを初めて使っていますが、私はこのアルゴリズムをさまざまな情報源から理解しようとしています。私は、次のコードでのparamリストを設定している: param = list("objective"="binary:logistic", "eval_metric"="logloss", "eta"=1, "max.d

    1

    1答えて

    Python for WindowsにXGBoostパッケージをインストールする予定です。ここに記載されている指示(How to install xgboost package in python (windows platform)?)に従って、私は最後のステップ(python setup.py install)で問題に直面しています。 $ python setup.py install --u

    2

    1答えて

    私はsklearnインターフェイスを使用してXGBRegressorモデルを訓練しました。次のように関連するコードは次のとおりです。 def xgb_regressor_wrapper(X_train, y_train): xgb_regressor = XGBRegressor(objective='reg:linear', n_estimators=1000, learning_ra

    2

    1答えて

    私はバイナリ分類の問題(誤検出のコストが高い)の精度を最大限にしようとしています。データセットも実際に不均衡です。偽陽性に対抗するために、体重列を2回目に使用してDRFまたはXGBOOSTモデルを2回実行するのは理にかなっていますか? これらのH2Oアルゴリズムには、この潜在的な方法の他に、(ログ損失ではなく)精度を最大化するための他の方法がありますか?私はアンサンブルを使うつもりです(精度を上げ

    0

    1答えて

    PythonでXgboost.sklearn.XGBclassifierを使用すると、モデルのトレーニング中に選択できるツリーの数は「n_estimators」というパラメータがありますが、xgboostに関連付けられているパラメータは見つかりませんでした。 train()、xgboost.train()にツリーの数を追加する方法はありますか?

    0

    1答えて

    AWS S3から保存されたScala XGBoostモデルの読み込みに問題があります。以下は私のコードです。問題は、AWS S3ではScala XGBoostモデルを保存できますが、AWS S3からモデルをロードできないということです。 val trainingData = sqlContext.read.parquet(path1) val testData = sqlContext.rea

    0

    1答えて

    私はdatabricks上xgboost例に沿って従うことをしようとしていますがhere すべては、私が実際のトレーニング部分に到達するまで正常に動作するよう見つからポイント私はエラーを取得します。スタックトレースはかなり短いですので、私はここに貼り付けます: java.lang.NoSuchMethodError: scala.Predef$.ArrowAssoc(Ljava/lang/Obje

    0

    1答えて

    特定の時点で切断される予定のケーブル加入者数を予測する予測システムを構築しています。私はPythonを使用していて、私が試したさまざまなモデルから、XGBoostが最高の性能を発揮します。 私は、実際のものが使い果たされ、私の遅れで予測された数字を使い始めるなど、動いている窓の仕方で動作する自己参照システムを用意しています。 予測システムを構築するために、以前の800日間のラグ(1日の切断)、移動

    0

    1答えて

    xgb.train関数を使ってRでxgboostを実行します。 xgb.train機能を使用するには、xgb.DMatrix機能を使用して入力データを変換する必要があることを知っています。 しかし、私は私のデータSETMにこの機能を使用する場合、私は、エラーメッセージました: Error in xgb.DMatrix(data = as.matrix(train)) : [09:01:0