私はsvmライトファイルをスパース行列のストレージとして使用しています。xgboostのDmatrixがsvmライトテキストファイルを高速でロードする理由
試験は570601944のエントリ
from sklearn.datasets import load_svmlight_file
x_train, y_train = load_svmlight_file(train_file)
は7minutesを使用するよりもずっと速く
import xgboost as xgb
dtrain = xgb.DMatrix(train_file)
使用21secondsと31700108x54070マトリックスのためすることを示しています。
コードをハッキングする前に、誰でも私にこれに答えるのを助けることができますか?
load_svmlight_file関数を強化するための提案はありますか?
ありがとうございました!