"data.csv"というCSVファイルが1つあります。それは私が時間Tsklearnとpandasを使用して1つのCSVファイルに複数回回帰
Iの7つの異なるインスタンスに対応する私のファイル内の7つのデータエントリを持つ(A、B、C)の各タプルについて5列T、A、B、C及びD
を有しますscikit-learn
ライブラリを使用して、次のインスタンスのデータDを予測するために、時系列Tにわたって各タプル(A、B、C)に対して線形回帰を実行したい。データを選択して回帰する最も効率的な方法は何ですか?
CSVファイルのサイズは3.2GBですが、私は4GBのRAMしか持っていません。私は一度に完全なファイルを読み込もうとしましたが、私のマシンは対処できません:P
私はファイルを処理するのにpandas
、回帰はsklearn
です。回帰モデルの場合
http://scikit-learn.org/stable/modules/scaling_strategies.html – blacksite