-1
2PBのデータを使用して機械学習モデルを訓練する必要があります。私のマシンでは使えないモデルを作るために何をすべきですか?私はジュピターノートを使用しています。 Jupyterはこのデータのためにスケールできますか?もし私が何をすればいいのですか?2PBのデータを持つBuidlingマシン学習モデル
2PBのデータを使用して機械学習モデルを訓練する必要があります。私のマシンでは使えないモデルを作るために何をすべきですか?私はジュピターノートを使用しています。 Jupyterはこのデータのためにスケールできますか?もし私が何をすればいいのですか?2PBのデータを持つBuidlingマシン学習モデル
1つの方法は、たとえばApache Sparkを使用して分散学習を行うことです。ここにコースがあります。 (https://www.edx.org/course/distributed-machine-learning-apache-uc-berkeleyx-cs120x)
ちょうど好奇心から..これはどのような種類のデータなのか分かりますか? –
あなたが疑問を提起する方法から、データを大きくサブサンプリングすることから始めることをお勧めします。 – geompalik
あまりにも広い.. – sascha