1000万行と1000個の変数を持つデータセットがあり、それらの変数に最も適合したいので、新しい行の値を見積もることができます。私はJamaのQR分解を使用しています(より良い提案は歓迎ですが、この質問はどの実装にも当てはまると思います)。残念ながら、それは時間がかかりすぎる。大量の変数を使用して大きなデータを効率的に最適化する方法
私には2つの選択肢があります。私は、例えば、1000のサイズ10,000のチャンクにデータを分割し、結果を平均化することができます。あるいは、例えば100行ごとに合計して、それらの結合された行をQR分解に張ることができます。
いずれかまたは両方の方法が数学的災害である可能性があります。私は誰かが正しい方向に私を向けることを望んでいます。
[Stats.SE]または[Math.SE]に適しています。 – tzaman
あなたが正しいです、私は閉じて数学で開きます。 – Eddie