膨大な量の異なる3次元データを持つアプリケーションを作成しています。 3次元データは相対的に小さく(100 x 100 x 1000のように)、おそらく数百万のこれらのオブジェクトです。今私は誰もが風でそのようなデータを扱う経験を持っているのだろうかと思います。ベクトルの行列のようなネストされたデータ構造を使用することはできますが、インデックス付け(x、y、z)によってその構造の単一値を扱うことが重要です。 Point3d(x、y、z)のような独自の構造を定義する方が良いですか?しかし、x、y、zはベクトル自体であるか、DenseMatrixのような定義済みのブリーズクラスを使用します。私の質問は、パフォーマンスがこれらの選択肢によってどのように影響を受けるかです。オブジェクトが良くApache Spark - 3次元データ用に最適なデータ構造は何ですか?
私の経験で、あなたの回答をありがとう ロルフ・ディーター
達成したいことはありますか?簡単なインデックス作成のために、あなたが望むものではないかもしれません。たとえapache-sparcがあなたの要求に応じて、数百万のオブジェクトに対して過度のものとなるかもしれません... – TilmannZ