0
daskからdask.array
を作成する最も効率的な方法は何ですか? このシリーズは、500万のリスト300から構成されています。 現在、500個のパーティションに分割されています。 は、現在、私がしようとしています:dask.arrayをdaskから効率的に作成します。リストのシリーズ
pt = [delayed(np.array)(y)
for y in
[delayed(list)(x)
for x in series.to_delayed()]]
da = delayed(dask.array.concatenate)(pt, axis=1)
da = dask.array.from_delayed(da, (vec.size.compute(), 300), dtype=float)
をアイデアはnupy配列に各パーティションを変換し、dask.array
に一緒に それらをステッチすることです。 このコードは永遠に実行されています。 十分なRAMがある限り、このデータからすぐにこのデータからnumpyアレイを構築することができます。