-1
spark経由でcassandraに約200万レコードを読み込もうとしています。 Sparkには4人のエグゼキュータがあり、cassandraにはクラスタ内に4つのノードがあります。しかし、すべてのデータをcassandraに保存するには約20分かかります。誰もがこのことをもっと速くするために私を助けてくれますか?Spark Cassandra書き込みパフォーマンス
spark経由でcassandraに約200万レコードを読み込もうとしています。 Sparkには4人のエグゼキュータがあり、cassandraにはクラスタ内に4つのノードがあります。しかし、すべてのデータをcassandraに保存するには約20分かかります。誰もがこのことをもっと速くするために私を助けてくれますか?Spark Cassandra書き込みパフォーマンス
[OK]をので、私は同じ場所に配置しないでパフォーマンスのベンチマーク
のためにあなたの設定VM内カサンドラを実行
これはC *の4ノードでかなり遅いです。あなたは誰でもあなたを助けることができるだろうが、より多くの情報を指定する必要があります。 はどのように が... – RussS
は実際に私はレコードを読み取るためにデータフレームを使用していたノードとすべてのノードがあるuは聞かせてくださいすることができ7Gメモリストレージ – franyfpk
を持っているハードウェア、どんな を書くためにあなたはどのようなコードを使用しているレコードの を読んでいます私は一般に4ノードクラスタの書き込み速度が何であるか知っています。 – franyfpk