私はFlaskで構築されたPythonアプリケーションを使用しています。これは、多くのデータレコード(10k-250k +レコードから一度に)のインポートを可能にします。今のところは、このような時に1つのレコードを挿入することにより、カサンドラデータベースに挿入します。Pythonを使用して大量のデータをCassandraに効率的に挿入する方法は?
for transaction in transactions:
self.transaction_table.insert_record(transaction)
このプロセスは非常に遅いです。この一括データをより効率的に挿入するために使用できるベストプラクティスのアプローチはありますか?
明らかなことは、Cassandraがサポートする一括照会クエリを試すことです。また、クエリを作成して再利用すると、実際には一括して挿入するほうが早いかもしれません。しかし、250kレコードを高速にインポートすることは期待しないでください。仕事を労働者に委任すべきでしょうか? – freakish