2016-07-01 4 views
1

私は最近sparkの使用を開始しました。ファイルを処理してpostgreデータベースの出力を保存する必要があるユースケースがあります。私はファイルを読み込んで処理することができます。処理されたデータをdbに保存することはできません。私はどのように出力をdbに保存することができます示唆してくださいいくつかの1つ?rdbmsデータベースにスパーク出力を保存する方法は?

おかげで,,,,

答えて

2

データベースはすべての労働者のノードからアクセス可能であるならば、あなたは出力を保存するためにforeachPartitionを使用することができます。擬似コード:

rdd.foreachPartition { records => 
    // Connect to the database 
    records.foreach { r => 
    // Loop over records and save 
    } 
    // Close the connection to the db 
} 
+0

ありがとうございます。 – Maddy

関連する問題