2016-07-13 5 views

答えて

0

DirectStreamメソッドでは、スパークプロセスのカフカデータを並列に処理します。すなわち、各エグゼキュータコアは、対応するカフカトピックおよびパーティションからデータを引き出す。

それぞれに3つのパーティションを持つ2つのトピックがあるとします。そして、2つのコアを持つそれぞれ3人のエグゼクティブがいます。

これらの2つのトピックから読んでいる場合、sparkは6つのタスク(= 6つのコア)で1つのジョブを起動し、各タスクは対応するトピック+パーティションからデータを取得します。これらのタスクはすべて並行して実行されます。

希望すると便利です。

+0

ありがとうございました – saeed

関連する問題