私は4人のエグゼキュータ(それぞれコアが1つ)でSpark-Kafka Streamingジョブを実行しています。カフカソーストピックには50のパーティションがありました。コアを増やさずにスパークエグゼキュータを増やす
ストリーミングJavaプログラムのforeachパーティションでは、私はOracleに接続して作業をしています。 Apache DBCP2が接続プールに使用されています。
スパークストリーミングプログラムがデータベースへの4つの接続を行っていますが、各エグゼキュータごとに1つの可能性があります。しかし、My Expectationは - 50個のパーティションがあるため、50個のスレッドが実行され、50個のデータベース接続が存在する必要があります。
コア数を増やすことなく並列度を上げる方法を教えてください。
これは、一度に最大4つのデータベース接続を確認できますか? – AKC