Google CloudflowインスタンスにGoogle Dataflow経由でデータを読み込みたいとします。 CloudSQLのためのシンクが内蔵されていないと思うので、私はorg.apache.beam.sdk.io.jdbc.JdbcIOを使うことにしました。 しかし、CloudSQLへのスループットは非常に低い(約6レコード/秒)。Google DataflowでJdbcIOを使用するとスループットが非常に低い
CloudSQLの仕様があまりにも貧弱だと思うが、アップグレードしても改善されていない。
Proposing dynamic split of work unit my-project;2017-06-27_02_58_19-14077185378147382467;6703504927792172410 at
{"fractionConsumed":0.9669782519340515}
Rejecting split request because custom reader returned null residual source.
は何が起こっています:データフローのログで
、以下のように多くのログがそこにいますか?そして、どのようにパフォーマンスを向上させることができますか?