0
私は非常に長いSparkジョブをマップ操作のみで構成しています。 異なる数のパーティション、エグゼキュータ、最大のメモリ(16G + 2Gのオーバーヘッド)で数回起動しようとしました。 私の最後の試行ではメモリオーバーヘッドのためにいくつかのエグゼキュータが殺されましたが、出力は生成されましたが、私のデータフレームのすべての行をチェックすることはできませんでした。 また、出力ディレクトリに_SUCCESSファイルがあります。スパーク・コンテナーが失敗しました。私が得た結果を信頼してもらえますか?
私は出力を信頼するでしょうか?
@Sandeepさん、ありがとうございます。このケースをカバーする文書があるかどうか知っていますか? – Alberto