Google Cloud Spanner recommendsは、主キーの単調増加整数を使用しています。これは、ホットスポットを作成するように、トップレベルのテーブルには理にかなっています。しかし、インターリーブされたテーブルはどうですか?彼らはとにかく同じノードに格納されます。それらはソートされた順序で保持されるので、UUIDやその他のランダムIDを使用すると、特にソートされた順序で取得される場
私は、どのようにパーティショニングするかによって2つの方法のいずれかでCDHクラスターを爆発させます。この仕事の目的は、1〜210,094,780,875組の4つの整数を生成することです。ジョブはspark-submitを介して送信され、masterはYARNに設定されます。次のコードは、この質問には密接なチョキさ: // build rdd and let cluster build up th