各行に名前を含むファイルがあり、各行に順番に番号を追加したい。例えばのために ファイルは、私はそれがこのスパーク・クラスタファイル内のすべての行に順番に番号を付ける
a,1
b,2
c,3
d,4
ご存知のように、私はこの
val lines = sc.textFile("data.txt")
val pair = lines.zipWithIndex().map{case(i,line) => i.toString +","+line}
pair.collect()
を達成するために、このコードを記述しましたが、スパークを実現したい、この
a
b
c
d
のようなものである場合異なるクラスタ間でタスクを分散します。だから私はこれがうまくいくかどうかはわかりません。どうすればいいですか?前もって感謝します。
「」最初の行で、「B」は2行目にあるファイルdata.txtを内のデータと行番号 –
の関係は何です。だから基本的に私は行番号を追加しています – gashu
'zipWithIndex'に何か問題がありますか?タスクがノード間で分散されている場合でも期待通りに動作するはずです。 – Mariusz