2016-12-16 4 views

答えて

1

sc.textFileに複数のファイルを追加することができます。マップ操作の内部でscを使用しないでください。 map関数は、異なるエグゼキュータに配布され、scはドライバに存在します。したがって、Nullpointer例外がスローされます。

a.txt contents:

a.txt:line1 
a.txt:line2 

b.txt contents:

b.txt:line1 
b.txt:line2 

スパークあなたは同じ操作で複数のファイルを追加することができます:

scala> sc.textFile("a.txt,b.txt").collect() 
res1: Array[String] = Array(a.txt:line1, a.txt:line2, b.txt:line1, b.txt:line2) 

は、このことができますし、スパークを楽しんでいる願っています!

+0

sc.textFile( "a.txt、b.txt")。この構文は、ファイルを順番に読み込みます。私はそれを並列に実行する必要があります –

+0

これは並列で実行されます。 Spark UIを開くと、2つのタスクが作成されていることがわかります。ファイルを追加すると、タスクの数が増えます。 –

+0

ありがとう、私はすぐに私がそれを働かせば更新する –

関連する問題