0
内の各ノード上でコードを実行し、このような何か:は、私がPySparkを使用して、各ノード上で何かを実行したいPySpark
rdd = sqlContext.read.parquet("...").rdd
def f (i):
import sys, socket
return [(socket.gethostname(),sys.version)]
vv = rdd.mapPartitions(f).collect()
が、私はそのためのファイルをロードするために持っている必要があり、なぜ私は表示されません。
どうすればよいですか?