これは私が使用したコードです。Sparkでリクエストモジュールを使用するにはどうしたらいいですか?
from __future__ import print_function
import sys
from pyspark.sql import SparkSession
import sys
sys.path.append('/usr/local/lib/python2.7/site-packages')
import requests
if __name__ == "__main__":
s = Session()
toGet = s.get
spark = SparkSession\
.builder\
.appName("PythonDockerRepoStat")\
.getOrCreate()
lines = spark.read.text('/data/urls.txt').rdd.map(lambda r: r[0])
res = lines.flatMap(lambda x: x.split("\n"))\
.map(lambda x: toGet(x))
output = res.collect()
print(output)
しかし、私はこのエラーを得た:はImportErrorを:いいえモジュールの名前requests.sessions
pysparkシェルと 'import requests'を起動します。うまくいくでしょう。 – MYGz