This page IPythonノートブックにジャーdependenicesをロードするためにPyspark で.csvファイルを読み取るためのスパーク-CSVを試すために私を鼓舞して私はそのようなthisとしてポストのカップルがspark-csvがどのように
を使用する方法を説明した。しかし私は起動時に.jarファイルまたはパッケージ拡張子を含めてipythonインスタンスを初期化することはできません。これはspark-shellで行うことができます。
つまり、ipython notebook --profile=pyspark
の代わりにipython notebook --profile=pyspark --packages com.databricks:spark-csv_2.10:1.0.3
を試しましたが、サポートされていません。
お知らせください。
これは 'os.environ [" PYSPARK_SUBMIT_ARGS "]'に既にあるものすべてをオーバーライドしませんか?私はこれが言及される必要があると思うので、私は何が起こったのかを考え出すのに多くの時間を費やした。 –