2017-12-18 3 views
1

Microsoft AzureでPySpark HDInsightクラスタを使用して機械学習プロジェクトを実行しようとしています。私のクラスタで操作するには、Jupyterノートブックを使用します。また、Azure BLOBストレージに保存されているデータ(csvファイル)もあります。PySparkで紺碧ブロブストレージからcsvファイルを読み取る

文書によると、私のファイルへのパスの構文は次のとおりです。

path = 'wasb[s]://[email protected]/movies_plus_genre_info_2.csv' 

しかし、私は次のコマンドでcsvファイルの読み取りしようとすると:

csvFile = spark.read.csv(path, header=True, inferSchema=True) 

私が手を次のエラーが発生しました:

'java.net.URISyntaxException: Illegal character in scheme name at index 4: wasb[s]://[email protected]/movies_plus_genre_info_2.csv' 

ここでのエラーのスクリーンショットは、メモ帳のようですOK: error screenshot

これを修正する方法についてのアイデアはありますか?

+0

それはwasbのいずれかです://またはwasbs://。 wasbsはwasbの安全なバージョンです – Jaco

答えて

1

それはどちらか(暗号化されていない)である:

wasb://... 

か(暗号化):

wasbs://... 

ない

wasb[s]://... 
+0

ありがとうございます!それは問題を解決しました! –

関連する問題