Microsoft AzureでPySpark HDInsightクラスタを使用して機械学習プロジェクトを実行しようとしています。私のクラスタで操作するには、Jupyterノートブックを使用します。また、Azure BLOBストレージに保存されているデータ(csvファイル)もあります。PySparkで紺碧ブロブストレージからcsvファイルを読み取る
文書によると、私のファイルへのパスの構文は次のとおりです。
path = 'wasb[s]://[email protected]/movies_plus_genre_info_2.csv'
しかし、私は次のコマンドでcsvファイルの読み取りしようとすると:
csvFile = spark.read.csv(path, header=True, inferSchema=True)
私が手を次のエラーが発生しました:
'java.net.URISyntaxException: Illegal character in scheme name at index 4: wasb[s]://[email protected]/movies_plus_genre_info_2.csv'
ここでのエラーのスクリーンショットは、メモ帳のようですOK:
これを修正する方法についてのアイデアはありますか?
それはwasbのいずれかです://またはwasbs://。 wasbsはwasbの安全なバージョンです – Jaco