2016-08-10 9 views
0

私は最近、Hue UIでSpark Notebookをセットアップしようとしていました。私はVirtualBoxでCloudera CDH 5.8を実行しています。スパークノートはLivy Serverで動作し、livy serverをインストールしました。また、Hue.iniファイルからブラックリストからスパークを削除します。 しかし、私は色相UIでスパークノートを手に入れません。Clouderaクイックスタートの下で色相にスパークノートを設定するには?

更新:今ノートブックにアクセスできます。ただし、クラスターにスパークジョブを送信することはできません。いくつかのスクリプトだけを試しましたが、Hiveスクリプトは動作しますが、R、Pyspark、またはScalaスクリプトは動作しません。私は次のエラーに遭う。

誰かが問題を理解するのに手伝ってもらえますか?必要に応じてさらに情報を提供することができます。

ありがとうございます。

..... Romainrのおかげで、私はHueでSpark Notebookを走らせることができました。今私は、同じlocalhost上のClouderaマネージャーで実行されているApache sparkにジョブをサブミットするためにいくつかの問題に直面しています。エラーは次のスクリーンショットで公開されています。どんな助けでも大歓迎です。ありがとうございました。

Error: Spark session could not be created in cluster: timeout

"Session '-1' not found." (error 404)

+0

https://blogs.msdn.microsoft.com/pliu/2016/06/18/run-hue-spark-notebook-on-cloudera/? – Romain

+0

こんにちはロメイン、非常に私は色調でセットアップノートブックを持っていたことができる記事をありがとう。しかし、私はSparkに仕事を提出することはできません。元の投稿に表示されているエラーが表示されます。これは私が今更新しました。あなたは問題の背後にある問題を理解するためにお手伝いできますか?ありがとうございました。 – AMIT

+0

こんにちはAmit、これを解決しましたか?時には「セッションが見つかりません」というエラーが表示されることもあります。 – Cos

答えて

0

あなたは色相からpySparkノートブックを実行する場合は、リソースにアクセスすることができないとして、それがタイムアウトを言います。 実際に、コマンドラインインターフェイスからコマンドpysparkまたはscalaを実行しようとすると、いくつかのエラーが表示されます。

Hue Notebookからタイムアウトエラーが発生した場合、ログを調べると、許可が拒否された問題が見つかります。 だから、アクセス権を与えるために、次のようにします。この後(Linuxのシェル上で実行)

$ sudo -u hdfs hadoop fs -chmod 777 /user/spark 
$ sudo -u spark hadoop fs -chmod 777 /user/spark/applicationHistory 

あなたはCDHで色相と火花サービスを再起動し、色相からpysparkやScalaのノートブックを作成しようとすると、それは外に実行する必要がありますボックス。 まだエラーが発生した場合は、お知らせください。

+0

Wharは/ user/spark/applicationHistoryは自分のhdfsに存在しませんか? –

関連する問題