は、私は、以下のものを使用してビーラインを通じてハイブでUDFを登録スパーク

にハイブ登録UDFを使用しは、私は、以下のものを使用してビーラインを通じてハイブでUDFを登録スパーク

期待を返す

SELECT udfTest(name) from myTable;

結果。

は、私はその後、スパーク・シェルを起動して、失敗し、次の

sqlContext.sql("SELECT udfTest(name) from myTable")

を実行します。スタックは数百行の長さである（私はここに貼り付けることができない）が、重要な部分は、以下のとおりです。

org.apache.spark.repl.SparkIMain $ TranslatingClassLoaderはjava.net.URLClassLoader
：java.lang.IllegalArgumentExceptionが：登録できません[/tmp/blarg/pathToMyJar.jar]

何かが際立っている場合、私はより詳細な情報を提供することができます。

SparkでHiveを通じて登録されたUDFを使用することはできますか？

スパークバージョン1.3.0

出典

2016-06-29 A Spoty Spot

カスタムUDFを使用する場合は、あなたのUDFのためのjarファイルがアプリケーションに同梱されていることを確認し、ORは、UDFを指定する--jarsコマンドラインオプションを使用します詳細について

./bin/spark-shell --jars <path-to-your-hive-udf>.jar

以下のようにスパークシェルを起動しながらパラメータとして-fileはCalling Hive User-Defined Functions from Sparkを指します。

出典

2016-06-30 03:50:50 janeshs

これは、spark-shellを実行しているときに、実際のUDFクラスに対するjar内のクラスパスを知る必要があります。これは、アプリケーションの実行時にわからないことです。これ以外の方法はありますか？ –

UDF JarをHDFS内のディレクトリ/パスにコピーして、それを知るようにspark-shellのパスを指定することができます。 – janeshs

最近同じ問題が発生しました。私たちが気づいたのは、jarパスがローカルで利用可能な場合、すべてがうまくいきます。 jarパスがhdfs上にある場合、それは動作しません。そこで、私たちがやったことは、FileSystem.copytoLocalFileを使ってjarファイルをローカルにコピーし、コピーしたファイルを追加することでした。クラスターとクライアントモードで私たちのために働いた

PS。これはSpark 2.0です。

出典

2017-03-17 00:06:38 mat77

は、私は、以下のものを使用してビーラインを通じてハイブでUDFを登録スパーク

答えて

関連する問題