SPARK sqlを使用してsparkアプリケーションを開発しています。私の仕事の1つは2つのテーブルから値を選択し、それを空のテーブルに挿入することです。しかし、このために私は空のテーブルを作成するための火花を試しています、私は、空のデータフレームを作成しているが、ここでそれを表として登録カント今私の状況でコードsparkの空のデータフレームに値を挿入する方法
from pyspark import SQLContext
from pyspark.sql.types import StructType,StructField,StringType,DateType,IntegerType
sqlc=SQLContext(sc)
schema= StructType([StructField("Name",StringType(),False),StructField("AGE",IntegerType(),False),StructField("DATE",DateType(),False)])
dataframe=sqlc.createDataFrame([],schema)
dataframe.show()
それがデータフレームを示しているが、私はないですそれは私がこの問題のために、私はテストのためのいくつかの値を挿入したいが、私はそれを行うことができませんので、私は、ここで間違いを犯しています考えて何の価値
dataframe.registerTempTable("Exp")
experiment=sqlc.sql("SELECT * FROM Exp")
experiment.show()
が存在しない原因の登録であるかどうかを確認してください。私はスパークの新しいので、どのように私はこの状況を解決することができますか分からない。私はいくつかのフォーラムを通過しました私はいくつかのフォーラムユーザーがテーブルを作成するためのparallelize()メソッドについて述べたが、私はそれがworks.Isを正しく理解していない操作目的のハイブコンテキストを使用する必要がありますか?私の要求は、ハイブの文脈なしにこの仕事をしています。私を案内してください
タグにHadoopが記述されているのはなぜですか?私が間違っていれば私を訂正しますが、質問にはHadoopはまったく言及されていません。 –
申し訳ありませんが、私は誤ってそれを削除していませんでした – Kalyan