1
私はHDFSに2つのファイルを持っています.1つはヘッダーのないcsvファイルで、1つは列名のリストです。私は実際にhereのようにそれらを実際に入力せずに他のデータフレームに列名を割り当てることが可能かどうか疑問に思っています。Sparkデータフレーム列の名前を変更
私はこのような何かを探しています:
val df = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", "\t").load("/user/training_data.txt")
val header = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", ",").load("/user/col_names.txt")
df.columns(header)
これは可能ですか?