誰かが下記のエラーで私を助けてくれますか?私は回帰モデル構築に使用できるように、データフレームをrddに変換しようとしています。ClassCastException:org.apache.spark.ml.linalg.DenseVectorをorg.apache.spark.mllib.linalg.Vectorにキャストすることはできません
SPARKバージョン:2.0.0
エラー=> のClassCastException:org.apache.spark.ml.linalg。 DenseVectorは、 org.apache.spark.mllib.linalgにキャストできません。 ベクトル
コード=>
import org.apache.spark.mllib.classification.LogisticRegressionWithLBFGS
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.rdd.RDD
import org.apache.spark.sql._
import org.apache.spark.sql.Row
val binarizer2: Binarizer = new Binarizer()
.setInputCol("repay_amt").setOutputCol("label").setThreshold(20.00)
df = binarizer2.transform(df)
val assembler = new VectorAssembler()
.setInputCols(Array("tot_txns", "avg_unpaiddue", "max_unpaiddue", "sale_txn", "max_amt", "tot_sale_amt")).setOutputCol("features")
df = assembler.transform(df)
df.write.mode(SaveMode.Overwrite).parquet("lazpay_final_data.parquet")
val df2 = spark.read.parquet("lazpay_final_data.parquet/")
val df3= df2.rdd.map(r => LabeledPoint(r.getDouble(0),r.getAs("features")))
データ=>
の可能性のある重複[MatchErrorスパーク2.0のベクトル列にアクセスしている間(http://stackoverflow.com/questions/38818879/matcherror-while-accessing-vector-column-in- spark-2-0) –
私はspark 2.0.0を使用しています –