2017-12-21 13 views
-1

私はこのデータセットを持っています。私はApache Spark 2.1.1で複数のMLモデルを訓練したいと思っています。これは10列で構成され、2列には文字列が含まれます。これらの列を削除することは、私が収集したい情報にとって不可欠であるため、オプションではありません。しかし、私はこの問題のために実験を続行するためにCSVファイルをSVMに変換できません。MLトレーニングのためにCSVファイルをSVMに変換する方法

私はそれをRDDに変換しようとしましたが、SVMとして保存してもファイルは保存されません。これの周りに他の方法はありますか?

答えて

0

2つの列に2列の文字列を作成し、その文字列値を使用する代わりに索引を使用してモデルを訓練することができます。

関連する問題