2017-01-23 11 views
0

こんにちは私はスケーラcountvectorizer出力からのマッピングをお勧めしますか:([label、(nVocab、[i1、i2、...]、[c1、c2、...])]] )をlibsvm形式に変換します:(label、::...)?Scalar countvectorizerの出力をlibsvm形式に変換する

文字列として入力すると、フィールドを取得するために分割する場所がわからないため、まずは入力します。

また、これにスカラーユーティリティがありますか? ありがとう、 kvd

答えて

0

私はこれを解消しました。 countVectorizerの出力は、[size、[indices]、[values]]を持つsparseVecorデータ型にキャストできます。インデックスと値の配列は、libsvm形式で圧縮して出力することができます。さらに探査時

ヴァルcountVec = VEC(1).asInstanceOf [スパーセベクター]

私はこの変換を必要としないことが判明しました。私はclassLabelとsparseVectorを使ってLabeled点を作成し、オブジェクトを直接学習する機械に渡すことができました。

ありがとう、 kvd

関連する問題