こんにちは私はスケーラcountvectorizer出力からのマッピングをお勧めしますか:([label、(nVocab、[i1、i2、...]、[c1、c2、...])]] )をlibsvm形式に変換します:(label、::...)?Scalar countvectorizerの出力をlibsvm形式に変換する
文字列として入力すると、フィールドを取得するために分割する場所がわからないため、まずは入力します。
また、これにスカラーユーティリティがありますか? ありがとう、 kvd
こんにちは私はスケーラcountvectorizer出力からのマッピングをお勧めしますか:([label、(nVocab、[i1、i2、...]、[c1、c2、...])]] )をlibsvm形式に変換します:(label、::...)?Scalar countvectorizerの出力をlibsvm形式に変換する
文字列として入力すると、フィールドを取得するために分割する場所がわからないため、まずは入力します。
また、これにスカラーユーティリティがありますか? ありがとう、 kvd
私はこれを解消しました。 countVectorizerの出力は、[size、[indices]、[values]]を持つsparseVecorデータ型にキャストできます。インデックスと値の配列は、libsvm形式で圧縮して出力することができます。さらに探査時
ヴァルcountVec = VEC(1).asInstanceOf [スパーセベクター]
私はこの変換を必要としないことが判明しました。私はclassLabelとsparseVectorを使ってLabeled点を作成し、オブジェクトを直接学習する機械に渡すことができました。
ありがとう、 kvd