2017-10-05 1 views
0

私は、バイナリ分類問題のランダムフォレスト分類器を構築しています。私のラベルはすべて数値です。ValueError:不明なラベルの種類: '不明' - ラベルは数値です

print labels.unique() 
[1 0] 

print type(labels) 
    <class 'pandas.core.series.Series'> 
print labels.shape 
(3000,) 

しかし、私は、私はこのエラーに

ValueError: Unknown label type: 'unknown' 

を取得しています。しかし、私は

gs.fit(features, labels.astype(int)) 

を使用するとき、それが正常に動作しているGridsearchcv

pipeline = Pipeline(steps=[('scaler', scaler), ('algorithm', algo)]) 
cv = StratifiedShuffleSplit(labels, 5, test_size=0.25, random_state=42) 
gs = GridSearchCV(pipeline, param_grid, cv=cv, scoring='f1') 
gs.fit(features, labels) 

でモデルを適合しています誰かが私がどこに嘘をつけているか教えて私のラベルの問題?

答えて

1

tolist()メソッドを使用してリストするラベルの種類を変更するだけで済みます。使用

labels_lst = labels.tolist() 

Scikit-learnはシリーズを自動的にラベルのリストに変換することはできません。

関連する問題