2016-11-11 13 views
0

私はこのファイルを解析しようとしていますhttp://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt多機能回帰を実行するには、 "ValueError:Found array in dim 3. Estimator予想される< = 2. " 。 Btw、入力は浮動小数点でなければならないのですか?Sklearn regression input "見つかった配列が暗い3.推定値= 2"

database = open(r'diabetes.rwrite1.txt','r').readlines()[1:] 
lstx = [] 
lsty = [] 
for line in database: 
    splitted = line.split() 
    lstx.append(splitted[0:9]) 
    lsty.append(float(splitted[10])) 


x_ = np.array(lstx)[:, np.newaxis, 1:9] 
x = x_.astype(float) 
y = np.array(lsty) 
lr = LinearRegression() 
lr.fit(x, y) 
+0

xとyの形を印刷し、これらについてscikit-learnの規則と比較してください。 (浮動小数点は、必要に応じて浮動小数点数にキャストされます)。 read-csvの部分にnumpyやpandasを使用することをお勧めします。 – sascha

答えて

0

連続変数を予測する場合は、LinearRegressionを使用します。カテゴリを予測する場合は、LogisticRegressionやRandomForestClassifierなどの分類子を使用する必要があります。

sklearnでは、これらの名前はほとんど常に「クラシファイア」という名前になっています。

関連する問題