2017-12-12 5 views
-4

ラベルの数がサンプル数と一致しません。いくつかのサンプルデータがありますが、それは全体的に良い方法ではないと思います。ここでsklearn.model_selection.train_test_splitでPythonエラーが発生しました:ValueError:サンプル数が不一致の入力変数が見つかりました:[416858、398427]

は私のコードです:

X = np.loadtxt('/Users/myname/PycharmProjects/my_project/X.txt') 
y = np.loadtxt('/Users/myname/PycharmProjects/my_project/y.txt') 

print np.shape(X) 
print np.shape(y) 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3) 

私はエラーを取得する:

ValueError: Found input variables with inconsistent numbers of samples: [416858, 398427] 

誰もが、私はそれを修正するために必要となるかを説明することはできますか?

+0

この機能は、**教師ある学習**のためのutilです。 XとYの1:1マッピングを持たない(少なくとも第1の次元では)意味をなさない。貴重な答えはここではありません。 – sascha

+1

私は同意しません。私はブラムの答えは貴重だったと思う。 – dirtysocks45

+1

いいえ、そうではありません。しかし、あなたはその事実を認識する(またはそれを理解することなく悪い結果を得る)というポイントに来るでしょう。本当の答えが必要な場合は、おそらくより多くの情報を追加する必要があります。この不均衡なX/Yセットのマッピングがあります(どの2つがペアになっているか分かります)。分類(いくつのクラス)?回帰? – sascha

答えて

-2

np.shape(x)とnp.shape(y)の結果はどうなりますか?多分それがあなたを助けることができます。すべての入力に対して目標値がない場合は、それを修正する必要があります。失われた値がランダムでない場合は、モデルの結果に影響するため、削除するだけで問題になることがあります。あなたの最善の選択肢は、帰属を実行することです。詳細については、Wikipedia pageを参照してください。

+0

それは私が考えたものです。私はそれがそれが何であったのか分からなかったが、ありがとう。 – dirtysocks45

関連する問題