ラベルの数がサンプル数と一致しません。いくつかのサンプルデータがありますが、それは全体的に良い方法ではないと思います。ここでsklearn.model_selection.train_test_splitでPythonエラーが発生しました:ValueError:サンプル数が不一致の入力変数が見つかりました:[416858、398427]
は私のコードです:
X = np.loadtxt('/Users/myname/PycharmProjects/my_project/X.txt')
y = np.loadtxt('/Users/myname/PycharmProjects/my_project/y.txt')
print np.shape(X)
print np.shape(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)
私はエラーを取得する:
ValueError: Found input variables with inconsistent numbers of samples: [416858, 398427]
誰もが、私はそれを修正するために必要となるかを説明することはできますか?
この機能は、**教師ある学習**のためのutilです。 XとYの1:1マッピングを持たない(少なくとも第1の次元では)意味をなさない。貴重な答えはここではありません。 – sascha
私は同意しません。私はブラムの答えは貴重だったと思う。 – dirtysocks45
いいえ、そうではありません。しかし、あなたはその事実を認識する(またはそれを理解することなく悪い結果を得る)というポイントに来るでしょう。本当の答えが必要な場合は、おそらくより多くの情報を追加する必要があります。この不均衡なX/Yセットのマッピングがあります(どの2つがペアになっているか分かります)。分類(いくつのクラス)?回帰? – sascha