私が正しく二つのグループ、グループ0とグループ1sklearnの次元の問題「予想薄暗い3.見積もりで見つかり、アレイ<= 2」
私はデータを抽出に.wavファイルを分類するKNNを使用しようとしています、私がしようとすると.predict()メソッドを使用するときに、モデルを作成し、モデルを当てはめる、しかし、私は次のエラーを取得する:
Traceback (most recent call last):
File "/..../....../KNN.py", line 20, in <module>
classifier.fit(X_train, y_train)
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/neighbors/base.py", line 761, in fit
X, y = check_X_y(X, y, "csr", multi_output=True)
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/utils/validation.py", line 521, in check_X_y
ensure_min_features, warn_on_dtype, estimator)
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/sklearn/utils/validation.py", line 405, in check_array
% (array.ndim, estimator_name))
ValueError: Found array with dim 3. Estimator expected <= 2.
私は同様の問題を説明し、これらの2件のstackoverflowの記事を発見した:
sklearn Logistic Regression "ValueError: Found array with dim 3. Estimator expected <= 2."を
Error: Found array with dim 3. Estimator expected <= 2
私が間違っていると私を修正しますが、scikit-learnは2次元データしか受け入れられないようです。このデータセットに
- 3240 .wavファイルについては
- については (これは、トレーニングデータのインデックス0である):
私のトレーニングデータは、形状(3240、20、5255)で構成されてい を持っています各 .wavファイルには、MFCC係数を表す(20,5255)個の配列があります(MFCC係数は数値的に音を試して表現します)。
私の試験データは、形状(3240)#CATEGORYは私が-学ぶscikitで使用できる形式に変換するために操作私のトレーニングとテストデータに使用することができますどのようなコード0または1
ですがあります?また、3次元から2次元に移動するときにデータが失われないようにするにはどうすればよいですか?
MFCC配列を単一の次元に変換し、形状が '(3240,20 * 5255)' –
になるようにしてください。あるいは、形状(20,5255)の2次元配列についてもっと説明してください。行と列は何を表しますか?各列または行から単一の代表番号を取ることはできますか? –