MatlabでK平均アルゴリズムをプログラミングする際に質問があります。 K-meansアルゴリズムが細長いデータセットを分類するのに適していないのはなぜですか?クラスタリング長さのあるデータセットのK平均アルゴリズム
-3
A
答えて
-2
0
目的関数を見て、x軸を10倍にスケールすると、100倍重要になります。
"長い"データでは、 "長い"ディメンションは結果にほとんどの影響を与え、他は無視される傾向があります。
k-meansは監督されていないアルゴリズムなので、これに対抗するために重みを学習することはできません。線形SVMや決定木などの分類器でこれを行うことができるため、この問題は発生しません。
関連する問題
- 1. IDLでのK平均クラスタリング
- 2. PCA K-平均クラスタリング前
- 3. グループ平均クラスタリングのアルゴリズム的複雑度
- 4. 半監督k平均クラスタリングの実行方法
- 5. K平均クラスタリングとベクトル量子化の違いは?
- 6. 反転距離を使用したK平均クラスタリング
- 7. Python:どのようにk平均アルゴリズムを使用してクラスタリング間の類似性を比較するには?
- 8. 不均一クラスタによるクラスタリング(k-means)
- 9. k平均アルゴリズムの重心と重心の差
- 10. スパークk平均OutOfMemoryError
- 11. K平均クラスタリング、なぜクラスタの初期位置が最終的なクラスタリング結果に影響を与えるか?
- 12. LDA/Biクラスタリング/ K平均を使用して時間的クラスタリングを行う方法R?
- 13. k-平均クラスター化のテストデータ分類
- 14. 各k秒/ msでの平均tcpdump/
- 15. スパークK平均クラスタメンバーを取得する
- 16. K平均色クラスタリングを意味する - マスクされたnumpy配列を持つ背景ピクセルを省略する
- 17. MATLABで事前に定義されたシードを使用してK平均クラスタリングを使用する
- 18. k-ary検索の平均比較がk * ln(N)/ ln(k)であるのはなぜですか?
- 19. スパーク2.0.2 rdds /ネストされたrddまたはデータフレームまたはデータセットのネストされたK平均
- 20. パイソン - 文のワード長のリターンの平均
- 21. BSTの最長パスの平均
- 22. テストデータをmatlabのk平均クラスタに分割する
- 23. Apache Sparkによる時系列データのK平均意味
- 24. P [i] - (k [i] - 平均(k))^ 2のエラー:オブジェクト 'P'が見つかりません
- 25. 合計アルゴリズム:O(n^2)平均で
- 26. k-すべてのデータまたは各フィーチャの平均?
- 27. K平均クラスター - 各クラスターでのプロットクラスの割合
- 28. Bioconductorを使用したBEDファイルの平均間隔の長さ
- 29. 複数のデータセットにわたるR値の平均値
- 30. 'numpy.float64'オブジェクトは反復可能ではありません - 平均クラスタリング
[Cross Validated](http://stats.stackexchange.com)の質問ではありませんか? – jeff