私は「クロス検証済み」フォーラムで、これまでのところ応答なしでも、この質問をしてきたので、私もここにしようとしています:私は類似度行列を計算したいコンピューティングの類似度行列
を(私はさらに私のデータ(自動車会社の失敗データ)からクラスタリング目的で使用されます。データは次の変数で構成されています:
開始日+時間(dd/mm/yyyy hh/mm/ss)、DURATION(秒)、DAY OF THE WEEK(月、火、...)、WORKING TEAM (1,2,3)、LOCALIZATION(1,2,3、...、20)、FAILURE TYPE
このことから、連続的かつ分類的なデータがあることは明らかです。障害タイプ間の類似点を計算するには、どのような方法をお勧めしますか?ユークリッド距離やゴウの類似点を使うことはできないと思う。前もって感謝します。
目的によって異なります。どのような目的のために類似性を定義したいですか? – user31264
データ(クラスタークラスタリング)のクラスター分析を実行したいので –
**では5時間**ではなく、他の週に回答する必要があります。クロスポストしないで、クロスバリデーションはより良い場所でした。 –