@ j.jerrod.taylorの答えに応じて、誤解をなくすために私の質問を言い換えることができます。ビン境界を使用したスムーズな値:下限と上限の間に右に座っている値はどこで設定しますか?
私はData Miningを初めて使い、「Bin Boundaries」を使って等幅/距離ビニングを使用してデータをスムージングすることでノイズの多いデータを処理する方法について学んでいます。データセット1,2,2,3,5,6,6,7,7,8,9を仮定します。
- 距離ビニングを3つのビン、およびビンの境界によって
- 滑らかな値で1位にビニング値に基づいて:私が実行したいです。 (漢、Kamber、ペイ、2012、データマイニングの概念とテクニック、セクション3.2.2ノイズの多いデータ)での定義に基づいて
:ビンの境界、最小とすることにより
で平滑指定されたビンの最大値はビン境界として識別されます。各ビンの値は、最も近い境界値に置き換えられます。
- 区間幅=(最大 - 最小)/ K =(9-1)/ 3 = 2.7
ビン間隔= [1,3.7)、[3.7,6.4)、[6.4、 9.2]ビン境界:(1,3)|ビン境界によるスムーズな値:1,1,1,3
- オリジナルBin2:5,6,6 |ビン境界:(5,6)|ビン境界によるスムーズな値:5,6,6
- オリジナルBin3:7,7,8,9 |ビン境界:(7,9)|ビンの境界による平滑値:7,7、、9
質問: - ビン境界法を用いたビニングするとき、それは7から+1だからは8は、BIN3中に属さず、-1 9から?
あなたは「ビンの境界で値を平滑化」に関する私の質問を誤解し、ビンの」境界線"私は私の質問につながるすべての詳細を含めるように私の質問を改めた。 – user2771721
@ user2771721私は何かを誤解しなかった。私の編集を参照してください。 –