0

ある変数(カテゴリ変数と数値変数)に欠損値があるデータセットがあります。例として、私は2つのカテゴリ、 "地域(今日)"と "地域(1日)"に分けられた数値を持つ変数 "エリア"を持っています。データ列が「新しいコーナー」に分類されている場合、「エリア(-1日)」に値はありません。したがって、削除や削除などの通常の欠損値処理はここでは機能しません。変数がもともと数値であるカテゴリとして、 "area(-1 day)"に値を付けないでください。あるいは、他に何か提案がありますか?ディシジョンツリーにあるように欠損値をそのまま扱う

+0

なぜ、1日目の領域がゼロにならないのですか? –

+0

可能性があるため、領域がゼロ(領域> = 0)の「新しいコーナー」が表示され、特定のクラスとして分類されます。 –

答えて

0

新入社員を別のクラスとして扱うことは理にかなっています。なぜなら、これがデータセット内でどのように扱われるのかということです。

そうでなければ、あなたのユースケースに合わせて、さまざまな他の転用技法をチェックすることができます。回帰帰属があなたのケースに合っているかもしれません。

HTH

+0

ああありがとうございます:) –

関連する問題