2017-01-10 10 views
1

データセットが連続変数およびバイナリ変数である独立変数を含むとします。通常、ラベル/結果列は1つのホットベクトルに変換されますが、連続変数は正規化できます。しかし、バイナリ変数には何を適用する必要があります。ロジスティック回帰を適用する際に正規化する変数の選択

 
AGE  RACE GENDER NEURO EMOT 
15.95346 0 0  3  1 
14.57084 1 1  0  0 
15.8193  1 0  0  0 
15.59754 0 1  0  0 

これはどのようにロジスティック回帰およびニューラルネットワークに適用されていますか?

答えて

1

連続値の範囲が小さい場合、それをバイナリ形式にエンコードし、そのバイナリ形式の各ビットをプレディクタとして使用します。 たとえば、2進数では2 = 10です。 したがって

predictor_bit_0 = 0

predictor_bit_1 = 1

試してみて、それが動作するかどうかを確認。ただあなたに警告するために、この方法は非常に主観的であり、あなたのデータのために良い結果をもたらすかもしれません。

+0

私はこれが私の質問に答えるとは思わない、最大と最小の間で大きく異なる連続変数については、正規化が必要です。私は、バイナリ変数(0または1のような2つの結果のみを持つ変数)に対して何を行う必要があるかを明確に述べました。それらを消費するか、正規化のような同様の操作を実行する必要がありますか? –

+0

さて、私が投稿したソリューションをリバースエンジニアリングしたいかもしれません。バイナリ予測子を連続予測子に結合するだけです。たとえば、race = 1、gender = 0、emot = 1、x = 1の場合:結合して各ビットがプレディクタの1つを表す1つの2進数を形成します。上記の例の組み合わせ予測子は1011(バイナリで)= 11(小数点以下)です。このプレディクタはそのまま使用することも、正規化することもできます。 – Arjun

関連する問題