カテゴリデータをsklearn.linear_model
のLogisticRegression
の機能として使用する方法を理解しようとしています。Skateganical DataをSkype LogisticRegressionの機能として使用する
もちろん私はそれをエンコードする必要があります。私は理解していない何
は、それがカテゴリ機能として処理されますので、ロジスティック回帰へのエンコード機能を渡す方法で、標準定量化機能として符号化するとき、それが得たint値を解釈しません。
(あまり重要ではありません)
preprocessing.LabelEncoder()
、DictVectorizer.vocabulary
を使用するか、カテゴリデータを簡単なdictでエンコードするだけの違いを誰かが説明できますか? Alex A.'s comment hereは被験者には触れるが、深くは触れない。
特に最初のものと!
reply.The変換自体のおかげで(と思う)問題の少ない、私の主な関心事は、猫が1としてエンコードされるので、もしロジスティックREGは、標準数値として数値を検討するということです犬は2であると見なされますが、割り当てられた値が無意味であることがわかっている間は、「犬」とそのプロパティの「より多く」の観測を想定します。 – Optimesh
@Optimesh、「エンコードされた」とはどういう意味ですか?ターゲット変数について話している場合、ターゲット[1,2,3]に何も問題はないので、LogisticRegressionは(この特定のケースでは)3つの分類子を作成してOneVsRestスキームで組み合わせます。 OneHotEncoderは、各カテゴリの機能をバイナリ形式でエンコードします。つまり、カテゴリ機能の各値の代わりに新しいバイナリ機能を作成します。つまり、結果のデータセットに値のバイナリ機能(列) 1、犬= 2、犬= 3、猫= 1など公式文書の例を見てください。 –