5

私は機械学習を学びたいと思っていて、データの二次および三次の変換とそれがどのように行われているのか疑問に思っていましたか? forumの1人の男がそれについて話しています。私は変数の変換とそれがどのように行われているのか疑問に思っていました。 ありがとう変数の二次変換

+0

何かが欠落していない限り、それはデータの要素単位の正方形を取っているだけです。 –

+0

@toasted_flakes要素だけでなく、 2次項には、それらの相互作用も含まれます。 –

+0

@DavidMaust私はこの習慣が名前を持っていたのか分からなかった。ありがとう! –

答えて

7

モデルのバイアスを減らし、用語間の相互作用を可能にするために、多項式フィーチャ(2次、3次など)を使用します。 scikit-learnでは、それはsklearn.preprocessing.PolynomialFeaturesの変換として実装されています。

3つの機能a,b、およびcがあるとします。二次関数は(a + b + c)^2を展開して生成されます。したがって、a^2,b^2c^2,a*b,a*c,b*cは2次特徴の集合となる。

scikit-learnのPolynomialFeaturesでは、引数degreeが渡されると、それまでのすべての用語が作成されます。

これは、通常、線形モデルを作成する前に使用されます。バイアスを低くすることができますが、機能セットのサイズを非常に迅速に増やすことができます。

+2

より正確には、多項式次数で成長が指数関数的であるため、カーネル法が好ましい。 – lejlot

+0

ありがとうございます。 –