feature-selection

    12

    2答えて

    回帰アルゴリズムは、数字で表されるフィーチャに作用しているようです。たとえば : このデータセットは、カテゴリ機能/変数が含まれていません。このデータを回帰分析して価格を予測する方法は非常に明確です。 しかし、今私は、カテゴリ機能が含まれているデータに対して回帰分析をしたい: 5つの機能があります:District、Condition、Material、Security、Typeは このデータを回

    2

    2答えて

    モデルを1つのパーセンテージ(従属)変数に合わせるために選択しようとしている9つの連続する独立変数を持つデータセットがあります。スコア。 残念ながら、いくつかの変数の間に重大な共線性があることはわかっています。 私は変数選択のためのRでstepAIC機能を使用してみましたが、その方法は、奇妙な、変数は式に示されている順序に敏感なようだ... ここに私のRコードは(です)それはパーセントデータだ/

    6

    3答えて

    パイプラインとgrid_searchを使用して最適なパラメータを選択し、これらのパラメータを使用して最適なパイプライン( 'best_pipe')に合わせました。しかし、feature_selection(SelectKBest)がパイプラインにあるので、SelectKBestに適用されていません。 「k」で選択した機能の機能名を知る必要があります。任意のアイデアをどのようにそれらを取得するには?

    7

    1答えて

    Rパッケージを使用して、SVMで機能選択(例:再帰的な機能選択)を適用しようとしています。私はLibSVMの機能選択をサポートするWekaをインストールしましたが、私はSVMなどの構文の例は見つかりませんでした。短い例が大きな助けになるでしょう。

    57

    4答えて

    私は、各属性(n = 23)が特定の時点を表す時系列をデータ入力として持つ分類タスクを持っています。絶対分類結果の他に、どの属性/日付がどの程度結果に寄与しているかを調べたいと思います。したがって、私はちょうどfeature_importances_を使用しています。これは私にとってはうまくいきます。 しかし、私はそれらがどのように計算され、どの計測/アルゴリズムが使用されているか知りたいと思いま

    7

    2答えて

    私はいくつかのSVM実装で遊んでいましたが、1つの範囲に収まるようにフィーチャ値を正規化する最良の方法は何ですか? - 5. 0.02から0.05 10-15 3: (1から0から)のは、私がの範囲の値を持つ3つの機能を持っているとしましょう。 どのようにこれらの値を[0,1]の範囲に変換しますか? What私が遭遇するフィーチャナンバー1の最高値が5で、もっと大きなデータセットで私のモデルを使い

    6

    2答えて

    画像処理を使用して240個の特徴を抽出しました。 目的は、トレーニング後にテストケースを7つの異なるクラスに分類することです。各クラスには約60の観測値があります(つまり、クラスごとに60個の特徴ベクトルがあり、各ベクトルは240個のコンポーネントを持っています)。 多くの研究論文と書籍は、特徴ベクトルから最良の特徴を選択するために逐次前方探索または逐次後方探索を利用している。 次の図は、順次検索

    6

    1答えて

    数字はどのように計算されますか?ドキュメントでは、この機能は "各機能の機能の重要性を得る"と述べていますが、結果の解釈方法についての説明はありません。

    1

    1答えて

    私は、機能選択を使用して、文書内でバイナリ分類タスクに最も有用な用語を見つけたいと考えています。 私の周り見てきた: これは、相互情報量とカイ二乗検定メトリックが言及 http://nlp.stanford.edu/IR-book/html/htmledition/feature-selection-1.html MATLABは、同様に多くの機能を持っていますの http://www.mathwo

    11

    4答えて

    機械学習における主成分分析(PCA)と機能選択の違いは何ですか? PCAは機能選択の手段ですか?