feature-selection

    0

    1答えて

    SGDを使用して線形回帰を実行することで、yelpのレビューが正か否かを予測しようとしています。 私は2つの異なる特徴抽出器を試しました。 最初は文字nグラムで、2番目はスペースで単語を区切っていました。 しかし、文字nグラムに対して異なるn値を試したところ、最良のテストエラーをもたらしたn値がわかりました。 このテストエラー(私のテストデータで0.27)は、スペースで区切られた単語を抽出したテス

    -1

    2答えて

    私は10種類のオブジェクトがあり、オブジェクトごとに100種類のイメージがあるとします。私はオブジェクトがタイプ0、タイプ1などであるかどうかを分類するためにアルゴリズムを学習するマシンを実行したい。 それぞれのオブジェクトタイプが異なると仮定すると(EX:オブジェクト1:Cat、オブジェクト2:オートバイ、オブジェクト3 :Trees)これらの画像をいくつかの分類を行うために抽出する可能性のある

    0

    1答えて

    ポイント、ライン、またはポリゴンとしてフィーチャタイプをカスタムレイヤに追加する必要があります。そのカスタムレイヤの名前はコンボボックスで選択します。 public void test(Coordinate coord,string ftype) { foreach (var item in map1.Layers) { if (item.LegendTe

    -1

    2答えて

    Rstudioの小さなデータセットでVIFを計算すると、次のエラーが発生します。誰でも助けてくれますか?必要に応じて、データセットに関する詳細情報を提供することができます。 "as.vector(y)のエラー - 平均(y)バイナリ 演算子への非数値引数"。 データセット:80 obs。 15個の変数(すべての変数が数値です)続く ステップ:ここで # 1. Determine correlati

    -2

    1答えて

    私は、画像ベースの画像登録アルゴリズムを実装しようとしています。私の見解では、マッチング操作の前に各特徴点(キーポイント)の記述が必要です。機能を記述することは必須ですか?はいの場合、なぜですか?親切に私を助けて ...

    -1

    2答えて

    単純な線形回帰のために、特徴の「組み合わせ」または「特徴間の」相互作用が考慮される特徴選択方法を使用したい。 SelectKBestはターゲットに対して1つずつフィーチャを1つずつ探し、ピアソンのR値でランク付けします。これは簡単ですが、機能間の重要なやりとりを無視しています。 再帰的なフィーチャリングの削除は、最初にすべてのフィーチャを使用し、線形回帰モデルに適合し、最小の絶対値係数でフィーチャ

    0

    3答えて

    私はclassificatorを構築するためのデータセットをしている:私は唯一の重要な機能を選択したい dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class']

    4

    4答えて

    Scikit-Learnから分散スレッショルドを実行した後、いくつかのフィーチャが削除されます。私は何かシンプルで愚かなことをしていると感じていますが、残っている機能の名前を残したいと思います。以下のコード: def VarianceThreshold_selector(data): selector = VarianceThreshold(.5) selector.fit(d

    0

    1答えて

    私はデータセットにBorutaを適用して、予測変数に関するフィーチャの重要性を判断しました。しかし、それはいくつかの機能の重要性を判断することができません。彼らは暫定的なものとして示されています。 PythonでTentativeRoughFixとしての機能はありますか? TentativeRoughFix関数はR言語で提供されています。そのような機能があれば、誰もそれに向かって私を導くことができ

    -2

    1答えて

    テキスト文書のための特徴空間のモデリングは非常に簡単です。 たとえば、テキスト(トレーニングデータ)のすべての単語をフィーチャとして使用できます。 特定の単語(例:「犬」)が(分類された)トレーニング例(スパムとして分類されているなど)で複数回出会う場合は、この単語を使用して新しいデータを分類できます。 私の機能をモデル化するにはどうすればいいですか? 私の場合、名前、年齢、家族のサイズなどの機能