2012-04-16 8 views
2

私は学部生です。私の卒業論文では、SVMを使用してバスの到着時間を予測しています。多くの研究をしていくつかの論文を読んだ後も、私は自分のシステムをどのようにモデル化するかについて疑問を抱いています。入力としての機能の使用とSVMでの複数のマシンの構築

回帰を実行するために必要なデータを収集する過程で使用する機能を決定しましたが、SVMまたは建物の入力としていくつかの機能を使用することの影響または影響が混乱していますこれらの機能のいくつかに基づいてオフラッシュ晴れた日には時間とオフラッシュの最後の1、雨の日晴れの日の通勤時間帯に1つ、ラッシュアワー:

例えば、このpaperで著者は、バスの到着時刻を予測するための4つのSVMをを建て時間と雨の日。

同じサブセクションのfollowing paperでは、気象条件とラッシュ/オフラッシュ時間を入力として4つのSVMで分割するのではなく、1つのSVMを使用することに決めました。

私はこれが経験に関するものであると感じていますので、誰かがこれらのアプローチのいずれかをいつ選択するかについての情報があればお聞きしたいと思います。

ありがとうございます。

答えて

0

他の方法はありません。自分で見つけなければなりません。このため、この論文を書く必要があります。誰も完璧なソリューションから始めるわけではありません。誰でも間違いはある。あなたの問題は簡単ではなく、あなたは何も似たようなことをしたことがないときに何がうまくいくと言うことができません。あなたが文献で見つけたものをすべて試し、結果を比較し、自分のアイデアを開発してください...

+0

ハム....ええ、私はそう思った。しかし、私は完璧な解決策を見つけるつもりはありません。私は各データに独自の特徴があり、最も適切な値を見つけるためにパラメータを微調整する必要があることを知っています。私は誰もが前にこのような状況に直面しなければならないか、彼らはそれから何を学んだのだろうかと思っています。 –

0

最も重要な質問:どのようなデータですか? 2番目の質問:このモデルをどのモデルで取得する予定ですか?

何らかの理由でSVMを使いたいのであれば、その基本的な仕組みは線形であり、データが適切なカーネルで変換されている場合にのみ非線形現象を捕捉できることに注意してください。意味手元にある特定の問題については

  1. をあなたはあなたの問題は、線形(LY分離可能)であると信じる理由(問題の性質上、プロット、洞察力)を持っていますか?ただ1つのリニアSVMを使用してください。
  2. 問題がいくつかの線形部分問題で構成されている理由はありますか?各部分問題に対して線形SVMを使用します。
  3. データが非線形にグループ化されているように見えますか? rbfカーネルのようなものでsvmを試してみてください。

もちろん、プラグインして試しても問題ありませんが、上記を確認することで問題の理解を深めることができます。

0

あなたの特に問題では、私は単一のSVMに行きます。

私の経験はあまりありませんが、次の理由でいくつかのSVMで問題を解くことを検討しています: 1)クラスが多すぎるか、問題にクラスとサブクラスがあります。 など。私の場合:顕微鏡画像にはいくつかのタイプの抗体があり、それらはすべて陽性または陰性である可能性があります。そこで、A_Pos、A_Neg、B_Pos、B_Neg、...を定義するのではなく、最初に画像が正か負かを判断し、2番目のSVMで型を決定します。

2)特徴抽出が高すぎます。あなたが発熱の特徴で特定されるかもしれないクラスのグループを持っていれば。 1台のマシンのすべてのフィーチャーを抽出するのではなく、最初に小さなサブセットのみを抽出し、必要に応じて(十分な確率で結果が得られない場合)、さらにフィーチャーを抽出することができます。

3)インスタンスが問題に属しているかどうかを決定します。 1つのクラスとトレーニングセットのすべてのインスタンスを含むモデルを作成します。分類されるインスタンスが異常値である場合は、停止します。それ以外の場合は、すべてのクラスを含む2番目のSVMで分類します。

キーワードは「カスケードSVM」

関連する問題