0

私は約4,000のインスタンスを持つ約18のクラスを持つプロジェクトに取り組んでいます。私は7つの属性を持っています.1つは文字列データ、残りは名目値です。現在、PlattのSMOクラシファイアで文字列属性にStringToWordVectorを使用しており、良い結果が得られています。私たちはこれを実装しようとしていますが、より良い結果が得られるかもしれない場合に備えて、他の分類子を試してみたいと思います。助言がありますか?Weka分類プロジェクトStringToWordVectorとSMOを使用

また、多クラスのMultiClassClassifierを使用する必要がありますか?もしそうなら、私はその中でどのような設定を試みるべきですか?

アドバイスありがとうございます。

+0

は多項単純ベイズ分類器を試してみてください私たちの部門で確立された最良の結果が得られました。これは、SVMと同等の結果を与えるための好ましいテキスト分類です。それも速くなるでしょう。 –

+0

Multinomial Naive Bayesは、モデルを実行しようとしたときに受け取るエラーである、複数値の公称属性と互換性がありません。ナイーブベイズはSMOよりも約20%低い精度で実行されました。私はMuliClassClassifierとNaive Bayesの可能性をすべて試したわけではありませんが、パフォーマンスはそれほど良くありません。しかし、お勧めのおかげで! –

答えて

0

アンAdaBoosted J48のディシジョン・ツリーはよく

関連する問題