StringToWordVectorとは何ですか?私が知っているのは、文字列属性を複数の属性に変換するということだけです。しかし、これを行う利点と、StringToWordVectorクラスのオブジェクトがFilteredClassifierのフィルタとしてどのように機能するのでしょうか?どのようにフィルタになりましたか?WekaのStringToWordVector
-1
A
答えて
0
StringTOWordVectorは、文字列をWOrdTokenizerクラスを使用してNグラムにフィルタリングするwekaのフィルタクラスです。これは、分類器にN-gramとして文字列を提供するのに役立ちます。トークン化だけでなく、ストップワードを削除する、TFIDFで単語を重み付けする、出力単語数を表示するのではなく、刈り込み率、ステミング、単語の小文字変換などの機能も提供します。 http://weka.sourceforge.net/doc.dev/weka/filters/unsupervised/attribute/StringToWordVecing.htmlにあります。基本的には基本的な機能を提供しており、トレーニング前の要件に従ってトレーニングセットを微調整するのに役立ちます。
ただし、訓練と一緒にテストを実行したい人は、列車の互換性を保証するために、バッチフィルタまたはフィルタ分類器を使用する必要があります。&テストセット。これは、列&をStringToWordVectorを介して個別にテストに渡すと、列&テストセットの異なる語彙が生成されるためです。どの技法をバッチフィルタリングから除外するか決定するには&フィルタリングされた分級機は、Nihil Obstatの投稿に従います。http://jmgomezhidalgo.blogspot.in/2013/01/text-mining-in-weka-chaining-filters.html
希望します。
関連する問題
- 1. weka stringToWordVectorフィルタstringOptions
- 2. JavaのWEKAのstringtowordvectorが正しく
- 3. StringToWordVector()の出力を解釈する - Weka
- 4. WEKAクラシファイア評価
- 5. WEKAファイル形式
- 6. WEKAでのPMMLの生成
- 7. WekaのCSVへの予測
- 8. WEKAのJavaのIOException arff
- 9. Wekaのインスタンスの分類
- 10. Weka - csvフォームをダウンロード
- 11. Weka printing sparse arff file
- 12. wekaの単項クラステキスト分類?
- 13. wekaのSMO信頼度
- 14. Weka属性の選択
- 15. wekaでのテキスト分類
- 16. WekaモデルandroidのRead Error
- 17. Wekaデータ読み込みエラー
- 18. Wekaでの単一インスタンスの分類
- 19. WekaのSimpleLogisticとLogisticの相違
- 20. Wekaでのウェイトの使用方法
- 21. WEKAのJava APIのstringtovector例外
- 22. Weka Machineラーニング:ARFFファイル:複数の関係
- 23. クロスバリデーション(Weka)のカスタム折りたたみ
- 24. wekaの見えない公称値
- 25. のLinux WEKAと大きなファイル
- 26. WEKAのMultilayerPerceptron:訓練後、再びトレーニングを
- 27. WEKAとMySQL接続を設定する
- 28. WEKAなしメインクラス検出されたエラー
- 29. Weka Java API:統計的T分布
- 30. WekaにNominalToNumericフィルタがありません