私は現在、古い投稿/カテゴリから訓練するシステムをセットアップし、新しい投稿がどのカテゴリになるか予測しようとしています。 TfidfVectorizer
とLinearSVC
のパイプラインを使用してデータセットをトレーニングし、そのデータセットをピクルに格納してから、そのピクルをロードしてロード済みピクルスのpredict
を使用して新しいポストを処理します。現在、私はいくつかのラベルで苦労しており、理由はわかりません。抽出時にWHYラベルを選択しましたか?
私は、各分類ラベルの新しい投稿でどのような単語がトリガーされたかについていくつかの出力を提供したいので、新しいデータをトレーニングセットに対して分類する際に特定のラベルが選択された理由がわかりましたが、これをする。
私はトレーニング中に私のベクタライザで最高の機能を出力できることを知っていますが、基本的にという理由をに出力するにはどうすればいいですか?
これは通常、マシン学習モデルでは実行できないもので、一般的にはベクトルマシンをサポートするものでもありません。その目的のためにデシジョンツリークラシファイアを使用する方が便利かもしれません。 – Zafi