2016-12-20 4 views
0

私は短いテキスト(メールの件名)を持っており、その成功を示す値(その人がそのメールを開く)を持っています。教師付きテキストスコアリング

将来のテキストをスコアリングするための予測実験を生成するために、機械学習実験にデータを供給するのに最適なプロセスとアルゴリズムは何ですか?

答えて

0

まず、テキスト情報を特徴空間に変換し、適切な機械学習アルゴリズムを使用して分類子を構築する必要があります。

IMHOテキストからフィーチャを計算する最適なアルゴリズムは、GoogleのWord2Vec https://en.wikipedia.org/wiki/Word2vecです。

0

Azure MLには、フィーチャリング用のテキストモジュールが組み込まれています。あなたが見るべきものはProprocess TextとN-gram Featuerizerです。

関連する問題