私は、私が持っているデータを使って、私のマシン学習モデルにどのような機能があるのかを研究しています。私のデータには多くのテキストデータが含まれているので、貴重な機能を抽出する方法が不思議でした。私のこれまでの考え方とは異なり、これはしばしばBag-of-wordsやword2vecのような表現で構成されています:(http://scikit-learn.org/stable/modules/feature_extraction.html#text-feature-extraction)機械学習モデルの機能としてテキストセンチメントを使用しますか?
なぜ私の理解は限られているのですか?最初に数値を取得します。 (例:textBlob.sentiment = https://textblob.readthedocs.io/en/dev/、Google Clouds Natural Language = https://cloud.google.com/natural-language/)
これに問題がありますか、またはこれらの値をマシン学習モデルの機能として使用できますか?
ご協力いただきありがとうございます!
ありがとうございます!感謝します、ありがとう。私はyoutube、twitterとfacebookからのuserdataに基づいて映画の箱入りの成功を予測するモデルを作っています。感情は貴重なものだと私は思います。また、私の場合、テキストをクラスタリングすることも可能ですか? – Lourens
いいえ、あなたの問題はクラスタリングではありませんが、成功を測定する方法に基づいて回帰または分類タスクの基礎になります。感情分析があなたの問題を解決すると思います。なぜなら、ユーザのコメントが興行収入よりも映画について肯定的であれば、それは本当に成功し、逆もまた同様です。 –