私はエンジェルリストDBを使用して業界に基づいたスタートアップを分類しています。これらのスタートアップはほとんどの場合誤っているコミュニティ入力に基づいて分類されています。説明からスタートアップの業界を探す
私のビジネスの目的は、この特定のスタートアップが、私は、私は300のスタートアップを押しAzureの機械学習、で実験LinkedInのシートにhttps://developer.linkedin.com/docs/reference/industry-codes
を指定した産業の一つにマッピングするために属している業界に示すキーワードを抽出することですキーワード抽出は非常に悪く、私が達成しようとしているものにも近くないと分析されました。
データ科学者がこの問題にどのようにアプローチするのか知りたいですか?どこを見たらいいですか?私はどこにいけないのですか? Google Adwordsキーワードプランナーのようなキーワード分析ツールは、実行可能なオプションです
あなたが目指していることを完全な例で明確にすることはできますか? – mjalajel
クラスタリングのためのアルゴリズム:http://blog.funderbeam。com/5-competitive-startup-clustering-skills/ – user1808924
http://cs.stackexchange.com/q/55138/755 –