2016-06-12 8 views
0

私たちはCS学生で、私たちはGPのための推奨システムに取り組んでいます。 データセットにはユーザーと訪問した場所が含まれていますので、NLPを使用してその場所をアクティビティに変換します。 ex。 (モール - >ショッピング、クラブ - >遊ぶ...)など。 また、ユーザーがコメントを書き留めている場合、ユーザーはどのような活動をしているのか分かります。NLPを使用してチェックインとコメントから情報を抽出する

私たちはこの時点でちょっと迷っています。どこから始めるべきか、何を探し始めるべきかを知りたいですか?

ありがとうございました。

答えて

1

このタイプのほとんどの問題に、二つの経路があるように:書き込ま

ハンド:

最低の初期コストはまだ少なくともスケーラブルなアプローチは、各位置に関連付けられたアクションを定義渡すであろうあなたのデータセットを検索し、それらを辞書に格納します。ユニークな場所の数が少ない場合は、ほとんどすべての関連するアクションを簡単に実行できます。 Mechanical Turkのような雇用のためのタスクサービスも使用できます(低品質の関連付けを除外するために、各場所ごとに複数の回答を集約することをお勧めします)。

マシン抽出

他のアプローチは、例の大規模なセットに基づいて適切な場所を抽出/学ぶためにいくつかのNLPのアルゴリズムを使用することであろう。飽和データセットが存在しない場合は、独自のデータセットを作成する必要があります(これは、最初のアプローチと同様です)。コーパスを作成したら、セマンティクロールラベリングを行う必要があります。良い紹介はhereです。

関連する問題