2016-05-16 11 views
0

私はまだPythonとPandasの新機能を持ち、今後の進め方はわかりません。他の2つのデータフレームに基づいて新しいデータフレームを作成

基本的な概要:私は位置推薦システムを作成する必要があります。私は、venueIDsub(!)categoryIDを持ついくつかの正方形のデータを与えられました。しかし私の推薦では、メインカテゴリーのすべてのデータを考慮する必要があります。ですから、どういうわけか私は主なカテゴリーを私の会場に割り当てる必要があります。

マイフォースクエアのデータフレームは、次のようになります。私はすでにメインカテゴリとそのサブカテゴリを持つデータフレームを作成している

UserID VenueID CategoryID CategoryName  
470 49bbd6c0f964a520f4531fe3 4bf58dd8d48988d127951735 Arts & Crafts Store 
979 4a43c0aef964a520c6a61fe3 4bf58dd8d48988d1df941735 Bridge 
69 4c5cc7b485a1e21e00d35711 4bf58dd8d48988d103941735 Home (private) 

Main Category Name   Main Category ID   Sub Categories Name   Sub Categories ID 
0 Arts & Entertainment 4d4b7104d754a06370d81259    Amphitheater 56aa371be4b08b9a8d5734db 
1 Arts & Entertainment 4d4b7104d754a06370d81259     Aquarium 4fceea171983d5d06c3e9823 
2 Arts & Entertainment 4d4b7104d754a06370d81259      Arcade 4bf58dd8d48988d1e1931735 

だから、基本的に私がしたい:VenueID's Category ID場合(フォースクエアからdf)がcategories_dfにある場合、venueIDを対応するメインcategory IDと新しいデータフレームで書き込みます。私はあなたが私が意味することを理解できないことを願っています。

私はちょうど私の推薦のために主要なカテゴリを使用したいと思うし、サブカテゴリを考慮しません。

ありがとうございます!

答えて

0

チェックアウトpandas.DataFrame.merge

df_foursquare.merge(df_categories, how='left', left_on=['CategoryID'], right_on=['Sub Categories ID']) 
+0

どうもありがとうございました。これはまさに私が欲しかったものです。私はすでにSQLのすべての時間を考える必要があり、どのようにSQLでそれをやるのだろう... ^^ – Paprikamann

関連する問題