2016-05-16 22 views
-2

私は、同時に地理的位置の名前と座標が欠けている一連のデータセットを持っています。データの将来の分析を進めるために、ギャップを埋める必要があります。データセットはツイッターから収穫されますので、作成されたデータではありませんが、これはデータがどのようになっているかであり、何らかの形でギャップを埋める必要があります。データセットに欠けているジオロケーションを埋めるには?

オプション1:

userLocation, userTimezone, Coordinates, 
India,   Hawaii, {u'type': u'Point', u'coordinates': [73.8567, 18.5203]} 
California,  USA  
      ,  New Delhi, 
Ft. Sam Houston,Mountain Time (US & Canada),{u'type': u'Point', u'coordinates': [86.99643, 23.68088]} 
Kathmandu,Nepal, Kathmandu, {u'type': u'Point', u'coordinates': [85.3248024, 27.69765658]} 

予想される出力

userLocation, userTimezone, Coordinates_one, Coordinates_two 
    India,   Hawaii,   73.8567,   18.5203 
    California,  USA,   [fill this]  [fill this] 
    [Fill this], New Delhi,  [fill this]  [fill this] 
    Ft. Sam Houston,Mountain Time (US & Canada), 86.99643, 23.68088 
    Kathmandu,  Kathmandu,  85.3248024,  27.69765658 

がでスクリプトを記述することが可能です:私はcoordinates

入力を見つけることuserLocationuserTimezoneのいずれかを使用することができますPythonやpandasを使用して、欠落している場所名と座標を同時に入力し、出力を適切にフォーマットしますか?

私はPythonまたはPandasには魔法のパッケージがないことを理解していますが、まずは何かが役立つでしょう。

私はGISセクションでこの質問をしましたが、それ以上の助けはありません。ジオロケーションデータセットで作業するのは初めてのことですが、どのように始めるべきかわかりません。質問が適切でない場合は、投票停止の代わりにコメントを削除してください。

+1

私は[pandas fillna()](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html)をチェックしなければならないと思います [ ](http://pandas.pydata.org/pandas-docs/stable/missing_data.html) – Leo

答えて

1

他の人があなたのGIS質問に言及しているので、正確なものを作る魔法の方法はありませんが、私はgeopyで遊んでいます。私は、サンプルコードと出力がgeopyを実証し、あなたが欠落したデータをループすることができますと仮定します。

from geopy.geocoders import Nominatim 

geolocator = Nominatim() 

for location in ('California USA', 'New Delhi'): 
    geoloc = geolocator.geocode(location) 
    print location, ':', geoloc, geoloc.latitude, geoloc.longitude 

出力:

California USA : California, United States of America 36.7014631 -118.7559974 
New Delhi : New Delhi, New Delhi District, Delhi, India 28.6138967 77.2159562 

あなたは別のジオコードサービスを試してみたいことがあります(geopy docを参照)、いくつかのこれらのサービスの追加の引数を取ることができます。推薦は結果を特定の国に偏らせる "country_bias"キーワードを取ることができます。

+0

ありがとうございました!始めるべきことは素晴らしいです。 –

関連する問題