私は、同時に地理的位置の名前と座標が欠けている一連のデータセットを持っています。データの将来の分析を進めるために、ギャップを埋める必要があります。データセットはツイッターから収穫されますので、作成されたデータではありませんが、これはデータがどのようになっているかであり、何らかの形でギャップを埋める必要があります。データセットに欠けているジオロケーションを埋めるには?
オプション1:
userLocation, userTimezone, Coordinates,
India, Hawaii, {u'type': u'Point', u'coordinates': [73.8567, 18.5203]}
California, USA
, New Delhi,
Ft. Sam Houston,Mountain Time (US & Canada),{u'type': u'Point', u'coordinates': [86.99643, 23.68088]}
Kathmandu,Nepal, Kathmandu, {u'type': u'Point', u'coordinates': [85.3248024, 27.69765658]}
予想される出力
userLocation, userTimezone, Coordinates_one, Coordinates_two
India, Hawaii, 73.8567, 18.5203
California, USA, [fill this] [fill this]
[Fill this], New Delhi, [fill this] [fill this]
Ft. Sam Houston,Mountain Time (US & Canada), 86.99643, 23.68088
Kathmandu, Kathmandu, 85.3248024, 27.69765658
がでスクリプトを記述することが可能です:私はcoordinates
入力を見つけることuserLocation
とuserTimezone
のいずれかを使用することができますPythonやpandasを使用して、欠落している場所名と座標を同時に入力し、出力を適切にフォーマットしますか?
私はPythonまたはPandasには魔法のパッケージがないことを理解していますが、まずは何かが役立つでしょう。
私はGISセクションでこの質問をしましたが、それ以上の助けはありません。ジオロケーションデータセットで作業するのは初めてのことですが、どのように始めるべきかわかりません。質問が適切でない場合は、投票停止の代わりにコメントを削除してください。
私は[pandas fillna()](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html)をチェックしなければならないと思います [ ](http://pandas.pydata.org/pandas-docs/stable/missing_data.html) – Leo