2016-04-18 19 views
0

以下のリンクで説明したように、GeosparkはデータをCSV形式またはタブ区切り形式で受け取ります。 HDFSからデータを取り出し、CSVに変換してGeosparkに渡して処理することができます。Geospark:HDFSからデータを入力することは可能です

GeosparkをHDFSで直接使用して処理できますか?

https://github.com/DataSystemsLab/GeoSpark

GeoSparkは、入力形式としてカンマ区切り値(CSV)またはタブ区切り 値(TSV)のいずれかをサポートします。ユーザーは、 の形式をスプリッタとして指定し、1組の空間情報の開始列をコールコンストラクタのオフセットとして として指定する必要があります。

答えて

0

はい。あなたはGeoSparkを使ってそれを行うことができます。 GeoSparkはApache Sparkと同じデータソースをサポートしています。フォーマットに関しては、GeoSparkはCSV、TSV、WKT、GeoJSONをサポートしています。

関連する問題