2017-02-11 20 views
2

s3ディレクトリにあるCSVファイルの基本的なSQLクエリを有効にしようとしています。 Prestoは自然にフィットするように見えました(ファイルは10 GBです)。私がPrestoのセットアップを行ったときに、Hiveコネクタを使用してテーブルを作成しようとしました。 Prestoでテーブル構成を保存するためにハイブのメタストアが必要なのか、最初にそこに作成する必要があるのか​​はわかりませんでした。PrestoとHive

ドキュメントでは、Hiveを設定せずにHive構文を使用してPrestoを使用できるように見えます。それは正確ですか? AWS S3は接続できませんでした。

+0

サイドノート:Prestoのサーバーレス実装である[Amazon Athena](http://docs.aws.amazon.com/athena/latest/ug/what-is.html)の使用を検討することもできます。しかし、現時点ではいくつかの地域にしか存在しません。 –

+0

Amazon Athenaを使用したいと思っていますが、私の特定のユースケース(医療)に準拠していません –

+0

AWS S3は接続できませんでした._問題は何ですか? Presto Hiveコネクタは、EC2マシンにS3へのアクセスを許可するためにIAMロールを使用する場合、S3(少なくとも 's3a://')をサポートしています。 –

答えて

0

Presto構文は、Hive構文に似ています。ほとんどの簡単なクエリでは、同じ構文が両方で機能します。しかし、PrestoとHiveを全く同じものにする重要な違いがいくつかあります。たとえば、HiveではLATERAL VIEW EXPLODEを使用し、PrestoではCROSS JOIN UNNESTを使用します。両者の間には微妙な構文的違いの例がたくさんあります。