実行エンジンとしてSPARKを使用したImpala ORハイブ？

HDFSからデータを取得するWeb UIを設計したいと思います。 HDFSに保存されているこのデータを使用していくつかのレポートを生成したいと思います。私は自分のカスタムレポートフォーマットを持っています。私はデータをフェッチするためにREST APIを書いています。しかし、HIVEクエリを実行するとレイテンシの問題が発生するため、私はこれに対して異なるアプローチを望んでいます。実行エンジンとしてSPARKを使用したImpala ORハイブ？

テーブルを作成するためにIMPALAを使用します。しかし、IMPALAのRESTサポートについてはわかりません。
MRの代わりにHIVEを使用すると、実行エンジンとしてSPARKを使用します。。
spark-job-serverは、RESTサポートを提供し、SPARK-SQLでデータをフェッチします。

どちらのアプローチが適しているのでしょうか、それとももっと良いアプローチがありますか？私はこれで非常に新しいので、誰でも助けてください。

出典

2017-03-09 HardRocker

spark engineとspark-sqlの間で混乱しています。これはspark cli for SQL –

にとって間違っています。だから私はいくつかの読書の後に私の質問を変更しました。 – HardRocker

レイテンシが主な考慮事項である場合は、impalaを選択することをお勧めします。 hdfsのSQL処理に専念しています。あなたが達成しているREST APIとアプリケーションロジックについては、これは良いと思われます。example

出典

2017-03-12 02:07:22 Amos

実行エンジンとしてSPARKを使用したImpala ORハイブ？

答えて

関連する問題