HDFSからデータを取得するWeb UIを設計したいと思います。 HDFSに保存されているこのデータを使用していくつかのレポートを生成したいと思います。私は自分のカスタムレポートフォーマットを持っています。私はデータをフェッチするためにREST APIを書いています。しかし、HIVEクエリを実行するとレイテンシの問題が発生するため、私はこれに対して異なるアプローチを望んでいます。実行エンジンとしてSPARKを使用したImpala ORハイブ?
テーブルを作成するためにIMPALAを使用します。しかし、IMPALAのRESTサポートについてはわかりません。
MRの代わりにHIVEを使用すると、実行エンジンとしてSPARKを使用します。 。
spark-job-serverは、RESTサポートを提供し、SPARK-SQLでデータをフェッチします。
どちらのアプローチが適しているのでしょうか、それとももっと良いアプローチがありますか? 私はこれで非常に新しいので、誰でも助けてください。
spark engineとspark-sqlの間で混乱しています。これはspark cli for SQL –
にとって間違っています。だから私はいくつかの読書の後に私の質問を変更しました。 – HardRocker