hiveql

    0

    3答えて

    HiveのデータベースサイズはBashまたはHive CLIからどのように決定されますか? hdfsおよびhadoopコマンドもBashで使用できます。

    0

    1答えて

    私には概念的な質問がたくさんあります。私はデータをプルするためにHiveを使用しています。次に、取得したすべての値をIBM BigSQL(基本的にはDB2)に挿入して、集計データがより簡単に/より速くなるようにします。だから私は夜間にCTASを実行してテーブルを取得し、それをdb2に移行して残りの集計を行うことができるように、Hiveでビューを作成したいと考えています。 より良い方法がありますか?

    0

    1答えて

    HIVE SQlでcase文を使用して2列のデータを比較する条件を割り当てています。 が、エラーの下に取得: はParseExceptionラインを4: 選択ext_date、BPID、BASE_PRICE、comp_price、 場合BASE_PRICE> comp_price:0は '' 'BASE_PRICE' '<' 式の仕様で クエリに近い入力を認識することはできません状態として、その後

    0

    1答えて

    mysqlと同様のハイブクエリでビット単位のORを実行する方法。 SELECT user_name, BIT_OR(file_permission) FROM user_permission GROUP BY user_name

    0

    1答えて

    executeUpdate()レコードが影響を受けるレコード数を返さないハイブドライバを使用しています。これが得られる別の方法がありますか?私たちは、さらなる処理のために記録された値を得る必要があります。

    1

    1答えて

    私は、ハープをハープと組み合わせて使用​​しています。私は、その日の最後/最初の値の差を許す関数(hiveql)を探しています。データは5分ごとに記録されています(ゲージまたはカウンターカウンター)各リソース名と私はリソース名(MAC)ごとに1日あたり1つの値を持つ集計したいと思います。 illustration

    2

    1答えて

    データセットはタブで区切られ、改行で改行されています。各行には5つのタブ区切りデータがあります。例えば、データセット 、 XXXX1 XXXX2 XXXX3 XXXX4 XXXX5 は今は残りの値XXXX3 XXXX4 XXXX5が含まれている必要があり、最初の行と3列のそれぞれについて値XXXX1とXXXX2を格納する3列の最初の2つの列を持つテーブルを作成する必要があります。 次のクエリを

    0

    1答えて

    私はこれのpython /スパーク機能によって作成された単一区切られた文字列があります: "。ダン|スージー・アン|ボブ singleStringOfDelimitedNames= '|'.join([str(x.asDict().values()[0]) for x in df3.collect()]) のは、それが言うとしましょうを 私は、私が作成したこのハイブUDFにこの文字列を渡し、

    1

    3答えて

    下のオラクルロジックをハイブに変換したいと思います。 ロジック: Select a.id,a.name,b.desc from table a left join table b on a.num between b.min_num and b.max_num; は、いずれかがハイブの上記のロジックを実現するために私を助けることができます。あなたは、パフォーマンス上のコントロールを持ってこの

    1

    1答えて

    私は、関連する投稿を行っており、インターネット上でこの特定の問題を見つけることができませんでした。 ハイブテーブル(Hiveの外部テーブルが寄木細工のファイルを指しています)を読み込もうとしていますが、スパークデータフレームがデータを読み込めず、スキーマを読み込めるだけです。しかし、同じハイブテーブルのために、私はハイブシェルからクエリできます。ハイブテーブルをデータフレームにロードしようとすると