etl

    0

    1答えて

    私は、result_slalomテーブルを持っています。ここでは、データはPentahoのETL Jobsを介して入力されます。 ETLを初めて実行すると、バージョン1が作成されます。 新しい計算後にデータが変更されると、バージョン2になります。 計算バージョン-2でのみ変更する必要があります.2つ以上のバージョンをresult_slalomテーブルに追加する必要があります。 (バージョン-1およ

    0

    1答えて

    私はsubscriptionテーブルと私が参加する必要があるpaymentsテーブルがあります。 私は2つのオプションの間で決定しようとしており、パフォーマンスが重要な考慮事項です。 以下の2つのオプションのどちらが優れていますか? のみグループ毎idとdate(従ってrow_number()分析機能)ごとに1つの行を取得するために私が必要としています私がインパラを使用していて、これらのテーブルは

    1

    2答えて

    私は360GBの圧縮(gzip)のパイプ区切りテキストファイルを持っています。 1,620を超える列があります。私は正確なフィールド名を示すが、ここではそれが基本的に何をすることはできません。 primary_key|property1_name|property1_value|property800_name|property800_value 12345|is_male|1|is_colle

    2

    1答えて

    私は比較的新しいAzureに慣れ親しんでおり、既存のSQLデータベースに接続してデータをそこにプッシュするためのオプションが見つからないのです。 私たちはAzure SQLデータベースに接続して、データを継続的にプッシュする必要のある外部クライアントを抱えているという状況があります。私たちはデータベースにアクセスする許可を与えることはできないので、データを入力できるようにすることができます。この時

    -1

    1答えて

    毎日実行されるETLプロセス(CSV to SQLデータベース)がありますが、ソース内のデータが変更されることがあるため、翌日に更新ファイル。 すべての相違点を見つけるためにSQL文を書くにはどうすればよいですか? たとえば、のはTable_1はFK_1、FK_2とFK_3からなる複合PRIMARY KEYを持っているとしましょう。 これはSQLまたはETLプロセスで行いますか? ありがとうござい

    0

    2答えて

    にSSIS 2つのCSVファイルを、私は別のヘッダとデータが含まれている2つのCSVファイル持っている(下記は一例です) CSV1 Name|PhoneExt|location john,6754,office CSV2 EmployeeNo|Car|Reg 6754,astra,dk096hy 私が欲しいです2つのcsvファイルを結合し、csv 1の電話番号とcsv 2の従業員番号を

    0

    1答えて

    私はDataStageについてよく知らないことを前提にしています。 他の誰かが "ETLジョブ"を作成し、Javaプログラムから起動してクライアントとして動作する必要があることを知っています。 どうすればよいですか? 編集: のDataStageサーバーは、Javaプログラムが実行されるクライアントからのphisically異なっています。私はDataStageサーバーで実行中のコマンドを許可され

    0

    2答えて

    foreach loopコンテナを使用してパッケージを構築しました。その内にFile System Taskがあります。これは、複数のファイルを移動して名前を変更することになっています。 私はいくつかのソースとデスティネーションの変数を使用しています。ファイル名。変数はきれいに定義されているようです。すべてがVドライブを指しています。 パッケージを実行しようとすると、それはエラーを与える: "[F

    6

    1答えて

    私は添付ファイルとしてExcelファイルを生成し、SSISパッケージのスクリプトタスクでメーラーを生成するために、EPPlus.dllライブラリを使用しています。 メーラに変更が必要な場合は、ローカルマシンのスクリプトタスクの変更を行い、ビルドされたパッケージファイル(.dtsx)をDBAチームに送信して展開します。 オープンDLLの場所 追加するにはVisual Studioのデータツールでファ

    -2

    2答えて

    私は、ファイル 'A'とファイル 'B'を変数として両方のファイルが異なる値を持っています。セッションレベルではファイルAを指定し、ファイルBはパスでワークフローレベルで指定します。ファイル統合サービスどのファイルがパラメータファイルとして使用されますか?