data-warehouse

0熱

1答えて

私は公開用のAPIから見つかったデータからなる倉庫を構築しています。 &をデータを保存するために、構造化SQLデータベースに受け取っているJSONファイルを保存したいと思います。つまり、すべてのJSONコンテンツを1列に含めるべきではありません。内容は解析され、リレーショナルデータベースのさまざまな他のテーブルに格納されます。プロセスの観点から、私は次の操作を行う必要があります。SQLデータベー

0熱

1答えて

データウェアハウスなしで処理目的のデータを取得する回避策

私の組織では、データウェアハウスやデータ処理に使用される中間データストレージはありません。私は過去5年間のデータを毎日抽出する必要があります。結果をテーブルに挿入する複雑なストアドプロシージャを実行するために、そのデータを結合して最終出力を取得するクエリを作成します。その後、これらのテーブルを切り捨て、プロセスを再開します。データの量が増えている：は、以下のプロセスのグラフ表示です。これ

0熱

2答えて

データウェアハウスのサロゲートキーの管理

データウェアハウスを構築したいが、私のファクトテーブルの主キーとしてサロゲートキーを使用したい。しかし、問題は、私の場合、事実テーブルを更新する必要があるということです。最初の質問は、ソースシステムのナチュラルキーの対応する自動生成サロゲートキーを見つける方法です。私は、自然とサロゲートキーの間の対応関係を格納するルックアップテーブルに言及しているいくつかの答えを見てきましたが、どのように正確に

-2熱

2答えて

ファイル統合サービスのピックアップと、どのファイルをパラメータファイルとして使用するのですか？

私は、ファイル 'A'とファイル 'B'を変数として両方のファイルが異なる値を持っています。セッションレベルではファイルAを指定し、ファイルBはパスでワークフローレベルで指定します。ファイル統合サービスどのファイルがパラメータファイルとして使用されますか？

-1熱

1答えて

新しく採用されたデータの理解

私はデータウェアハウスを維持しなければならない新しい仕事を始めたばかりですが、会社のデータウェアハウスはeautomateやその他のソフトウェアからデータを取得するという問題があります。データウェアハウスのテーブル、私は何も理解していません。分析目的のために倉庫内のすべてのデータを理解するための最良のアイデアは何でしょうか？ eautomateの会社が会社のすべてのテーブルを構築しているように見え

1熱

1答えて

ジョインを含むテーブルで増分Sqoopを実行しますか？

ソースシステムデータウェアハウスからHDFSに変換しようとする非常に大きなテーブルがありますが、そのためには帯域幅が限られています。私は必要な列だけを引き出し、テーブルを起動するための実行時間を最小限に抑えたいと思います。 sqoopは現在、このような何かを引っ張る： SELECT ColumnA, ColumnB, .... ColumnN FROM

-2熱

2答えて

Amazon Redshiftと新しいAWS Glueデータウェアハウジングサービスの違いは何ですか？

私はこれら2つのサービスについて混乱しています。彼らは同じサービスを提供しているようだ。たぶん唯一の違いは、グルーカタログには広範囲のデータソースが含まれる可能性があるということです。それは、AWS GlueがRedshiftを置き換えることができるという意味ですか？

-3熱

1答えて

SQLデータウェアハウスとデータベースで作成されたテーブルの相違点

私はそれが非常にばかげた疑問に思えますが、データウェアハウスとデータベースで作成されたテーブルとそのプロパティがどのように異なるかを知りたいと思います。

-1熱

1答えて

ビッグデータウェアハウスと従来のデータウェアハウスの違い

通常、ビッグデータのコンテキストにおけるデータウェアハウスは、Apache Hive（右？）のようなHadoopベースのシステムに基づいて管理され、実装されます。一方、私の質問は方法論的プロセスに関するものです。大きなデータは、データウェアハウスの設計プロセスにどのように影響しますか？プロセスは類似しているか、新しいタスクを考慮する必要がありますか？

1熱

1答えて

データウェアハウスとMOLAPサーバーの相違

データウェアハウスとMOLAPサーバーの違いは何ですか？データはデータウェアハウスとMOLAPサーバーの両方に保存されていますか？クエリをポーズすると、データウェアハウスまたはMOLAPサーバーに送信されますか？ ROLAPを使用すると、ROLAPサーバーがデータウェアハウス（ファクトテーブルとディメンションテーブルを格納する）に対してSQLクエリを実行してから分析を行うことは意味があります。