2017-07-14 1 views
0

例と同じエントリ:赤方偏移の期待キー、D4、D5移入2つのCSV

CSV 1:キー、D1、D2、D3

CSV 2キーd1、d2、d3、d4、d5

これは可能ですか?あなたがそれをする方法を知っている場合は私に教えてください。しかし私の主な関心事は、それが始めることができるかどうかです。このような

答えて

0

直接コピーができない、あなたは次のオプションがあります。

1)使用赤方偏移スペクトラムサービス - 外部スキーマを作成し、赤方偏移に所望のデータ構造を取得するために参加して、それを照会します。欠点は、1回のペイ・パー・ラン・サービスだということです。 2)CSVをPythonまたはAthenaで処理して、それらを目的のデータ構造に結合してからコピーします。

3)それらを別々に2つのステージングテーブルにインポートしてから、最終テーブルに結合します。欠点は、データが大きい場合は、2倍のスペースを確保することが問題になる可能性があることです(テーブルをステージングするテーブルと結果のテーブルを別々にする)が、単純にjoinを使用してビューを作成できます。

+0

ありがとう、私は第二のものを避け、第三をやろうとしています。今私はスペクトルサービスを少し見ています。 – Marco

0

直接アクセスすることはできませんが、元のETLプロセスでオブジェクトを結合するか、Redshiftでステージングテーブルを使用してから、マテリアライズしてステージングテーブルを削除することができます。

+0

ありがとう、私は今、どのようにそれを理解することができると思う、基本的に私はそれを行うには、全体のETLプロセスを通過することはできませんか?この方法では、内部結合を行い、後でロードするためにデータをEMRに移動する必要はありません。 – Marco

+0

ちょうど赤方偏移の結合を行い、新しい結合された出力テーブルを作成し、それをEMRに送ります – Henry

関連する問題