移入2つのCSV

例と同じエントリ：赤方偏移の期待キー、D4、D5移入2つのCSV

：

CSV 1：キー、D1、D2、D3

CSV 2キーd1、d2、d3、d4、d5

これは可能ですか？あなたがそれをする方法を知っている場合は私に教えてください。しかし私の主な関心事は、それが始めることができるかどうかです。このような

2017-07-14 Marco

直接コピーができない、あなたは次のオプションがあります。

1）使用赤方偏移スペクトラムサービス - 外部スキーマを作成し、赤方偏移に所望のデータ構造を取得するために参加して、それを照会します。欠点は、1回のペイ・パー・ラン・サービスだということです。 2）CSVをPythonまたはAthenaで処理して、それらを目的のデータ構造に結合してからコピーします。

3）それらを別々に2つのステージングテーブルにインポートしてから、最終テーブルに結合します。欠点は、データが大きい場合は、2倍のスペースを確保することが問題になる可能性があることです（テーブルをステージングするテーブルと結果のテーブルを別々にする）が、単純にjoinを使用してビューを作成できます。

出典

2017-07-14 13:38:21 AlexYes

ありがとう、私は第二のものを避け、第三をやろうとしています。今私はスペクトルサービスを少し見ています。 – Marco

直接アクセスすることはできませんが、元のETLプロセスでオブジェクトを結合するか、Redshiftでステージングテーブルを使用してから、マテリアライズしてステージングテーブルを削除することができます。

出典

2017-07-14 13:39:58 Henry

ありがとう、私は今、どのようにそれを理解することができると思う、基本的に私はそれを行うには、全体のETLプロセスを通過することはできませんか？この方法では、内部結合を行い、後でロードするためにデータをEMRに移動する必要はありません。 – Marco

ちょうど赤方偏移の結合を行い、新しい結合された出力テーブルを作成し、それをEMRに送ります – Henry

移入2つのCSV

答えて

関連する問題