Apache Pigで1回のパスでテーブルをピボットできるかどうかは疑問です。Apache Pigを使用したピボットテーブル
入力:
Id Column1 Column2 Column3
1 Row11 Row12 Row13
2 Row21 Row22 Row23
出力:
Id Name Value
1 Column1 Row11
1 Column2 Row12
1 Column3 Row13
2 Column1 Row21
2 Column2 Row22
2 Column3 Row23
実際のデータは、列の数十を持っています。
これをawkで1回実行してから、Hadoop Streamingで実行できます。しかし、私のコードの大部分はApache Pigですので、Pigでそれを効率的に実行できるかどうかは疑問です。