寄木細工のファイルは、Avroファイルから作成されます。今、私はPegにParquetファイルをロードする必要があります。以下は私がparquet-tools schema
コマンドから得たスキーマです。ネストされた寄木細工のファイルをPigにロードしますか?
message Logs {
optional group SUPER1 {
optional group FIELD1 (LIST) {
repeated int32 array;
}
optional group FIELD2 (LIST) {
repeated int32 array;
}
}
optional group SUPER2 {
optional int32 FIELD1;
optional binary FIELD2 (UTF8);
optional double FIELD3;
optional int32 FIELD4;
optional double FIELD5;
optional binary FIELD6 (UTF8);
}
optional group SUPER3 {
required int32 FIELD1;
required int32 FIELD2;
optional binary FIELD3 (UTF8);
optional binary FIELD4 (UTF8);
}
required binary SUPER4 (UTF8);
optional binary SUPER5 (UTF8);
}
ここでは、このファイルを読み込むための同等のブタのスキーマを理解できません。私はparquet.pig.ParquetLoader
を使用しています。
- 配列のネストされたデータをロードする方法
chararray
- としてロードされます - :私は、次の変換をしましたか? bid_info.creative_idが機能していません:
mismatched input '.' expecting RIGHT_PAREN
- オプションの有無にかかわらず、すべてのフィールドが読み込まれています。オプションの値はPigにnullとしてロードする必要があります。
Iはまた、私はこのエラーを得た明示的なスキーマなく、簡単なローディングを使用してみました:
Failed to parse: Invalid list type optional group FIELD1 (LIST) {
repeated int32 array;
}