私は豚のデータをExcelやSQL(またはRやSPSSなど)で多くの操作を行うことなく使用することができます...豚からCSVへのエクスポート
私は次の関数を使用して試してみた:
STORE pig_object INTO '/Users/Name/Folder/pig_object.csv'
USING CSVExcelStorage(',','NO_MULTILINE','WINDOWS');
それは一部-M-0000#ファイルの多くとその名前のフォルダを作成します。私は後でそれらをcat part *> filename.csvを使って結合することができますが、ヘッダーはありません。これは手動で入力する必要があることを意味します。
PigStorageSchemaはヘッダー付きの別のビットを作成する予定ですが、まったく動作しないようです。たとえば、格納されている場合と同じ結果が得られます。ヘッダーファイルはありません。 STORE pig_object INTO '/ユーザー/名前/フォルダ/ pig_object' USING org.apache.pig.piggybank.storage.PigStorageSchema();
(私はこれをローカルモードとmapreduceモードの両方で試しました)。
これらの複数の手順を実行せずにPigからデータを単純なCSVファイルに取り込む方法はありますか?
ご協力いただければ幸いです。
おかげで非常に多くの、ロランシェルコマンドを呼び出すと、少し上の事が整理されます。しかし、-schema引数は、実行時に.pig_headerまたは.pig_schemaファイルを作成しません。私はPigStorageとPigStorageSchemaを使ってみました。私は豚0.10.0を実行しています。 – Saxivore
こんにちは、これ以上... .pig_headerファイルが作成されましたが、それは隠されていて、私はそれを見ることができませんでした(私はまだシェルのもので作業することに慣れています)。だから、私はスクリプト内で素晴らしいことができる回避策があります。ありがとう! – Saxivore
@Saxivore 'pig_object.'のスキーマをチェックします。もし存在しなければ、ヘッダファイルとスキーマファイルは作成されません。あなたはこの質問についてもう助けが必要ですか? –