2017-12-07 9 views
0

にtxtファイルから不均一な空白を削除すると、フォーマットのは私が不均一に空白のテキストファイルを持っていると私はpig.Myファイルを使用してCSVファイルとして保存したい豚

2013 210  0 2878 -7543 4 29 20 116 
2013 210  10 2875 -7538 4 32 20 116 
2013 210  20 2872 -7533 4 29 20 116 
2013 210  30 2870 -7527 4 29 20 115 
2013 210  40 2867 -7522 4 30 20 115 
2013 210  50 2864 -7516 4 29 20 115 
2013 210  60 2861 -7511 4 29 20 115 
+1

ここで、「不均一な空白」はありますか?列デリミタとは何ですか? –

+0

'豚'とは何ですか?しかし、シェルでは 'tr's *" squeeze "オプションを使って複数のスペースを一つに圧縮することができます。' tr -s ''

答えて

0

であるあなたの場合値が1行であることを確認した後、正規表現でデータを絞り込み、STRSPLITを使用して1つのスペースで区切られたデータを分割します。

text_data = load 'file.txt' as line; 

squeezed_data = foreach text_data generate REPLACE(line, '\\s+', ' '); 
関連する問題