2017-08-24 5 views
0
Select ACCOUNT_NUMBER, BIN AS RISK_BIN FROM test.daily_call_routing2;" 
| python -c 'exec("import sys;import csv;reader = csv.reader(sys.stdin, 
dialect=csv.excel_tab);writer = csv.writer(sys.stdout, 
dialect=csv.excel)\nfor row in reader: writer.writerow(row)")' > 
$EXPORT_DIR//home/rabbid160/test_$DATE_STR.csv;** 

私はビーラインハイブで上記のコマンドを実行しようとしていますが、その間に複数のヘッダを持つデータを見ることができます。誰もがこれがどのように1つのヘッダーとデータだけに解決できるのか教えてください。ハイブラインで重複するヘッダを削除する

Example as follows: 

+ ------------------- + ----------- + - +
| account_number | risk_bin |
+ ------------------- + ----------- + - +
| 8498310230444304 | 2 |
| | 8778104140754717 | 2 |
| 8155100513664825 | 2 |
| 8155100513664825 | 2 |
| | 8155400040004812 | 2 |
| 8155200521190266 | 2 |
| | 8155300210482543 | 2 |
| 8497202241094288 | 2 |
| | 8155500010197049 | 2 |
+ ------------------- + ----------- + - +
| account_number | risk_bin |
+ ------------------- + ----------- + - +
| 8155100030718781 | 2 |
| 8495444731138751 | 2 |
| 8498320015120250 | 2 |
| 8498330360083177 | 2 |
| | 8155300210487112 | 2 |
| 8777701821146336 | 2 |
| 8497202461586765 | 2 |
| | 8155400310837610 | 2 |

答えて

0

ビーラインでは、ヘッダーを繰り返す必要がある行の数は、変数headerintervalによって定義されます。

あなたはおそらく、あなたが一度だけヘッダを見ることができますように大きな値に真っすぐコマンドに!set headerinterval 100

セットheaderintervalを使用してheaderintervalを設定することができます。