2016-11-18 6 views
3

私は、parquet-tools.jar(https://github.com/Parquet/parquet-mr/tree/master/parquet-tools)を使用して寄木張りファイルから1つの列を印刷しようとしています。 私は、このコマンドを使用しています:parquet-tools jarを実行している引数が無効

java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME someParquet.parquet

をしかし、私は得る:

Invalid arguments: missing required arguments 

usage: parquet-dump [option...] <input> 
where option is one of: 
    -c,--column <arg> Dump only the given column, can be specified more than 
         once 
    -d,--disable-data Do not dump column data 
     --debug   Enable debug output 
    -h,--help   Show this help string 
    -m,--disable-meta Do not dump row group and page metadata 
     --no-color  Disable color output even if supported 
where <input> is the parquet file to print to stdout 

私は構文が間違って取得していますどこわかりません。

+0

おそらく、これらのスクリプトhttps://github.com/wesleypeck/parquet-tools/tree/master/src/main/scriptsを使用したいと思うかもしれません。ヘルプページで提案されているような構文になっているはずです –

+1

構文を正しく取得します。これは、Apache CLIライブラリのバグ、またはparquet-toolsの使い方のバグのようです。 – Zoltan

+0

私は同意し、apache cliの使用に問題があるようです。 '--column NAME'、' --column = NAME'などを試してみてください。 – borowis

答えて

2

オプション-c、 - columnは、 "dump"コマンドの引数として複数の列を指定し、すべての引数を取り込むことになっていると考えています。したがって、欠落している要件の引数の例外が表示されます。

解決策の1つとして、-cオプションの直後に追加のオプションを1つ追加する必要があることを示唆しています。これにより、CLIパーサーは-cオプションの予期しない引数を食い止めるようになります。

コマンド(追加--debugオプション)以下にすると、あなたがプログラムを実行することができるはずです。

java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME --debug someParquet.parquet 

あなたはあまりにも代わり--debugの--no-色を試すことができます。

これが役に立ちます。

関連する問題