2017-02-27 3 views
0

私はHBaseを読んでテキスト形式のファイルに書き込む必要があります。 すべてうまく動作しますが、クライアントからの要件は、UTF-8-BOMエンコード形式のファイルを必要とすることです。 私は明示的にエンコーディングフォーマットを言及しておらず、デフォルトではUTF-8フォーマットとなっています。JUNK HADOOPでの外国語用のテキストパッドの文字mapreduce

UTF-8-BOM形式でファイルに書き込む方法はありますか。

私はmapreduceでこれらすべてをやっていると考えてください。

ドライバコードで以下の変更を試みましたが、UTF-8形式でも出てきました。事前に

hbaseConf.set("mapreduce.child.java.opts", "-Xmx6553m -Dfile.encoding=UTF-8-BOM"); 

おかげ..

答えて

0

余分なエンコーディングが設定に言及する必要はありません。 私は最初の行に "\ uFEFF"を付け加えて解決しました。それは私のためにうまくいきました。出力ファイルに余分な文字もありません。今はすべて良いです。

関連する問題