JUNK HADOOPでの外国語用のテキストパッドの文字mapreduce

私はHBaseを読んでテキスト形式のファイルに書き込む必要があります。すべてうまく動作しますが、クライアントからの要件は、UTF-8-BOMエンコード形式のファイルを必要とすることです。私は明示的にエンコーディングフォーマットを言及しておらず、デフォルトではUTF-8フォーマットとなっています。JUNK HADOOPでの外国語用のテキストパッドの文字mapreduce

UTF-8-BOM形式でファイルに書き込む方法はありますか。

私はmapreduceでこれらすべてをやっていると考えてください。

ドライバコードで以下の変更を試みましたが、UTF-8形式でも出てきました。事前に

hbaseConf.set("mapreduce.child.java.opts", "-Xmx6553m -Dfile.encoding=UTF-8-BOM");

おかげ..

出典

2017-02-27 SUDARSHAN

余分なエンコーディングが設定に言及する必要はありません。私は最初の行に "\ uFEFF"を付け加えて解決しました。それは私のためにうまくいきました。出力ファイルに余分な文字もありません。今はすべて良いです。

出典

2017-02-27 09:59:30 SUDARSHAN

JUNK HADOOPでの外国語用のテキストパッドの文字mapreduce

答えて

関連する問題