2016-05-24 6 views
0

いくつかのフラットファイルを使用してデータを統合しています。私はフラットファイルをビジネスパートナからのMS SQLエクスポートから.csvファイルとしてFTPで配信しています。正しくUTF-8でエンコードされたファイルをノートパッドで表示するには++

私は彼にUTF-8(私が思った標準を使用している)としてエンコードするように頼まれました。 私は彼のファイルで、 "&#2 3 3;"のようなUTF-8バイトをたくさん見ることができます。 (スペースなし)は、Notedpad ++(または私の "ETL"ツールを使用して)で開くとプレーンテキストとして見ることができます。

私は彼に適切なUTF-8にそれを修正するように依頼する前に、問題を理解したいと思います。

メモ帳で開かれたときに特別な文字を表示しないでください。++で、プレーンテキストのUTF-8コードではありませんか?

すべてのヘルプははるかに高く評価される:))

乾杯 マーティン

+0

実際にUTF-8がどのようなものであるかの定義については、[すべてのプログラマーが、エンコーディングと文字セットについて熟知していることが必要ですか?](http://kunststube.net/encoding/) ? – deceze

答えて

0

éHTMLエンティティです。何らかの理由で、テキストがHTML形式になっています。私は「平文」/フラットファイルとしてカウントしません。このファイルはUTF-8でエンコードされていてもエンコードされていなくても、与えられた情報からわかりません。

UTF-8でエンコードされた「特殊文字」(非ASCII文字を意味する)を含むファイルは、ファイルをUTF-8として正しく解釈するテキストエディタで開きます。例えば、

正式名称は、ISO/IEC 10646で "UCS変換フォーマット8"、Unicodeで "Unicode Transformation Format-8"とします。両者はISO/IEC 10646とUnicodeのコード重複範囲によって互換性があります。 RFCにも仕様があります。

これをファイルに入れて、UTF-8として保存し、別のアプリで開きますUTF-8 として、と書いてあります。これはテキストのようになります。

関連する問題