2016-03-22 16 views
0

は、私は全体のディレクトリ内のすべてのCSVファイルのすべてのエンコーディングを見て*ファイルのエンコード、文字セット=バイナリ

ファイル-Iで

を入力しました。ファイルエンコードの多くはcharset = binaryです。私はこのエンコーディング形式にあまり慣れていません。

誰もこのエンコーディングを処理する方法を知っていますか?

ありがとうございます。

答えて

2

"バイナリ"エンコーディングは、エンコーディングがが不明であることを意味します。です。

すべてがバイナリデータフードの下にあります。テキストファイルでは、各バイトまたは一連のバイトが特定の文字を表し、特にどの文字がエンコードエンコードに依存するかは、ファイルが/でエンコードされていることです。一部のエンコーディングは明白に認識可能であり、他のエンコーディングは認識できません(たとえば、任意のファイルがシングルバイトエンコーディングで有効な場合、別のエンコーディングとの簡単な区別はできません)。 がcharset=binaryと言っているのは、ファイルにビットとバイトが含まれているという特定の情報がないということです(救済策を明らかにするCapt'n)。ファイルを正しいエンコーディングで解釈し、正しいファイル形式と解釈するのはあなた次第です。