2012-04-04 11 views
0

私はテキストファイルの総数を数えており、テキストファイルやその他のバイナリファイルを含むフォルダにはたくさんのファイルがあります。Windows環境でJava言語を使用してテキストファイルまたはバイナリファイルを判断する方法は?

ファイルがJava言語を使用するテキストファイルまたはバイナリファイルであるかどうかを判断するにはどうすればよいですか?

+0

名前の拡張子を見ることができます。あるいは、ヒューリスティックを使うことができます - UTF8か何かを仮定してファイルを読んで、バイトが型に合わないかどうか確認してください。 –

+0

これは宿題に関する質問ですか? –

答えて

0

プレーンテキストについて言えば、テキストファイルにはどのような文字が含まれていますか? 9(タブ)、10(改行)、13(改行)、32〜126(可読性文字)

テキストファイルは、このセットのcharの100%に近い比率を持つ必要があります。

一方、バイナリファイルはcharのセット全体を使用するため、比率が低くなる必要があります。また、バイナリには通常0の値が多く含まれています。

ファイルの種類を決めるのに100%確実な方法ではありませんが、十分であるはずです。

関連する問題