2012-02-09 9 views
1

複数ページのASCIIファイルがありますが、このファイルを1ページのASCIIファイルに分割する必要があります。複数ページのASCIIファイルを分割する

各ページの最後に改ページを挿入する必要があります。私の元々の考えは、ページ区切りまで読み込み、ファイルに出力することですが、どのようにしてページ区切りに読み込ませ、そのページ区切りから次のページ区切りまで読むことを続けますか?あるいは、これをやるための別の簡単な方法がありますか?

+0

元のファイルでは、ページと次のページをどのように区別しますか? – chepner

+0

私は16進文字が何であるかを見るためにファイル自体をチェックする方法はありませんが、それはフォームフィードだと思います – Mechaflash

答えて

6

csplitは、ファイルを正規表現で分割することができます。

+0

特殊文字の正規表現リストを見て、ページ区切りには表示されません。そこは? – Mechaflash

+0

文字自体はいつでも指定できます。 FFはU + 000Cです。 –

+0

この回答は、私が求めていたものにぴったりです。さらに掘り下げた後、ページを分離するための改ページ/ページブレイクではなく、複数のキャリッジリターンを使用していることが判明しました(...ダム)。幸いなことに、このファイルは1ページに67行のフォーマットがされているので、ページ数に 'split'を使うことができました。残念ながら、これらのファイルの出力形式を変更することはできません。さもなければ、私は=( – Mechaflash

関連する問題