ファイルからのサブシーケンスの抽出 - Java - Fast Way

"ABCDEabcde ..... XYZxyz"のような文字列を含む大きなファイルがあります。さて、私はそれのいくつかのサブシーケンスを抽出したいと思います。たとえば、10番目の文字から50番目の文字まで、15番目の文字から55番目の文字（すべてのサブシーケンスは同じ長さであり、開始位置は常に増加しています）とします。誰でもJavaの速い方法でそれを行う方法を私に助けることができますか？そこファイルからのサブシーケンスの抽出 - Java - Fast Way

BufferedReader br = new BufferedReader(new FileReader(<FileName>), int size);

だけ入力バッファサイズとチェックしておく：

出典

2012-04-27 Arpssss

どのような提案ですか、どちらの方が速いのですか？ – Arpssss

私たちは何から選んでいますか？何を試しましたか？予想されるランタイム環境は何ですか？入力ファイルのサイズ制限はいくらですか？サブシーケンスサイズの制限はありますか？ –

@ColinD固定長のサブシーケンス、たとえばファイルの内容「My Name is」を選択しています。位置1から位置3までのサブシーケンス、つまり「My」を抽出します。 – Arpssss

ようれるMappedByteBufferとアクセスファイルを使用することができますそのチャンクだけであなたのsubStringsのために。何も見つからない場合は、それを破棄して次のチャンクに進みます。

出典

2012-04-27 19:04:47 noMAD

実際、私はそれを考えました。しかし、それは遅くなるはずです。私はこれを行うための一般的なバッファリーダー、ファイルリーダーなどよりも高速なアプローチを探しています。より速く組み込みのものを言うことができます。 – Arpssss

あなたはなぜこのような何かをしようとしないバイトのバッファ

http://docs.oracle.com/javase/7/docs/api/java/nio/MappedByteBuffer.html

RandomAccessFile raf = new RandomAccessFile(....); 
FileChannel fc = raf.getChannel(); 

MappedByteBuffer mmap = fc.map(READ_ONLY, 0, fc.size());

出典

2012-04-27 18:37:07 kofemann

ありがとうたくさんのtigran。 – Arpssss

これはファイル全体を 'ByteBuffer'にロードし、ガベージコレクタが呼び出されるまで保存しますか？ – noMAD

私はそれをチェックすると、ファイル全体をメモリにロードします。私にとっては不可能です。しかし、ありがとう。 – Arpssss

ファイルからのサブシーケンスの抽出 - Java - Fast Way

答えて

関連する問題