これは、「実際には実現できない」または「本当に努力する価値がない」という領域に入る可能性がありますが、ここにはあります。マルチパートgzipファイルのランダムアクセス(Javaの場合)
複数パートのgzipファイル内に格納されているレコードにランダムにアクセスしようとしています。具体的には、私が興味を持っているファイルは、Heretrixアークファイルに圧縮されています。 (マルチパートのgzipファイルに精通していない場合、gzipの仕様では複数のgzipストリームを1つのgzipファイルに連結できます。辞書情報は共有されません。私はファイル内の特定のオフセットを探し、gzipマジックヘッダバイト(すなわち0x1f8b、RFC)をスキャンして、次のバイトからgzipストリームを読み込もうと試みることでこれを行うことができるはずだと思っています。このアプローチの問題は、同じバイトが実際のデータ内にも現れることがあるため、これらのバイトを探すことは、gzipストリームの読み込みを無効にする可能性があることです。レコードのオフセットが先験的に分かっていないとすれば、ランダムアクセスを処理するより良い方法はありますか?