2017-09-01 9 views
-2

私はこの巨大な文字列を持っています。圧縮できるかどうか、もしそうなら、どうすればよいのでしょうか。無駄なく大量の文字列を圧縮する良い方法

「01011311100111111112110131131011111110111011113111101101001110110110100110001001111003011011101111311102110011030111001311110113110111110111111111111111311103010001113110013100100101110000010111111111001000111111100001100030111111131113113101101001100111111100110100131001102101101110030300300011011111001111100010110011201111111011110011101011000011100013110101111003000131111012011131000000113111111311111001100111011111000101111101313111010000001131103011210111101001110010100113111311000111001100011110001000001111110001111111001010001011111100111000131000」

これはサンプルで、数千人は、より多くの行があります。助言がありますか?

+1

0000011111110000111は[0:5] [1:7] [0:4] [1:3](または同様のもの)になる可能性があります。このような大きな文字列の場合、これはそれほど短くなる可能性があります – Stultuske

+1

圧縮は十分に研究されたテーマであり、これを行うためのライブラリやツールがたくさんあります。[so]はあなた自身で研究することに代わるものではありません。 – Dukeling

+0

そのデータに基づいて、私はそのエンコーディングについて言います。もしあなたが0-9を必要とする時には、8ビットのcharを取ると256の可能な文字があります。あなたのロングのリスト/アリーを作成してください –

答えて

0

独自の圧縮アルゴリズムを実装する前に、すぐに使用できるソリューションを試すことをおすすめします。ここでは、十分に圧縮された結果が得られる場合は、java.util.zip.GZIPInputStreamjava.util.zip.GZIPOutputStreamを試してみることができます。あなたが結果に不満がある場合にのみ、自分のスキームを考えるかもしれません。

関連する問題