0
私はそれぞれ約40000バイトの2つの大きなバイト配列を持っています。配列は約90%類似しています。私は圧縮された配列を比較することによって約90%似ていることがまだ分かりましたが、できるだけそれらを圧縮したいと思います。これは達成可能ですか?類似性を維持しながら大きなバイト配列を圧縮する
私はそれぞれ約40000バイトの2つの大きなバイト配列を持っています。配列は約90%類似しています。私は圧縮された配列を比較することによって約90%似ていることがまだ分かりましたが、できるだけそれらを圧縮したいと思います。これは達成可能ですか?類似性を維持しながら大きなバイト配列を圧縮する
これらの両方に最適なハフマンを作成し、それを使用して圧縮することができます。同様の部品がすべて同じであることを100%保証するものではありませんが、それで十分であれば100%に近いです。
100%に近い値で十分です。確認してみるよ –