2016-08-26 6 views
-1

私は目を見張るデータ科学者(現在のところソフトウェア開発者)ですが、私はちょうどこの(愚かな)考え方を持っています。機械学習技術を使用した理解による圧縮

これまでのところ(私が知る限り)標準的なエンコード方法をよりスマートに置き換えた圧縮アルゴリズムを使用しています。データを理解することで圧縮できたらどうなりますか?たとえば、元のデータを元に戻すことができる種類の抽象を生成します。

私たちの心がどのように機能するかを考えてください。アイデアを相互に関連付けることによって。

学習テクニックは、アルゴリズムによって生成された抽象から生成されるように、データ(およびそれがディスク上での表現方法)を学習し、理解することができますか?

+0

はい、そのようなアプローチと方法があります(主に画像用です。パターンが見つけやすいメディアです)、JPEGの意味で使用可能な圧縮方法から遠いですが、原則として可能。 – lejlot

答えて

0

確かに、解凍するために、関連と "理解"の表現をもう一方の端に移さなければなりません。その表現は、圧縮しようとしていたデータよりもはるかに大きいでしょう。

0

実際には、少なくともある程度はすでに実現しているような考え方が実際にはあります。

たとえば、Autoencoderは、元のデータ(デコーダ部分)の圧縮(エンコーダ部分)および再構築を可能にします。

このテクニックは、コンセプト/意味/理解を1つのベクトルに「エンコード」することで、あなたが記述したものになるというThought Vectorのアイデアと結びついています。