現在、非常に大きなデータセット(10億ドル)からデータを効果的に格納および取得する方法に問題があります。私たちはmysqlを使用しており、システム、OS、RAID、クエリ、インデックスなどを最適化しており、現在移行を検討しています。非常に大きなデータセット(リレーショナルDBを超えて)を格納およびクエリする方法
私は、データの問題を解決するためにどの技術を追求するかについて十分な情報を得て決定する必要があります。私はHDFSでmap/reduceを調べていますが、HBaseについても良いことを聞いています。私は助けることはできませんが、他のオプションもあると思います。利用可能な技術と、それぞれのトレードオフを比較することができますか?
それぞれに共有するリンクがある場合は、私もそれを感謝します。