HadoopとHBaseを使用したシステムセットアップと、Oracle DBをバックエンドとして使用してセットアップを比較しようとしています。私は物事のOracle側の知識が不足しているので、公正な比較に来る。重い負荷のためにOracleのセットアップが必要
作業負荷と非機能要件はおおよそ次のとおりです。
A)4時間以内に1つの単純な関係と複数の(非テキスト)インデックスを持つ2つのテーブルの12Mトランザクション。これは833トランザクション/秒(TPS)に相当し、持続します。これは8時間ごとに行う必要があります。
B)すべての書き込みが耐久性があることを確認してください(クラスタ化されたセットアップの場合、実行中のトランザクションがマシン障害を起こさないように)。まともなレベルの可用性では、ディスクや単一のネットワークインターフェイス/ TCP接続の切断などの定期的な障害は人間の介入を必要としないはずです。まれな障害には介入が必要な場合がありますが、すぐに引き継ぐことができるコールドスタンバイを起動するだけで解決する必要があります。
C)さらに300 TPSを追加しますが、これは多くのテーブルで24/7連続して発生します(ただし、すべて同じ2つの単純な関係と複数のインデックスを持つ2つのペア)。
一部のコンテキスト:このワークロードは24/7であり、システムはライブ問合せに使用可能な履歴データを10年間保持する必要があります。クエリのパフォーマンスは、1秒未満のものよりも少し悪いことがありますが、日々の使用については十分考慮する必要があります。 ETLジョブは、チャーンがほとんどないように設定されています。また、リレーショナル・セットアップでは、このワークロードによってロックの競合がほとんど発生しません。私は、インデックスの更新が大きな痛みであると予想します。できるだけ公平な比較を行うために、私はOracleが提供する最も緩やかな整合性レベルを期待しています。
私はOracleをバッシングするつもりはありません。私はそれが多くの用途に最適なデータベースだと思います。私はオープンソース(とNoSQL)と商用でサポートされている実績のあるセットアップとの間にトレードオフがあると感じています。
http://dba.stackexchange.com/またはhttp://forums.oracle.com/forums/category.jspa?categoryID=18 – softveda
のようなより多くのDB固有のサイトでこの質問をする必要があります公正なポイント。今やりました。 – FvV