2011-01-19 7 views
2

HadoopとHBaseを使用したシステムセットアップと、Oracle DBをバックエンドとして使用してセットアップを比較しようとしています。私は物事のOracle側の知識が不足しているので、公正な比較に来る。重い負荷のためにOracleのセットアップが必要

作業負荷と非機能要件はおおよそ次のとおりです。
A)4時間以内に1つの単純な関係と複数の(非テキスト)インデックスを持つ2つのテーブルの12Mトランザクション。これは833トランザクション/秒(TPS)に相当し、持続します。これは8時間ごとに行う必要があります。

B)すべての書き込みが耐久性があることを確認してください(クラスタ化されたセットアップの場合、実行中のトランザクションがマシン障害を起こさないように)。まともなレベルの可用性では、ディスクや単一のネットワークインターフェイス/ TCP接続の切断などの定期的な障害は人間の介入を必要としないはずです。まれな障害には介入が必要な場合がありますが、すぐに引き継ぐことができるコールドスタンバイを起動するだけで解決する必要があります。

C)さらに300 TPSを追加しますが、これは多くのテーブルで24/7連続して発生します(ただし、すべて同じ2つの単純な関係と複数のインデックスを持つ2つのペア)。

一部のコンテキスト:このワークロードは24/7であり、システムはライブ問合せに使用可能な履歴データを10年間保持する必要があります。クエリのパフォーマンスは、1秒未満のものよりも少し悪いことがありますが、日々の使用については十分考慮する必要があります。 ETLジョブは、チャーンがほとんどないように設定されています。また、リレーショナル・セットアップでは、このワークロードによってロックの競合がほとんど発生しません。私は、インデックスの更新が大きな痛みであると予想します。できるだけ公平な比較を行うために、私はOracleが提供する最も緩やかな整合性レベルを期待しています。

私はOracleをバッシングするつもりはありません。私はそれが多くの用途に最適なデータベースだと思います。私はオープンソース(とNoSQL)と商用でサポートされている実績のあるセットアップとの間にトレードオフがあると感じています。

+0

http://dba.stackexchange.com/またはhttp://forums.oracle.com/forums/category.jspa?categoryID=18 – softveda

+0

のようなより多くのDB固有のサイトでこの質問をする必要があります公正なポイント。今やりました。 – FvV

答えて

3

これにはっきりと答えることはできません。

車を購入すると、トップスピード、加速、燃料消費量が独立したテストの値の数パーセント以内にあることがわかります。同じことは一般的なソフトウェアや特にデータベースには当てはまりません。

ハードウェア、OS、およびデータ構造の正確な詳細と、トランザクションと同様に格納されるデータ量の詳細を記述したとしても、パフォーマンスはパターンによって100倍に簡単に変化する可能性があります(レコードキャッシング、ディスク断片化のホットスポットの発生による) - のNoSQLデータベースの理由ドールのETREはパフォーマンスと並列である

1)必ずのNoSQLデータベースは、従来のDBMSをアウトパフォームします:

しかし、私が与えることができるいくつかのポインタがあることを述べました。これは、従来のDBMSが冗長であることを意味するものではなく、データとのやりとりに大きな柔軟性を提供します。

2)中規模から中規模のデータボリュームの場合、Oracleは他のリレーショナルデータベースに比べて比較的低速です。スケーラブルなソリューションとして、Oracle RACにはあまり感銘を受けていません。

3)私は、Oracle

4を実行している)$ 8K +の地域で何か(ワークロードが一貫性​​のある結果を得るためにミッドレンジサーバーが必要になると思われる)ホットスタンバイを持つことは、すべてをカバーする簡単な方法ですが多くの場合、RAID、複数のネットワークカード、UPSなどのアプローチは、同期されたクラスタを維持するという問題ではなく、リスク/コスト/メリットが優先されます。

5)サポート - 有料のサポートを提供する場合は、オープンソースソフトウェアパッケージの開発者に尋ねることがありますか? IMEでは、商用ソフトウェアのSLA/EULAは、顧客よりもベンダーを保護するためのものです。

あなたが考える価値があり、コストが大きな問題ではないと思うなら、最高の答えは自分で試してみることです。

+0

私は(1)は少し誇張だと思います。異なるニッチには多くのnoSQLデータベースがあります。ほとんどの人が目標とするニッチに対してより良いパフォーマンスを発揮します。文書データベースは、倉庫スタイルの分析ではあまり貧弱です。 –

1

ここで嫌なことはありませんが、Oracleの知識がほとんどない場合は、公正な比較を行う方法はありません。私は、比較テスト(ハードウェア/ソフトウェアのセットアップ変数はほとんど無限大です)についてセットアップを主張する経験豊富なOracle DBAとシステム管理者のチームと協力しました。通常、これらのテストは、インフラストラクチャーの方向性に関する重要な結論の正当化であった(金も重要な問題である)。

さらに、Hadoopの専門家チームを雇い、会社のデータインフラストラクチャを管理する予定ですか?オラクルは安価ではありませんが、あなたはハープ・アドオン/ dbasについてあまり確信していない、非常に熟練したオラクル・プロフェッショナル(DBAから開発者、アナリストまで)を見つけることができます...

思考のための食べ物Oracleのための仕事;)

関連する問題