まず、BigDataの機能について誤解を招くかもしれません。だから、あまりにも楽観的なら、私を訂正するのをためらってはいけません。BigDataワールド内のOLAPの最初のステップ
私は通常、特定の複雑な条件(いくつかのファクトテーブルへの参加)を満たしている特定の月の間、新しいクライアントの数を表示するような通常のKPIを使用します。
これらのリクエストは非常に動的なので、あらかじめ計算されたデータを予測する方法はありません。動的なレポートにはOLAPとMDXを使用します。動的な計算の価格はパフォーマンスです。ユーザーは通常、結果を1分以上待つ。
ここで私はBigDataに行きました。私はあいまいな結論に至るいくつかの記事、フォーラム、ドキュメントを読んだ。 BigDataには数秒でデータを処理するツールが用意されていますが、結合、事前協議などのBIタスクには適していません。ハープ・コンセプトなどの古典的なDWHはありません。
それにもかかわらず、それは理論です。私はKylinを見つけたので、実際に試してみることができます。私が掘り起こすほど、より多くの質問が出ます。それらの一部:
- プログラミングに関する知識(Java、Scala、Python)が必要ですか?
- 私はグラフィカルツールが必要ですか、sshアクセスで十分ですか?
- 私の100〜200ギガバイトのDB(ハードウェアの数)のニーズに合うハードウェア要件は何ですか?
- 最高のファイルシステム(ext4)は何ですか、私は気にする必要がありますか?
- RDBMSからデータを移行するにはどうすればよいですか?スマートETLはありますか?
- 最初に学ぶべき技術(豚、火花など)は何ですか?
実際に私は間違った質問をして構想を完全に誤解するかもしれませんが、良いリードを期待しています。 BIとBigdataの統合について、あなたが有用と考えるアドバイスをお気軽にお寄せください。
私は知っている約http://kylin.apache.org/docs15/index.html しかし、私はバックエンドのバックグラウンドなしでそれを試してみる気が気になりません。
コメントのようになります。 – Sunil