Apache Spark SQLとMongoDBの違いは？

私はRDBMS PostgresSQLでしか経験していませんが、Apache SparkとMongoDBに新しいです。
私は次の混乱を抱いています。

Apache Spark SQLとMongoDBの違いは？

1）Apache Spark SQLとMongoDBの違いは何ですか？
2）SparkSQL、MongoDB、または組み合わせた方法を使用するには、どのような場所/シナリオ/ドメインが必要ですか？
3）Apache Sparkは、mondoDB、cassandra ...のように置き換えられますか？
4）MongoDBに複数テラバイトのデータがあることから、私はデータ分析を行い、レポートを提供する必要があります。

だから、私にあなたの知識を共有し、私に

よろしく
シャンカールS

出典

2016-09-23 Shankar S

1） Apacheのスパーク：SQLクエリでビッグデータに並列計算操作を行うための Apacheのスパーク。

MongoDBの： MongoDBはドキュメントストアであり、本質的にので、コンピューティングエンジンはなく店舗でスパークと比較することができないデータベースです。

2） SparkSQLは、あなたは大きなコンピューティングのための利用可能なデータの何百万を持っているスパーククラスタにインポート処理構造データのための理想的なことができます。 Mongodbは、NoSQLの機能が必要な場所で使用できます（NoSQLの完全な機能があり、SparkSQLと比較しています）。

3）ませんApacheのスパークは、異なる目的のために使用され、あなたがmondoDBでそれを置き換えることはできません、cassandra.Itはあなたがlarge data sets

4）使用上の結果を予測与えるためにエンジンを計算するようなものですSLAM DATA http://slamdata.com/のようなサードパーティのサービスもmongodbアナリティクスを適用するためにスパークデータフレームを使用してMongoDBからデータを読み込みます。

出典

2016-09-23 07:01:14

ありがとう、Wasiq Muhammad –

これらは、2つの異なる広範な質問ですが、私は試みが答えるように作っています、あなたの入力をお願いします： -

1）どのようなApache Spark SQLとMongoDBの違いは？

スパークSQLは、SQLクエリでビッグデータに対して並列コンピューティング操作を実行するためにApache Sparkによって提供されるライブラリです。 MongoDBはドキュメントストアであり、基本的にデータベースなので、コンピューティングエンジンでありストアではないSparkと比較することはできません。

2）SparkSQL、MongoDB、または組み合わせた方法を使用するには、どのような場所/シナリオ/ドメインが必要ですか？

SparkSQLは、Spark Clusterでインポートされた構造データの処理に最適です。 Mongodbは、NoSQLの機能が必要な場所で理想的です（SparkSQLと比較して、NoSQLの機能を完全に備えています）。

3）Apache SparkはmondoDB、cassandra ...のように置き換えられますか？

異なるスコープにあるため正確ではありません。 Apache Sparkは置き換えられませんが、大きなデータセットの並列計算のためにMap-reduceの後継として呼び出すことができます。

4）私はMongoDBに複数テラバイトのデータを持っているので、私はデータ分析を行い、レポートを提供する必要があります。

jdbcドライバを使用してMongoDBからデータを読み込み、データフレーム上でいくつかのSpark SQLクエリを実行し、pyplotのような他の視覚化ツールを使用してレポートを生成することができます。

ありがとう、

チャールズ。

出典

2016-09-23 06:46:47

チャールズ。私の場合、MongoDBクラスタには何百万ものレコードがあります。そのレコードから集計、集計、合計、グループバイ、ソートの操作を行いたいと思います。その後、集約されたデータはいくつかのグラフツールを提供する必要があります。これは全体的な作業です。あなたの入力から私はこのように理解しました。 1）mongoDBクラスタのデータをSpark Clusterにロードします。 2）Spark ClusterからSparkSQLへデータを取得する必要があります。 3）その後、SparkSQLを使用して、集計、集計、合計、並べ替え操作を行う必要があります。 4）集計、合計、並べ替え操作が完了したら、それらのデータをグラフツールに提供する必要があります右か？ –

Apache Spark SQLとMongoDBの違いは？

答えて

関連する問題