SparkのJoinsとLookupの議論について誰かが気づいているのですか?私はこのページを見ました:Lookup in spark dataframes誰もが基本的には、ジョインはルックアップよりはるかに優れていると言います。私はgoogle-fuの試みでそれを裏づけるものを見つけたり、2つのトピックについて議論したりしていませんでした。SparkのLookupとJoinの違い
0
A
答えて
1
Spark DataFrameのルックアップなどは存在しないため、他のソリューションや結合(ハッシュまたはブロードキャスト)より劣っているか、ローカルデータ構造を使用することが唯一の選択肢です。
0
ルックアップと結合は、リレーショナルデータシステムの2つの異なる概念です。したがって、一般的な文脈では、異なる機能を持つため、他のものよりも優れていると言うのは実際には意味をなさない。ルックアップは単にデータを見つけることであり、キーやハッシュ値を使用してクエリ速度を最適化することもあります。結合は、2つのデータセットの共通要素を使用して新しいデータセットを作成しています。
など。
検索クエリ(完全に仮想的な抽象)1
= 'こんにちは'
参加クエリ1、クエリ2
=
「こんにちは世界
の場合クエリ2はワールド
関連する問題
- 1. Apache Sparkのlookup()関数
- 2. Spark DataSetとRDDの違い
- 3. Spark mllib:implicitTrainとexplicitTrainの違い
- 4. JoinとSQLのUNIONの違い
- 5. 休止状態のLEFT JOINとLEFT JOIN FETCHの違いは?
- 6. JoinとNatural Joinの違いは何ですか?
- 7. mavenアーティファクトspark-core_2.10とspark-core_2.11の間のスパークの違い
- 8. spark-defaults.confのspark。{driver、executor} .memoryとspark-env.shのSPARK_WORKER_MEMORYの違いは何ですか?
- 9. Spark SQL - df.repartitionとDataFrameWriterパーティションの違い?
- 10. Apache Spark SQLとMongoDBの違いは?
- 11. JOINステートメントとJOINステートメントがないステートメントの違いは何ですか?
- 12. oracle sqlのjoinキーワードとinner joinキーワードの違いは何ですか?
- 13. lookupとgroupby
- 14. SparkのReduceByKeyとCombineByKeyの相違点
- 15. hdfs://とsparkの糸の相違
- 16. このWHERE句とこのJoinの違いは何ですか?
- 17. C++でのマルチスレッドのjoin()とdetach()の違いは何ですか?
- 18. Spark SQL - gzipとスナップとlzoの圧縮形式の違い
- 19. PIGのCogroupとJoinの違いは何ですか?
- 20. Spark StandaloneとYARNとローカルモードの違いは何ですか?
- 21. `FROM _、_`と `FROM _ INNER JOIN _ ON _`の違いは何ですか?
- 22. wait(long timeout)とjoin(long millis)の違いは?
- 23. キャパシティプランナーのSUMIF/LOOKUP
- 24. sparkブロードキャスト変数のgetvalue()メソッドとvalue()メソッドの違い
- 25. Spark/Scalaのarray.mapとrdd.mapの違いは何ですか?
- 26. sparkのスケジューリングモードとアプリケーションキューの違いは何ですか?
- 27. 概念的な違いSpark 2.0のRDDとデータセットの関係は?
- 28. spark-shellとstart-master/start-slaveの違いは?
- 29. SPARKパーティションとワーカーコアの違いは何ですか?
- 30. HDInsight HadoopクラスタとHDInsight Sparkクラスタの違いは何ですか?