スパークストリーミングのアウトオブボックス結合機能は、実際の使用の多くのケースを保証するものではありません。その理由は、マイクロバッチRDDに含まれるデータだけを結合するからです。SPARK - 2つのデータストリームの結合 - キャッシュのメンテナンス
2つのカフカストリームのデータを結合し、stream1の各オブジェクトをstream2の対応するオブジェクトでスパークさせて豊かにし、それをHBaseに保存します。
実装
のようにオブジェクトを追加または交換、ストリーム2のオブジェクトからメモリ内のデータセットを維持し、それらはストリーム1内のすべての要素に対して
を受け取っている場合、検索しキャッシュにアクセスします一致した場合はHBaseに保存し、一致しない場合はカフカストリームに戻します。
この質問は、スパークストリーミングの調査と上記の実装方法を見つけるAPIです。
質問は? – maasg
最後の行にクエリーを入れてください。それが今あなたにとって意味をなさないかどうか確認してください。 – user3840810