1

カッパアーキテクチャでは、データを2つのストリームに分割するのではなく、ストリームで直接解析すると、カッパのようなメッセージングシステムではどこにデータが格納されますか?データベースを再計算することはできますか?カッパアーキテクチャとラムダアーキテクチャの違い

バッチ分析用にストリーム処理エンジンを使用して再計算するよりも、別のバッチレイヤが高速ですか? リアルタイムデータおよび履歴データに適用されるアルゴリズムが同一であるときに考慮すべき非常に単純なケースである

答えて

4

」。そして、明らかに過去 を処理するために同じコードベースを使用することは非常に有益 あります実時間データを使用しているため、κアーキテクチャを使用する ユースケースを実装する必要があります。現在、 のケースでは、 が完全な履歴データセットにアクセスしてからパフォーマンスが向上するため、バッチアルゴリズムを最適化することができますリアルタイムアルゴリズムの 実装ここでは、 ラムダとカッパの間で選択すると、バッチ実行を優先させるか、コードベースの単純さよりパフォーマンスが良いかの選択となります。 "最後に、リアルタイムと バッチアルゴリズムの出力さえも異なる 複雑な使用例があります。たとえば、バッチモデルの生成には多くの時間が必要な アプリケーションを学習するマシン とこのような場合、 バッチレイヤとリアルタイムレイヤをマージすることはできず、ラムダ アーキテクチャを使用する必要があります。

Lambda-Architecture

Quote

  • 洗面所独立バッチおよびストリーム・レイヤ
  • 高いコードの複雑
  • 別々のバッチで
  • より高速なパフォーマンス/バッチ内の異なるアルゴリズムのための
  • より良い流れとストリーム
  • バッチおよび ストリームのための単一のアルゴリズム、バッチ計算の代わりに、低い複雑度を維持しやすいデータベースのみスチーム処理層

Kappa-Architecture

  • のデータストレージと
  • 安いです
  • バッチ用データベースから再計算するとデータが多すぎると、
  • データが多すぎると処理が遅くなるデータベースから、またはバッチのためにカフカから再計算されます。