KAFKA接続用のベストプラクティスは何ですか?HDFSコネクタを使用するベストプラクティスは何ですか?kafka connectを使用するベストプラクティス
私のkafkaインスタンスはAWSホスト名a.b.c.dで実行されています。私のhadoop namenodeはAWSホスト名p.q.r.sです。開発/ POCの目的で、kafkaインスタンスを実行しているのと同じボックス、つまりa.b.c.dでコンフルエントにしています。 HDFSクラスタのサイズは500GBです。
しかし、クラスターサイズが20〜30TBの生産タイプのセットアップの場合、KAFKAインスタンスと同じボックスまたはネームノードボックスまたは別のボックスでコンフルエントにすることをお勧めしますか?このような制作の場合、どのくらいのディスクサイズが必要となるでしょうか?