私は3つのスーパバイザノード(各ノード32GRAM)を持つStormクラスタ上で動作するトポロジを持っています。最初の数日では、トポロジはうまくいっています。すべては問題ありません。しかし、次のエラーが常に発生し、トポロジが動作して数日後にダウン:ストーム:例外が発生したときに自動的にトポロジを再サブミットする方法はありますか?
java.lang.RuntimeException: java.lang.RuntimeException: java.lang.RuntimeException
org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /brokers/topics/TOPICNAME/partitions at storm.kafka.ZkCoordinator.refresh
トポロジは、リモートサーバー上に座っているリモートカフカサービスからのメッセージを消費するために注ぎ口を使用して、このサーバーは、飼育係のサービスですに。
私はこの例外の理由は、動物園のサーバーが不安定であるか、またはネットワーク接続が不安定であるためです。
私はリモートkafka/zookeeperサーバーで何かすることは許可されていませんので、トポロジを安定して稼働させるために私の側で解決策が必要です。どのようにトポロジが安定して動作するようにするには、とにかく出てくる間に例外をスキップすることはできますか? トポロジを自動的に再送信する方法はありますか?
ありがとうございました!