0

私は3つのスーパバイザノード(各ノード32GRAM)を持つStormクラスタ上で動作するトポロジを持っています。最初の数日では、トポロジはうまくいっています。すべては問題ありません。しかし、次のエラーが常に発生し、トポロジが動作して数日後にダウン:ストーム:例外が発生したときに自動的にトポロジを再サブミットする方法はありますか?

java.lang.RuntimeException: java.lang.RuntimeException: java.lang.RuntimeException 
org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /brokers/topics/TOPICNAME/partitions at storm.kafka.ZkCoordinator.refresh 

トポロジは、リモートサーバー上に座っているリモートカフカサービスからのメッセージを消費するために注ぎ口を使用して、このサーバーは、飼育係のサービスですに。

私はこの例外の理由は、動物園のサーバーが不安定であるか、またはネットワーク接続が不安定であるためです。

私はリモートkafka/zookeeperサーバーで何かすることは許可されていませんので、トポロジを安定して稼働させるために私の側で解決策が必要です。どのようにトポロジが安定して動作するようにするには、とにかく出てくる間に例外をスキップすることはできますか? トポロジを自動的に再送信する方法はありますか?

ありがとうございました!

答えて

0

最初にすべきことは、what causes the connection loss errorのgoogleです。
次に、嵐のログファイルに行き、エラーの原因となっているコード行を確認します。
正しい方法は、エラーの原因を突き止めることです。

ただし、より迅速な一時的なソリューションを使用する場合は、Storm's REST APIを使用してトポロジを強制終了してください。その後、通常のJavaプログラムまたは任意の言語のスクリプトを使用して、コマンドラインからトポロジを再起動できます。

関連する問題