この動作は非常に多く、ゴシップフェーズではノード1が検出されず、 "INET IPADDR is DOWN"という警告が表示されますが、数秒後に表示されます。私がノードをチェックすると、実際にはダウンしていませんが、他のノードを介しては発見できません。この問題のために、ヒントは本当に高くなります。断続的にcassandraノードが数秒間ダウンしています
このエラーの考えられる原因は何か、どのように軽減できますか?
この動作は非常に多く、ゴシップフェーズではノード1が検出されず、 "INET IPADDR is DOWN"という警告が表示されますが、数秒後に表示されます。私がノードをチェックすると、実際にはダウンしていませんが、他のノードを介しては発見できません。この問題のために、ヒントは本当に高くなります。断続的にcassandraノードが数秒間ダウンしています
このエラーの考えられる原因は何か、どのように軽減できますか?
ノードをDOWNのように見せる要因はいくつかあります。ノードは、gossip protocolによってUPまたはDOWNに決定されます。いくつかの環境では、ネットワークの輻輳または長いGCイベントのためにゴシップが失敗する可能性があります。 DOWNノードのsystem.log
を確認してください。これにより、任意のGCイベントおよびその期間が表示されます。
cassandra.yaml
にphi_convict_threshold
の値を増やすと、障害検出器の感度が低下します。この値は12を超えて設定しないでください。
詳細については、failure detection and recoveryのドキュメントを参照してください。
GCイベントがあります。 GCを調整するにはどのような対策が必要ですか?ヒントはゼロにならないので。 –
JavaとCassandraのどのバージョンを使用していますか? –
JDK1.8およびCassandra2.2.5 –
クラウド(AWS、Digital Ocean、GCE)で動作していますか?応答していないノードのこのDOWN期間にログにGCメッセージが表示されますか? –