2016-10-25 5 views
1

私は9ノードのCassandraクラスタを持っています。クラスタ内の他のすべてのノードはすべてのノードをUNとして表示します。これら2つのノードは、UN以外のすべてのノードUNを示しています。いずれかのサーバーのsystem.logに問題を示すエラーはありません。すべてのノードは、クラスタ全体にシードノードとしてリストされます。私はポート7001上のサーバー間でtelnetすることができるので、ネットワーク上の問題ではないと思います。私たちは、ノード間通信暗号化を使用しているので、それが問題になるかもしれないのだろうか? 64.6.220.249にクラスタ内の2つのノードが互いにDNを示しています。他の人はUNです

関連Nodetoolステータススニペット:64.6.220.251に

DN 64.6.220.251 106.19 GB 256  ?  e008bc26-5d12-48b5-a381-6a175b085496 Rack1 

関連Nodetoolステータススニペット:

DN 64.6.220.249 105.31 GB 256  ?  59709c2a-6270-40be-a444-042bdf18873e Rack1 

関連Nodetolステータススニペットクラスタ内の別のノードから(すべてのノードが表示さ上記の2つを除く):

UN 64.6.220.251 106.19 GB 256  ?  e008bc26-5d12-48b5-a381-6a175b085496 Rack1 
UN 64.6.220.249 105.31 GB 256  ?  59709c2a-6270-40be-a444-042bdf18873e Rack1 

GossipInfoは64からです。 6.220.249:

/64.6.220.251 
generation:1473238188 
    heartbeat:12693992 
    SCHEMA:a7b7f6f4-24ba-3153-90cc-dc8ad2754251 
    RACK:Rack1 
    SEVERITY:0.0 
    RPC_ADDRESS:64.6.220.251 
    HOST_ID:e008bc26-5d12-48b5-a381-6a175b085496 
    INTERNAL_IP:64.6.220.251 
    X_11_PADDING:{"workload":"Cassandra","active":"true"} 
    LOAD:1.14019618013E11 
    NET_VERSION:8 
    DC:Cassandra-ALPHA 
    RELEASE_VERSION:2.1.5.469 
    STATUS:NORMAL,-1122920019547920198 

GossipInfoが64.6.220.251から走っ:

/64.6.220.249 
    generation:1473237564 
    heartbeat:12696040 
    RACK:Rack1 
    DC:Cassandra-ALPHA 
    RPC_ADDRESS:64.6.220.249 
    SCHEMA:a7b7f6f4-24ba-3153-90cc-dc8ad2754251 
    INTERNAL_IP:64.6.220.249 
    SEVERITY:0.0 
    X_11_PADDING:{"workload":"Cassandra","active":"true"} 
    RELEASE_VERSION:2.1.5.469 
    NET_VERSION:8 
    LOAD:1.13072884091E11 
    HOST_ID:59709c2a-6270-40be-a444-042bdf18873e 
    STATUS:NORMAL,-1027844444513030305 

Nodetoolのdescribecluster 64.6.220.249から:

Cluster Information: 
    Name: Fusion Cluster 
    Snitch: org.apache.cassandra.locator.DynamicEndpointSnitch 
    Partitioner: org.apache.cassandra.dht.Murmur3Partitioner 
    Schema versions: 
     a7b7f6f4-24ba-3153-90cc-dc8ad2754251: [64.6.220.254, 170.75.212.226, 170.75.212.225, 64.6.220.252, 170.75.212.224, 64.6.220.253, 64.6.220.250, 64.6.220.249] 

     UNREACHABLE: [64.6.220.251] 

Nodetoolのdescribecluster 64.6.220.251から:

Cluster Information: 
    Name: Fusion Cluster 
    Snitch: org.apache.cassandra.locator.DynamicEndpointSnitch 
    Partitioner: org.apache.cassandra.dht.Murmur3Partitioner 
    Schema versions: 
     a7b7f6f4-24ba-3153-90cc-dc8ad2754251: [64.6.220.254, 170.75.212.226, 170.75.212.225, 64.6.220.252, 170.75.212.224, 64.6.220.253, 64.6.220.250, 64.6.220.251] 

     UNREACHABLE: [64.6.220.249] 

誰でもmこれらの2つのノードがなぜ「DN」と表示されているのか、他のすべてのノードはそれらを「UN」と見なしています。

答えて

1

私は以前この「混在した」ゴシップ状態を見てきました。これが起こると、通常、「DN」として報告されているノード上のカスンダラ・プロセスをバウンスして、それを修正します。

また、これを見るとnodetool describeclusterを実行することもおすすめです。スキーマのバージョンが1つしかないことを確認するために、結果を確認する必要があります。複数のスキーマバージョン(「スキーマの不一致」とも呼ばれます)がある場合は、影響を受けたノードをバウンスすることをお勧めします。

なぜかになるとはっきりしませんが、「シードノード」として指定されているノードが多すぎます。シードノードが多すぎると、そのゴシップの状態が同期するのに時間がかかることがあり、この状態につながる可能性があります。

+0

これを変更するには編集できませんでしたが(6文字制限)、コマンドは実際には 'nodetool descriptions cluster 'でした。ドキュメンテーションの目的で言及したかっただけです。私は両方の問題ノードを停止してからバックアップを開始しようとしましたが、まだ問題があります。それらのロールバック再起動と同じです。私は、themerelusterからの出力で私の質問を編集しました。 – gsteiner

+0

@gsteiner Ack ...自動修正!それをキャッチするためにありがとう。 – Aaron

関連する問題