2017-02-27 7 views
1

私はapache cassandra 2.2.4を使用しています。 DC1にはレプリケーションファクタ3を、DC2にはレプリケーションファクタ1を持つ4(4)ノードクラスタがあります.DC1には3つのノードがあり、DC2には1つのノードが含まれています。このクラスタには前にいくつかのノードがありましたが、何らかの理由でそれらを削除してレプリケーションのシナリオを変更しませんでした。リクエスト中に予期しない例外が発生しました

Datacenter: DC1 
=============== 
Status=Up/Down 
|/ State=Normal/Leaving/Joining/Moving 
-- Address  Load  Tokens  Owns Host ID        Rack 
UN 21.12.19.91 4.08 GB 256   ?  a45bb676-1ddd-4b22-933b-58653cea680f RAC1 
UN 21.12.19.92 3.92 GB 256   ?  a7735fca-8671-4a20-a759-4a2681aed37e RAC1 
UN 21.12.19.93 4.47 GB 256   ?  d98f3cad-881a-41c8-89c7-170c63c3d236 RAC1 
Datacenter: DC2 
=============== 
Status=Up/Down 
|/ State=Normal/Leaving/Joining/Moving 
-- Address  Load  Tokens  Owns Host ID        Rack 
UN 21.12.19.99 3.84 GB 256   ?  ccd9ca97-f97a-4473-9a65-49b12a1b60ba RAC1 

を[次のIPさんがオリジナルではないことを考慮してください]クラスタが正常に動作しましたが、今--日は、私がINFOような問題を抱えています。私はこの問題を分析しようとしていましたが、まだそれを作ることはできませんでした。次のシナリオに精通している人はいますか?

INFO [SharedPool-Worker-2] 2017-02-26 06:56:48,520 Message.java:605 - Unexpected exception during request; channel = [id: 0x637a702c, /18.12.10.17:60926 :> /21.12.19.91:9042] 
java.io.IOException: Error while read(...): Connection reset by peer 
    at io.netty.channel.epoll.Native.readAddress(Native Method) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollSocketChannel$EpollSocketUnsafe.doReadBytes(EpollSocketChannel.java:675) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollSocketChannel$EpollSocketUnsafe.epollInReady(EpollSocketChannel.java:714) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollEventLoop.processReady(EpollEventLoop.java:326) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.channel.epoll.EpollEventLoop.run(EpollEventLoop.java:264) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:116) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at io.netty.util.concurrent.DefaultThreadFactory$DefaultRunnableDecorator.run(DefaultThreadFactory.java:137) ~[netty-all-4.0.23.Final.jar:4.0.23.Final] 
    at java.lang.Thread.run(Thread.java:745) [na:1.8.0_66] 
+0

IP 18.12.10.17(例外)とは何ですか? – Ralkie

+0

その開発者はIPを終了します。 –

答えて

0

ファイアウォールが使用中のTCP接続をドロップしていないことを確認してください。すべてのノードでTcp keep aliveをファイアウォール設定より低くする必要があります。 TCP設定の詳細については、https://docs.datastax.com/en/cassandra/2.0/cassandra/troubleshooting/trblshootIdleFirewall.htmlを参照してください。これは私が問題を解決するのを助けました。

+0

私はこの問題の冒頭からこの問題を解決しました。私は十分な** keepalive_time **、** keepalive_probes **、** keepalive_intvl **遅延を設定しました。だから、落とす可能性はない。 –

+0

その場合は、アプリケーションまたは他のノードが、以前に存在していたCassandraノードのキャッシュされたIPを持ち、現在は廃止されている可能性があります。 _INFO_ログ** 18.12.10.17:60926 **から削除されたようですが、引き続き接続しようとしています。すべてのノードをロールバックして再起動してください。問題が解決するはずです。 –

+0

** 18.12.10.17:60926 **はクライアント側/開発者側のIPです。 1つのクラスタに異なるブロックIPを使用しません。また、ロールバックを再開しました。しかし問題がどこから来たのかを知ることはできませんでした。 –

関連する問題