1

Solrをインストールした3ノードのCassandraクラスタセットアップ(複製を2に設定)、各ノードにRHEL、32GB Ram、1TB HDD、およびDSE 4.8.3があります。私のノードではたくさんの書き込みが行われており、私のノードからは私のWebアプリケーションも読み込みます。Cassandra Nodes Going Down

  1. 3~4日ごとにすべてのノードがダウンすることがわかりました。私はすべてのノードを再起動しなければならず、次の3-4日まではうまく機能し、同じ問題が繰り返されます。サーバーのログを確認しましたが、サーバーがダウンしてもエラーは表示されません。私はなぜこれが起こっているのか理解できません。私のアプリケーションで
  2. 、私はC#カサンドラドライバを介してノードに接続したときに時々、私は次のようなエラーに

    Cassandra.NoHostAvailableExceptionを得る:「ノード-IP:クエリのためにしようとしたホストのいずれも試してみました(利用できません':9042)Cassandra.Tasks.TaskHelper.WaitToComplete(タスクタスク、Int32タイムアウト)Cassandra.Tasks.TaskHelper.WaitToComplete [T](Task``1タスク、Int32タイムアウト)at Cassandra.ControlConnection.Init()at Cassandra .Cluster.Init() `

しかし、私はOpsCenterのを確認したときに、ノードのどれもがダウンしていません。すべてのノードの状態が完全に正常に表示されます。これは運転手に問題がありますか?私は以前、Cassandra C#ドライバのバージョン2.5.0をNugetからインストールしていましたが、今でもバージョン3.0.3にアップデートしましたが、このエラーは解決しません。

これについての助けに感謝します。前もって感謝します。

+0

ノードが停止している理由を知るために '/ var/log/cassandra/system.log'を調べましたか?それはOutOfMemory例外または長いGC収集である可能性があります – doanduyhai

+0

ノードダウン中にこれらのログをチェックしましたが、ログにエラーとしてマークされたものはありませんでしたが、 '要求中に予期しない例外が発生しました。 channel = [....] java.io.IOException:読み込み中のエラー(....):ピアによって接続がリセットされた場合 ' – Hitesh

+0

完全なスタックトレースをどこかに貼り付けてコピーできますか? ネットワーク接続エラーの場合は、エラーが発生した元のサーバーのsystem.logファイルを調べる必要があります – doanduyhai

答えて

0

まだ行っていない場合は、実行してデフォルトにあなたのログレベルを設定することで、見てみたいことがあります。nodetool -h 192.168.XXX.XXX setlogginglevel org.apache.cassandra DEBUG

すべてのノード上のあなたの最初の問題は、ほとんどのOutOfMemory例外です。

2番目の問題では、GCの休止時間が非常に長くなる可能性が最も高いです。テロップ/var/log/cassandra/debug.logまたは/var/log/cassandra/system.logはヒントを与えるかもしれませんが、タイムスタンプを細心の注意を払っていない限り、通常問題を明らかにしません。このトラブルシューティングを行うための最善の方法は、あなたがGCのログは、あなたのjvm.optionsの設定で有効にしていることを確認することである休止時間に着目し、その後テールあなたのGCログ:

grep 'Total time for which application threads were stopped:' /var/log/cassandra/gc.log.1 | less

Unexpected exception during request; channel = [....] java.io.IOException: Error while read (....): Connection reset by peerエラーは、通常、ノード間でタイムアウト。コーディネータは、他のノードからの応答を待ってタイムアウトし、接続を閉じるためにTCP RSTパケットを送信する。