2017-11-01 3 views
-2

CassandraからSQLへのデータ転送にTalendオープンスタジオを使用しています。 Talendジョブを使用してデータを読み取っているときに、データが失われることがあります。そして私たちは同じことについて何かエラーを見つけることができません。 Cassandra System/Debug Logでも非常に限られた情報しか表示されません。このデータ損失を避けるためにCassandraまたはTalend Openスタジオで設定できる設定はありますか?Talendを使用してCassandraからSQLにデータを転送中

注:私たちは5Mレコード/時を扱っており、約1%のデータ損失がありません。これは一貫した問題ではなく断続的な問題です。

+0

この問題を引き起こす可能性のある多くの点(ネットワーク、OS、Java、RAM/CPU)があるかもしれないと私には思われます。 Talendが実際に問題になっているかどうか、またはデータ損失が事前に起こっているかどうかを調べると役に立ちます。私はあなたがそれを排除することができないことがわかります。あなたは、データが漏れている場所を知ることにいくつかの考えを置くべきです。 – tobi6

+0

興味深い質問ですが、非常に幅広く、特定のプログラミング問題ではありません。限られた情報があれば、どんな答えでも推測できます。 – Andrew

+0

私はCPU、RAM、OSをすべてチェックしましたが、転送中にいくつかのデータが失われていました。 – BjMangat

答えて

0

このような状況で、私はtalend内でelasticsearchに投稿するJavaルーチンをいくつか書いています。あなたが持っているtalendのバージョンに応じて、これはtalendと一緒に来ます。また、ElasticとKibanaを使用して大規模なデータセットでログベースの分析を非常に簡単にします。しかし、鍵は、Javaルーチンを使ってtjavarowを使って成功と失敗を記録することです。

関連する問題