1
jsonファイルがあります。ボリュームは約500 TBです。私は完全なセットをハイブデータウェアハウスにロードしました。hadoop - jsonデータがハイブウェアハウスにロードされていることを確認します。
ハイブウェアハウスにロードされたvalidate or test the data
の仕組みはどうですか? testing strategy
はどうすればいいですか?
クライアントは、jsonデータの検証を希望します。ハイブにロードされたデータが正しくないかどうか。何かミスはありますか?はいの場合、それはどのフィールドですか?
助けてください。
詳細 –
私の質問が更新されました。 – Ajay
をチェックしてください。このデータセットではトータルテストを行うことができず、ランダムサンプルテストに行く必要があります。いくつかのハイブのクエリを書いてそれを検証することができます。 –