2009-07-23 4 views
0

でTSVファイルの検証私はTSVファイルをアップロードするWebアプリケーションを作るJavaの

  1. JDK - > 1.4
  2. のStruts - > 1
  3. 樹脂 - > 3.0.9

"\ t"、 "\ n"、 "\ r"で解析されたTSVファイル

検証済みです。

1.ファイル名は命名規則に沿っていますか?

2. TSVファイルですか?

TSVに類似した画像やOfficeドキュメントの検証はどのように行う必要がありますか?

+0

広告2)ファイルを読むだけで十分ですか? –

答えて

1

TSVファイルの定義によって異なります。

これらはすべて同じ量のカラムを持っていますか?または最後の空の列を省略することは可能ですか?

すべての列の値が同じ場合は、最初の検証を行うことができます。失敗した場合、ファイルが有効ではないことがわかります。

ヘッダー行はすべてありますか?そうであれば、それを使って上記の質問に答え、ファイルの解析を検証することができます。

引用は許可されていますか?そうであれば、キャリッジリターンやタブを引用符で囲むことができますか? (検証には必ずしも役立つわけではありませんが、解析するときはそれについて考える必要があります)

テキストは厳密にテキストですか?印刷できない文字をテストし、それを拒否することができます。ここでも、ファイルに使用されている文字エンコーディング(UTFとASCIIなど)に注意してください。 これは、最初にフラットファイルからデータ構造(マップのリストなど)に解析するコードに置くことができます。

ファイル自体をさらに掘削する場合、固定形式または一部のデータの型がわかっている場合、このデータ(日付、タイムスタンプまたはその他の固定形式の文字列)を検証するためにセカンダリパーサーを作成できます。 この2番目のレベルは、コンテンツの詳細を発見し、上記の構造からデータを処理しているときに実行できます。

上記のすべてが経験的な分析なので、誤認が予想されるはずですが、エントリファイルを遵守しなければならないルールを選択した場合、偽陰性は発生しません。したがって、処理スタックに沿ってすべてが無効なデータに遭遇し、ファイル入力全体を無効にする準備ができている、つまり、実行されたテストがファイルが正しいことを完全に保証しているとは決して決してならない。

こちらがお役に立てば幸いです。