2009-08-17 8 views
0

私はdocx形式の単語文書を繰り返し形式のデータで持っています。docxを変換してSQLテーブルにアップロードする

私は繰り返しセットから各データを取り込み、SQLテーブルの行にアップロードしたいと思います。

ここではデータのサンプル:

Question No : 1 
How is LINQ to SQL different from Entities? 

A. Answer 1 
B. Answer 1 
C. Answer 1 
D. Answer 1 

Answer : D 
Explanations : 
Some explanation. 

Question No : 2 
How is NVARCHAR different from VARCHAR 

A. Answer 1 
B. Answer 1 
C. Answer 1 
D. Answer 1 

Answer : D 
Explanations : 
Some explanation. 

私はいくつかのアプローチを考えることができます:
に - オフィスのAPI
を使用してdocxファイルとして文書を読む - WordからXMLとして文書を保存し、XMLを解析[思われない変換後のXML文書には、構造/スキーマを持っている]
- WordからHTMLとして文書を保存し、うまく形成されないHTML [DOM構造]

上記の中で、あなたが示唆し

と理由を解析しますか?ドキュメントを変換してSQLテーブルにアップロードしたり、DBにアクセスしたりするためのツールはありますか?

ありがとうございます!

答えて

2

DOCXはXMLファイルのZIPディレクトリツリーです。 WinZipまたは7-Zipを使用して、一連のサブディレクトリに展開します。これらのXMLファイルをSQL Serverにアップロードし、ファイル名とフォルダパスを追加します。 SQL ServerのXMLメソッド(.nodeなど)を使用して、必要なリレーショナルフォームにシュレッドします。

これらにはXMLスキーマと構造があることに注意してください。

0

これらのファイルをあまり頻繁に処理しない場合は、別の形式(SQLで処理しやすい)に保存することをお勧めします。 (このファイルをDBにインポートする)このプロセスが定期的に実行される場合は、中間形式に変換せずにネイティブDOCX処理を行います。 Google検索で、docx形式をデータベースに読み込むためのコンポーネントがあることが明らかになりました(http://www.brothersoft.com/code-library-for-.net-(sql-server-msde)-22050.html

関連する問題