2009-07-25 5 views
1

品質管理システムの一部である約400の文書を単語単位で使用すると、なぜなら、a)大きな文書の画像を扱いにくいこと、b)レイアウトが時々破綻すること、c)異なるクライアントのために文書を設定することが面倒であることなどが原因です。大量の単語文書をxmlに自動的に変換し、変更してラテックス、pdf、htmlに変換する

単一のドキュメントをxml/htmlやテキストとして保存して手動でラテックスに変換することはできますが、これは400ドキュメントでは不可能です。 PrimoPDFのようなツールを使ってWord文書をpdfに直接印刷することはできますが、それはコンテンツを変更する必要があるため十分に柔軟ではありません。

プレーンテキスト、見出し、表、イメージのような文書の構造を維持し、それをXMLに変換する方法はありますか?その後私は、クライアントの選択に応じてXMLをhtml、latex、pdfに変換し、コンテンツを変更したいと思いますか? xsltはxmlを他の形式に変換する方法ですか?

ありがとうございました。

答えて

2

文書をWord 2007に変換することができます。Office 2007の文書です。ファイルの拡張子は.zipとupzipに変更してください。また、Microsoftは、XMLタグを使用するよりも高いレベルのOffice 2007ドキュメントを扱うためのAPIを公開しています。

+0

ありがとうございます。私はこれまでのバージョンを使用していますが、MS Office 2007 - > XML - > XML、XHTML、LaTex、およびPDFのパスをもっと詳しく説明するために、Office 2007を求めました。 –

1

MS Wordをバッチ変換する場合は、OpenOffice.orgをご覧ください。 OpenOfficeには、一括変換のための(コマンドライン)バッチモードがあります。また、そのメカニズムを使用して文書を変換するJodConverterを見ることもできます。

これで、Micrososoft Wordを他の形式のOpenOffice.orgに一括変換することができます。恐らくRTF、おそらくOpenOffice XMLというテキストでしょう。

あなたはラテックスに変換するのがより簡単なフォーマットです。

Stack OverflowでWordとOpenOfficeを検索すると、this one about Word to Html conversionのような検索結果が表示されます。

+0

ありがとうございました。 JodConverterは良いと思います。私はそれを試してみましょう。 –

0

ワード<上のアドバイスがある - TUG(TeXのユーザ・グループ)で> LaTeXの変換:提案や方法のうちのいずれかどうかを確認するために見を持つ価値があるかもしれ

http://www.tug.org/utilities/texconv/pctotex.html

は、あなたの要件を満たしてください。

0

どれくらいうまく動作しているかわかりませんが、Word2texがあります。

関連する問題