2016-08-09 5 views
0

私が作成したグラフの情報を含むVisio Binary .VSDファイルの内容を読み込もうとしています。Python(Linux)のOLEツールを使用してVSD(Windows Visio Binary)ファイルからデータを読み取ることは非常に不明ですが、データを抽出する他の方法はありますか?

OLEツールとOLEFileを使用しようとしましたが、内容を正しく読み取れません。 OLEToolsでファイルを見ることができます。コンテンツをダンプして 'xxd'コマンド(ターミナルで)で表示すると、ファイル内に保存されているテキストをはっきりと見ることができません。 \ x00、\ xffなどの余分な文字が他にたくさんあり、ファイルを削除すると悪化します。私は.docファイルと全く同じことをやっており、内容を開いてはっきりと読むことができました。

私はこれを間違っているか、むしろうまく動作する他のツールの方向に行っている場合、誰も正しい方向で私を指してもらえますか?あなたは本当に、他のオフィスとは異なり、強力な敵:)

を選んだ

答えて

0

は、Visioがバイナリファイル形式は、それは基本的に単なるラッパーだ、まさにMicrosoftの「複合ドキュメント」ではありません.VSDアプリ。フォーマットはVisio Corpによって199xに作成され、AFAIKは実際には公に文書化されませんでした。

可能であれば、バイナリ.VSDを使用しないでください。最新のVisioは、標準のopenxml形式(.vsdx)をサポートしています。これは、基本的にzip形式のXMLファイルの束です。

AFAIKバイナリ.vsdを理解するための唯一の既知のサードパーティライブラリは、asposeダイアグラムですが、フリーではありません。

0

ありがとうございました。

ファイルからプレーンテキストを抽出し、それをXHTMLに変換して解析する方法を見つけました。主な問題は、元の文書が持つ可能性のある構造が緩んでいることです。

ツールがされているlibvisio-ツール はhttps://launchpad.net/ubuntu/trusty/+package/libvisio-tools

のインストールでは、次のプログラムにファイルを変換するために、端末から実行することができます vsd2text vsd2xtml、vsd2rawを与える

関連する問題