2012-01-15 9 views
0

私はPHPテーブルに変換しようとしている別のWebサイトによって生成されたhtmlテーブルを持っています。PHP配列に属性を持つHTMLテーブル

simplexmlを使用して変換できません。なぜなら、生成されたテーブルのコードが有効ではなく、多くのエラーが発生します。また、テーブルのtd要素の一部の属性を保持し、

これを行う最も効率的な方法は何でしょうか?または、これを達成するのに役立つPHPクラスを知っていますか?

私は何をしようとしているのは、学校のスケジュールをphp配列に変換することです。後でそれを利用することができます。ここで

は、私が取得するデータの例である:http://paste2.org/p/1869193

ところで、PHPのストリップタグを使用して、私はすでに、このようなスパンやフォントなどの不要なタグを削除します。

インストールした場合にも(それはいくつかのインストールではデフォルトである)PHPのTidyのを使用することができます
+1

これを試すhttp://stackoverflow.com/questions/292926/robust-mature-html-parser-for-php HTMLが有効でないために動作します。 – Maher4Ever

+0

ありがとう!、それは私のhtmlをきれいにするので、私はこれで作業することができるかもしれません。 –

+0

素晴らしいですが、他の人にも役立つかもしれないので、私は答えを投稿します。 – Maher4Ever

答えて

1

- それはHTMLをクリーンアップするだけでなく、あなたがDOMをトラバースすることができますだけでなく、:

http://www.php.net/manual/en/book.tidy.php

+0

残念ながら、整頓はオプションではありません... –

0

あなたは見つけることができますSOに関する次の質問の回答に含まれるHTMLパーサリスト: Robust and Mature HTML Parser for PHP

+0

ありがとう、それは助けますが、問題を解決しません= P –

+0

私はそれが構文解析する前にHTMLを修正するパーサーを構築することは本当に確かではありません。私はあなたの最善の策は、HTMLをあなた自身のパーサーに送る前に修正することだと思います。 – Maher4Ever

関連する問題