大量のHTML文書を内部に持つテーブルがあり、HTMLファイルを処理してタグとその内容を分離し、すべてのそれらの表内の行を1つの大きなデータ表に変換します。 新しい大きなテーブルの行と列をループします。PHP DOMDocumentでHTMLテーブルを連結する
いくつかの調査の後、私はPHPのDOMDocumentクラスを試してHTMLを解析し始めましたが、私は知りたいと思っていました。これがこのようなことをする最善の方法ですか?
これは私がこれまで持っているものです...
$dom = new DOMDocument();
$dom->preserveWhiteSpace = FALSE;
@$dom->loadHTMLFile('exrate.html');
$tables = $dom->getElementsByTagName('table');
はどのようにして、テーブルとその内容以外のすべてをチョップしますか? その後、目次であるため最初の表を削除したいと思います。次に、すべてのテーブル行をループし、1つの大きなテーブルに構築します。
どのようにこれを行うにはヒントがありますか? 私はphp.net上のDOMDocumentのドキュメントを掘り下げてきましたが、構文がわかりません!
乾杯、B
編集:ここで私は[OK]を、それがphpQueryと試行錯誤の多くとソートましhttp://thenetzone.co.uk/exrates/exrate.html
DOMDocumentはひどいです。 phpQueryやQueryPath、または他の[HTMLを解析するための最善の方法](http://stackoverflow.com/questions/3577641/best-methods-to-parse-html)を試してみてください。しかし、私の2番目の助言は、HTMLテーブルから行を抽出するために、よりシンプルなregexクラスの1つを使うことです。 – mario
文書のHTMLコードを貼り付けることはできますか? &DOMDocumentの代わりに、PHPの単純なHTML DOMパーサーは、簡単なコーディングとパフォーマンスの問題に役立ちます。 [link](http://simplehtmldom.sourceforge.net/manual.htm) – risyasin
申し訳ありませんが、HTMLファイルには、同じ列と列の順序を持つ複数の表が含まれていますが、各表の間にはテキスト段落が区切られています。私はphpQueryを見ていきますが、私はDOMDocumentをまとめるのが難しいだけでなく、DOMDocumentへのラッパーであるphpQueryやQueryPathを使うのが好きです。ここにHTMLコードのサンプルがあります...(http://thenetzone.co.uk/exrates/exrate.html) – batfastad