-1
入力HTMLはattached (my $file)です。次のスクリプトでは、私が望むテーブルを抽出できません。助言がありますか?HTML :: TableExtractが機能しません
use strict;
use warnings;
use HTML::TableExtract;
my $file="view-source_www.nasdaq.com_dividend-stocks_dividend-calendar.aspx_date=2017-Apr-19.html";
open DATA,$file || die "cannot";
my $content;
{
local $/ = undef; # slurp mode
$content = <DATA>;
}
close DATA;
my $te;
$te = HTML::TableExtract->new(headers => [qw(Announcement_Date)]);
$te-> parse($content);
# Examine all matching tables
foreach my $ts ($te->tables) {
print "Table (", join(',', $ts->coords), "):\n";
foreach my $row ($ts->rows) {
print join(',', @$row), "\n";
}
}
ファイルは、実際には、別のページの(エスケープされた)ソースを含むHTMLページです。おそらく元のHTMLであり、エンコードされたHTMLではありません。 – jcaron
[HTML :: TableExtractは美しいです](https://www.nu42.com/2012/04/htmltableextract-is-beautiful.html)...「うまくいかない」とは助けになりません。 –