私はPerlのWebページのテキストとテキストの比率を決定する方法を探しています。何も探していない複雑なHTMLコードのような単純なプリントアウト:75%テキスト:25%SEO理由だけ。Perlテキストのコード比率
答えて
うーん...すぐに考えて...についてどのように:
perl SCRIPT file1.html file2.html
注:
my $htmllength = 0;
my $textlength = 0;
while(<>) {
s/(<[^>]*>)/$htmllength += length($1); "";/eg;
$textlength += length($_);
}
print "HTML Code: " . (100 * $htmllength/($htmllength + $textlength)) . "\n";
print "Text : " . (100 * $textlength/($htmllength + $textlength)) . "\n";
あなたは、単に問題のファイル(複数可)上でスクリプトを実行することができ、このデータにCDATAフィールドが含まれている場合は機能しません。
[正規表現で\ [X \] HTMLを解析することはできません](http://stackoverflow.com/a/1732454/119280)! – DVK
いいえ、でも私はそれを解析していません。しかし、私はプレゼンテーションに目に見えない可能性のあるコンテンツを通しています。 –
すべての否定的な投票ありがとう!私に失敗したファイルを表示して、その投稿を削除します!ランダムな推測で –
HTML :: TreeBuilderを使用してテキストを取り除きます。
#!/usr/bin/perl
use strict;
use warnings;
use v5.10;
use LWP::Simple;
use HTML::TreeBuilder;
my $content = get(shift @ARGV);
die "Couldn't get it!" unless defined $content;
my $text = HTML::TreeBuilder->new_from_content($content)->as_text;
my $html_size = length $content;
my $text_size = length $text;
my $percentage = 100 * ($text_size/$html_size);
say qq[$percentage%];
- 1. テキスト解析のコード効率
- 2. Android画面比率
- 3. perlの%2Bの比較
- 4. QAからdevの比率
- 5. Perlテキストの抽出
- 6. 比率を計算する
- 7. テキスト比較アルゴリズム
- 8. JavaScriptコードの効率
- 9. SAXコード効率
- 10. テキスト-TとPDFのPerlファイルテスト
- 11. R比率の信頼区間係数
- 12. SVGパスの円弧半径比率
- 13. PHPの効率的な比較方法
- 14. 効率的な文字列の比較
- 15. 計算された比率のXMLフィルタリスト
- 16. Perlコード変更ログ
- 17. VBA比較コード
- 18. Perl/PythonコードへのJava Wrapper
- 19. テーブルを効率的に比較する
- 20. 配列比較、whileループと効率
- 21. Davies-boudinインデックスと最大比率
- 22. アセンブリーとCコードの比較
- 23. PerlコードをGUIに実行
- 24. ie8のzoomは、テキストを展開するのとは異なる比率でdivを展開しますか?
- 25. コード対DBのトランザクションの効率
- 26. Cコードのプロセッサキャッシュ効率の決定
- 27. ファイル解析のためのperlコード
- 28. .NET Frameworkのテキストを比較する
- 29. 7bitテキストをプレーンテキストperlに変換する
- 30. PerlでのCコード前処理
私は、ファイルとしてWebページを取る変数に配置して、HTMLコードと表示されるテキストである割合である割合を決定したいと思いSEO – Zaid
を明確にしてください。 – Blnukem
HTMLタグはめったに「コード」ではありません。 "マークアップ"という用語を使用するのはどうですか? – mob