htmlをDOMツリーに解析し、<a>
タグ内にないすべてのテキストを検索したいので、私はそれを見つけ出し、 "PHP Simple HTML DOM Parser "を参照してください。それは、HTML DOMをDOMツリーに解析するのに役立つようです。私は<a>
タグの中にないテキストを見つけたいですが、私は<a>
タグの中にある要素しか見つけることができません。 * ps:まだCSS3セレクターをサポートしていません。ありがとうございました。 これについての経験は1つですか?ありがとうございました。PHP Simple HTML DOM Parserを使用してハイパーリンクされていないテキストを見つける方法
答えて
私は質問を誤解していないことを望みますが、
<a>
タグ内のテキストをPHPで見つけるために組み込みのDOM関数を使用することはできませんか?その場合
$doc = new DOMDocument();
$doc->loadHTMLFile("http://blahblah.com/blah.html");
$elem_list = $doc->getElementsByTagName("a");
foreach($elem_list as $elem)
echo $elem->textContent;
私は(正規表現で、たとえば)すべて<a>
タグとその内容を削除して、お好みのDOMパーサに結果のHTMLをロードします。
更新:さらに良いことに、すぐにHTMLを解析し、すべてのタグを通じて<a>
タグ、またはループを削除し、ちょうど<a>
タグをスキップする組み込み関数を使用します。 HTMLを使った正規表現は避けるべきです。
nono、私はタグの中にないテキストが必要です。 – Tattat
ああ、ありがとう。質問の文章は少し誤解を招き、修正しようとしました(編集内容をピアレビューする必要があります)。 – newenglander
私はこのクラスを何回も使用しました。 phpのhtml/domを解析する優れたソリューションです。
$html = new simple_html_dom();
// Load your html as string
$html->load('........ HTML ..........');
$a = $html->find('a');
$text='';
for($i=0;$i<count($a);$i++)
$text.=$a[$i]->innertext;
タグ内のすべてのテキストを含む可変$テキスト。 それがあなたを助けてくれることを願っています。
- 1. Simple HTML DOM Parserを使用してJavascriptからコンテンツを検索
- 2. PHPでのXpathの使い方Simple HTML DOM Parser
- 3. PHP - シンプルなHTML Dom Parser
- 4. "Simple HTML DOM"を使用して2つのスパン間のテキストを取得する
- 5. HTMLで保存した後に空白を残すSimple Dom Parser
- 6. PHPを使用しているときに選択から要素を削除する方法Simple HTML Domライブラリ
- 7. 使用されていないキュウリのステップを見つける方法
- 8. ネットワークで使用されていないIPアドレスを見つける方法は?
- 9. simple-html-dom-parserで$ elementの単一項目を返します。
- 10. PHPを使用してパブリックフォルダを見つける方法は?
- 11. SSL証明書を見つける方法はサーバーにインストールされていますか? (PHPを使用して)
- 12. HTMLを使ってIPアドレスを見つける方法は?
- 13. ウェブサイトで使用されている認証を見つける方法
- 14. PHP HTML DOMパーサ
- 15. 結合モデルを使用したレールhabtm - リンクされていないレコードを見つける方法?
- 16. フォーカスされているNSTextfieldを見つける方法
- 17. BTソケットに使用されているUUIDを見つける
- 18. JavaScriptを使用してハイパーリンクのテキストを取得する方法
- 19. C++で使用されていないコードを見つけてインクルード
- 20. PHPを使用して外部URLを掻く方法簡単なhtml DOMパーサー
- 21. 私は<a href="http://simplehtmldom.sourceforge.net/manual.htm" rel="nofollow">PHP Simple HTML DOM Parser</a>を使用していますが、以下のソースを使ってHTMLページ内のセクションがあるシンプルなHTML DOMパーサ
- 22. ノードのようなXMLを見つけるPHP DOM DOM
- 23. HTMLテンプレートに翻訳されていない文字列を見つける
- 24. もう使用されていないウェブサイトを見つけるには?
- 25. ハイパーリンクにテキストをラップする方法まだハイパーリンクにラップされていない場合のみ
- 26. PHPで関数が使用されているコードベースの場所を自動的に見つける方法
- 27. PHP - ユーザー名に基づいてユーザーレベルを見つける方法
- 28. DOMで整形されていないHTMLを処理する
- 29. php配列:違いを見つけてください!
- 30. Java Dom Parserを使用してxmlを解析する
代わりに[DOM](http://php.net/manual/en/book.dom.php)を実際に使用する[SimpleHtmlDom](http://simplehtmldom.sourceforge.net/)のサードパーティの代替案をお勧めします。文字列の解析:[phpQuery](http://code.google.com/p/phpquery/)、[Zend_Dom](http://framework.zend.com/manual/en/zend.dom.html)、[QueryPath ](http://querypath.org/)および[FluentDom](http://www.fluentdom.org)。また、[ベストメソッドまたはHTMLを解析する]を参照してください(http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon