$str = '<a href="http://example.com/"> A × B</a>';
$dom = new DomDocument;
$dom -> substituteEntities = false;
$dom ->loadHTML($str);
$link = $dom ->getElementsByTagName('a') -> item(0);
$fullname = $link -> nodeValue;
$href = $link -> getAttribute('href');
echo "
fullname: $fullname \n
href: $href\n";
のように、いくつかのHTMLエンティティを含み、いくつかのHTMLを解析しようとしているが、DOMDOCUMENTがA- B.
用のテキストはいくつかの方法があります置き換えますそれがHTMLエンティティのために&を取っておかないようにして、ただそれをそのままにしておきますか? substituteEntitiesをfalseに設定しようとしましたが、何もしません。
なぜあなたはそれらを保持したいですか? – Gordon
私はほんの少しだけ並べ替えたいですが、私が実際にやりたいことは、それらをxで置き換えることです。それは、私が更新しているスクレーパーからの古いコードと同じフォーマットのテキストを入れてしまうためです。どのように私は正規表現でそれらのシンボルを含めて行くだろう考え – rafa