HTMLページから情報を解析しようとしています。唯一の問題は、必要な情報がタグにないため、簡単に見つけられないということです。ここで私が話していることの例です。PHPパーサー:HTMLタグの後のHTMLテキストの解析
<span class="fieldlabeltext">Levels: </span>Undergraduate
<br>
<span class="fieldlabeltext">Attributes: </span>Online Course
<br>
<span class="fieldlabeltext">Instructors: </span>N/A
<br>
は、私は上記の例から「コースオンライン」を抽出する必要がありますが、「属性」のすべてではないが、全体のHTMLファイル全体で同じです。だから、おそらく「クリティカル・シンキング」や「キャップストーン」など、他の多くのタイトルがあります。このデータを抽出する最良の方法は何でしょうか?私はPHPのシンプルなHTML DOMパーサーを使用しています - http://simplehtmldom.sourceforge.net/
あなたは、DOMツリー内のノードを検索すると、ツリー内のそのノードの隣人を見て 'nextsibling'と' previoussibling'があります。単純さがそれを持っているかどうかは分かりませんが、完全なDOMはそうしています。 –