<で非表示になっているphp(file_get_contents?)のウェブサイトを読みたいと思います。span style = 'display:none;' >。PHPを使用してリモートWebページから隠しコンテンツを抽出するにはどうすればよいですか?
4例:
- U <スパンスタイル= '表示:なし;' > wsebv < /スパン> <U> </U > rfahr
- Z <スパンのスタイル= '表示:なし;' > E <I> </I > I <スパン> < /スパン> NHV < /スパン> <B> </B >
- Böhrdorf<I> </I > < iが> </I > B <スパン> </span >e <i > </i > n <スパンスタイル= '表示:なし;' > einhv < /スパン> <U> </U >ベルク
- K <スパンのスタイル= '表示:なし;' > s <i> </i > d < span style = 'display:none;' > d < span style = 'display:none;' > b <スパンスタイル= '表示:なし;' > n < span style = 'display:none;' > v <i> </i > b < span style = 'display:none;' > H <I> </I > gawe < /スパン> <U> </U > AOI < /スパン> <B> </B > hvws < /スパン> <B> </B > aoir < /スパン> <b > </b > asud </span > <b </b > asu </span > <b> </b > irchdorf/Kr。
結果は次のようになります。
- Urfahr
- Zöhrdorf
- Babenberg
- キルヒドルフ/ Krを。この問題を解決するための
つの可能なアプローチ(私はそれらを実装する方法がわからない):
A)その内容
Bとのすべてのスパンタグを削除)プログラム上だけVISIBLEコンテンツを読む
事前にあなたの助けに感謝します!
あなたの2つのアプローチは何をしましたか?いくつかのコードを表示 –
Uwsebvrfahr - それはhtmlで来るのですか?ブラウザではUrfahrのように見えますか?もしそうなら、javascriptのみをデコードすることができます(ブラウザーでJavascriptを無効にして確認し、ページをリロードすることができます)。このjavascriptを見つけて、エンコーディングアルゴリズムを分析する必要があります。 – heximal
ええ、 ''タグを削除してください - 単純な正規表現がこのトリックを行います。 – halfer