どのようにHTMLページに挿入されたかに基づいて異なるフォーマットで提供されるリンクを見つけるREGEXに関するヘルプが必要です。HTMLページから動的URLを見つけて見つけ出すPHP preg_match
私はPHPでページを読むことができます。 URLを見つけてそれらを隔離する正しいREGEXにはちょうどできません。
私は挿入方法についていくつかの例があります。ときどきそれらがプレーンテキストリンクであり、それらの周りにラップされたものがあります。リンクの一部ではないテキストが間隔を置かずに挿入される奇妙な機会もあります。
Article IDとArticle Keyは決して同じではありません。 Article Keyは常に数値で終わります。これが可能なら私は確かに助けを使うことができます。ありがとう
Here are a few examples.
http://www.example.com/ArticleDetails.aspx?ArticleID=3D10045411&AidKey=3D-2086622941
http://example.com/ArticleDetails.aspx?ArticleID=10919199&AidKey=1956996566
<a href="http://www.example.com/ArticleDetails.aspx?ArticleID=10773616&AidKey=1998267392">http://www.example.com/ArticleDetails.aspx?ArticleID=10773616&AidKey=1998267392</a>
<a href="http://www.example.com/ArticleDetails.aspx?ArticleID=10773616&AidKey=1998267392">This is a link description</a>
http://example.com/ArticleDetails.aspx?ArticleID=10975137&AidKey=701321736this is not part of the url.
最後に私はURLを探しています。
http://example.com/ArticleDetails.aspx?ArticleID=10975137&AidKey=701321736
私は運がなかった。しかし、/ gを/ im(/ http:\/\ /(www \。)?example \ .com \ /ArticleDetails.aspx \???????????????????????????? ArticleID =(。*?)(\&| \ &) AidKey =([\ d \ w - ] *)/ im) – Tim
REGEXは分かっていませんが、動作していれば私は幸せです。ありがとうT – Tim
@ティム:私はPHPの例で私の答えを更新しました。 – scube