2012-01-25 19 views
0

iframeからコンテンツを取得したいアプリケーションを作成しています。 iFrameコードでは、このようなコードです。iframeからhtmlを取得する

<div class="abc">

<a class="abc" href="example.com" data-ctorig="example2.com" > **** </a>

</div>

私は私のアプリのためのウェブサイト "example2.com" をしたいです。 私はASP.NET(C#)、HtmlAgilityPackを使用しています.... これを行う方法?

私はiframeの "src"リンクに行きます。しかし、もう一度私は何も見つかりませんでした私はあなたにリンクclick hereを与える。 このページを開くと、特定のリンクを解析します。 1.コンパスなしで真のノースを見つける方法: 2.コンパスなしで真のノースを見つける方法。

答えて

1

ポイントHtmlAgilityPackをホスティングページではなくIFrame URLに追加します。

は私が正しくあなたを理解していれば、あなたはWebクライアントとHtmlAgilityPackを使用してのIFrameのHTMLを取得することができます...

を明らかにしました。

まず、WebClientを使用してホストページのHTMLを取得する必要があります。次に、HtmlAgilityPackを使用してホストページのHTMLを解析し、IFrame URLを抽出します。次に、別のWebクライアントを使用してIFrame URLからHTMLを取得し、HtmlAgilityPackを使用してレスポンスを解析して、後に何をしているかを確認します。

もちろん、あなたの質問は非常に曖昧なので、私は完全にあなたが後になっているかどうかはわかりません。どちらにしても、次のリンクが役立ちます。

HtmlAgilityPack Tutorial

Download HTML Using WebClient

+0

iframeのURLを取得する方法。 –

+0

WebRequestを使用してホストページからHTMLを取得し、HtmlAgilityPackで解析します。 HtmlAgilityパックを使用して、HTMLからiFrameを抽出します。フェッチされたIFrameのsrc属性を使用して別のWebリクエストを実行し、HtmlAgilityPackでレスポンスを解析します。 – ctorx

+0

こんにちは! @マチュー、どんな例を挙げてもいいですか?私はHtmlAgilityPackを使ってHTMLからiframeを抽出しようとしました。しかし、私は失敗しました。何か例を挙げてください。 –

0

C#が、あなたがクライアントのブラウザで提供していますし、レンダリングされたページからこれをやって話をしている、あなたはJavaScriptでそうする必要があるだろうではないと仮定。 iframeはクライアントブラウザ上でレンダリングされるため、サーバー側のコードにはアクセスできません。

+0

多分、彼らはスクリーンスクレイピングですか? – Douglas

+0

画面のスクラップであっても、最低でもiframeのコンテンツをスクラップしてサーバーに戻すjavascriptが必要です。しかし、彼の質問は、それをどのように解析するかではなく、コンテンツを取得する方法でした。彼はC#を使ってそれを得ることはできません。 – CodingGorilla

+0

おそらく_they_はクライアントです。第三者のページのコンテンツを解析する必要があります。 – Douglas

関連する問題