2012-01-09 9 views
3

私の質問を例を用いて説明します。 、私はコードで検索した場合ので、私はそれを確信している、 を実際のHTMLソースを取得しない http://www.google.co.il/#q=universityウェブサイトの実際のソースコードを表示

、その後、私は右クリックして、「ソースの表示」を選択します。 は、私は、URL行く提案しますドキュメントに表示されるユニークな単語私は結果が得られません。

クロームでは、何かをマークしてコンポーネントをチェックすることができますが、実際のソースコードを見ることができますが、コードを取得するためにJavaプログラムを使用したいので、なぜ私が私が「ソースを見る」に行くと、実際のhtmlソースが表示されません。

答えて

1

「ソースを表示」を選択すると、アドレスバーにというページの実際のHTMLソースコードが表示されます。ただし、外部コンテンツを読み込んでHTMLに埋め込むコードを埋め込むことで、表示したいページが「難読化」されている可能性があります。

"nice"でこのようなページを自動的に解析したい場合は、WebkitのようなHTMLインタープリタ全体を実行する必要があります。ちょっとした仕事、そして原則として "inspect element"でやっていることです。もう1つの方法は、page-html内の行を見つけて外部コンテンツをロードし、それから順番にロードすることです。あなたが運が良ければ、これは意図的に難読化されておらず、小さな仕事のために簡単に達成できるものです。しかし、あなたは全体のDOM構造が必要な場合は、ブラウザのエンジンのひとつ...あなたが与えた例のページで

2

ソースを表示するにはjavascriptで生成されるコンテンツは表示されません。たとえば、firebugなどのプラグインを使用したいと思うでしょう。

0

あなたは何単語を検索しましたか?

私は、ビューソースはページに表示されていない部分であっても完全なHTMLコードを表示すると思います。 検索文字列をトリミングした後で再度検索を試みます。同じ文字列をクロムで検索することもできます。

JSonloadイベントの完了後にHTMLに変更された場合、更新されません。

0

あなたが探しているテキストは、JavaScriptからレンダリングされている可能性があります。 Chromeを使用している場合(言及して以来)、要素の調査時に表示されるWeb開発者ウィンドウには、JavaScriptファイル、スタイルシートなどがリストされた「リソース」タブがあります。

0

「ソースを表示」サーバーによって生成された純粋な応答を提供します。 Joachim Isakssonが既に言及しているように、Firefox用にChromeまたはFirebugを使用します。

2

javascriptによる変更を含むJavaの実際のソースを確認する唯一の方法は、HtmlUnitのような仮想ブラウザーフレームワークによるものです。

HtmlUnitはJSスクリプトを実行し、すべての変更をDOMツリーに適用できます。実際のページを取得するには、シリアル化する必要があります。 「完全なHTMLソース」というようなことはないことに注意してください。あなたはDOMツリーを取得し、場合によってはそれを直列化することしかできません。

0

の実装について考える必要があり、各結果要素は1からJSスクリプト機能によって生成される

ロードされたファイルのうち、さらに、プレーンな文字ではなくUnicodeでテキストをレンダリングします。

関連する問題