webspiders/crawlersの場合、の最初のレンダリングサイズは、HTML文書に表示されるフォントのレンダリングサイズで、はCSSを念頭に置きます。ウェブページ上のフォントのサイズを取得する方法は?
0
A
答えて
3
レンダリングされた文字サイズか? ユーザは、ブラウザの設定を使用して自由にテキストサイズを変更することができます。 異なるブラウザでも同じコンテンツが若干異なって表示されることは言うまでもありません。
0
あなたは答えは(思わ)「デフォルト」、この目的のためのないカスタマイズビューのためであることに満足している場合、私はあなたがかなり痛みを伴うシナリオを見ていると信じて:
埋め込みあなたのスパイダーでCSS をサポートするレンダリングエンジン。多くのユーザーの と一致するエンジンを に使用するか、 の3つの共通エンジンをすべて使用し、すべての情報を に保存します。 埋め込みの容易さは、あなたの消費技術である で大きく異なります。
レンダリングエンジンでspideredされるURIをロードします。エンジンのAPIを使用して
、それはあなたが 代表文章を考えるもの含む要素 ため フォントメトリックスをのクエリ(これを選択すると 私も 戦略を予測することは開始されませんそのための練習です)。どのように にアクセスするかは、 エンジンの埋め込みシナリオ全体に依存します( )。
私は、これは「ハードな方法」で期待するが、私は「簡単」な方法があるかわかりません。
関連する問題
- 1. フォントのサイズ範囲を取得する方法
- 2. (私のウェブページ上の)フラッシュオブジェクトのリンクを取得するには
- 3. ウェブページ上のPythonをストリームする方法
- 4. Appのサイズを取得する方法+ Appのデータのサイズ
- 5. CGContextShowGlyphsAtPointでテキストを描画する - フォントの寸法を取得する方法は?
- 6. pdfboxを使用してフォントの色を取得する方法
- 7. ウェブページのウェブサイト名とページタイトルを取得する方法
- 8. ウェブページのコンテンツを取得するには
- 9. スプライト "シート"内のスプライトのサイズを取得する方法は?
- 10. Outlookのメールアイテムのサイズを取得する方法は?
- 11. Linuxのプログラムでディレクトリのサイズを取得する方法は?
- 12. ブートストラップの現在の画面サイズを取得する方法は?
- 13. node.jsの画像ファイルのサイズを取得する方法は?
- 14. フォントのグリフサイズを取得するには?
- 15. UIViewの最大サイズの取得方法
- 16. ContentEditable - 現在のフォントの色/サイズを取得
- 17. GLSurfaceのサイズを取得する方法は?
- 18. データベースの使用サイズを取得する方法は?
- 19. GLSL 4.2 - イメージのサイズを取得する方法は?
- 20. 埋め込みイメージ/ swfのサイズを取得する方法は?
- 21. react-nativeでコンポーネントのサイズを取得する方法は?
- 22. 画面の物理サイズを取得する方法は?
- 23. jsでhtml文書のサイズを取得する方法は?
- 24. Androidで画像のサイズを取得する方法は?
- 25. デバイスの画面サイズを取得する方法は?
- 26. ImageButtonのサイズを取得および設定する方法は?
- 27. LUAでアレイのサイズを取得する方法は?ここ
- 28. ウェブページ上でクリックされたリンクの位置をマージンの形で取得する方法は?
- 29. 画像Objective-Cの上のサイズ、objecive-Cの画像サイズを取得する方法
- 30. ウェブページ上のテキストを暗号化する方法は?
どこかに設定されていない限り、ブラウザのデフォルトサイズが使用されます。そして、通常、フォントは常にCSSで少なくとも1回は設定されます。 HTML自体のインラインCSSで上書きされない限り、クローラはおそらくDOM階層を調べて、どのCSS設定が使用されているか把握する必要があります。かなり多くの仕事が可能ですが、可能です。おそらく、ヘッダーを通常のテキストから切り離して、何が何であるかをよりよく理解するのは簡単でしょう。 – Alec
私は同意すると、レンダリングされたテキストの実際のサイズを取得するために、すべてのhtml/css/jsを解析することによって、サーバー上のDOMをかなり複製する必要があります。気楽なプロジェクトのように聞こえる。 –
間違いなくプロジェクトです。 IEピクセルの高さについて知りたい場合はさらに悪いことです。 gecko(または最近のFirefoxで使用されているもの)とWebkitで十分であれば、それほど悪くはありません。私の思考は、サーバーサイドの実行では扱いにくいようです。 –