2012-01-21 12 views
0

私は、ユーザーが他のWebページからコンテンツをプルするカスタムWebページを構築できるWebアプリケーションを構築しています。私はこれを行うためのいくつかのオプションを知っています、そして、それが最良であるかどうか、そこにはより良い解決策があるかどうかはわかりません。今、私ができます(ソートの)私が欲しいものを達成しますが、遅いと思われるすべてのWebコンテンツを、ダウンロードしてレンダリングするようにクライアントを強制しますあなたのサイトにサードパーティのHTMLを提供する最良の方法は?

  • 使用のiframe、。私は多くの人がiframeが厄介であり、使用されるべきではないと言っていると聞いてきました。
  • wkhtmltopdfのようなライブラリを使って、サーバー側でhtmlをレンダリングし、そのpdfイメージを生成します。これはうまくいくはずですが、結果は単なる画像なので、テキストは選択できず、リンクはクリックできません。また、他の人のウェブコンテンツをホスティングする上で法的な問題を抱えることもあります。許可なしにあなたのサイト。
  • phpqueryのようなものを使用して、文字通り他のサイトからコンテンツをスクラップします。このオプションには、上記のオプションと同じ法的問題があります。

誰もこのようなことをやったことがありますか?

答えて

1

きれいな解決策は、これも絶対的であることを、すべてのコンテンツのURLやリンクを変更する必要があります、あなたが必要とするページにHTMLをレンダリングし、httpリクエストサーバ側をオフに送るだろう

例:

<img src="\images\banner.png"> 

はリモートサーバーで動作しますが、ページ内にはイメージは存在しません。最も実用的な解決策は、機能を画像やリンクに限定してから、正規URLを検索/置換して相対URLを照合し、送信元アドレスを追加することです。

ただし、サーバーから他の人のコンテンツを再送信する場合は、htmlだけでも法的問題に遭遇します。

iframeを使用すると、ブラウザがコンテンツのサイトへの通常のリクエストを送信するため、すばやく解決され、おそらく法的な影響が最小限に抑えられます。

+0

ええ、私はのためのiframeに固執する必要がありますするつもりだと思います今。答えをありがとう! – Andrew

0

HTMLからPDFファイルを生成するためにDocRaptorをお勧めします。これはwkhtmltopdfと同様に動作しますが、完全に機能するPDFファイルを生成します。

ここではそのホームページへのリンクです:

http://docraptor.com/

とそのAPIドキュメントへのリンク:

http://docraptor.com/documentation

関連する問題