2010-12-28 13 views
1

私は私がやってる映画の分析のための完全なリストをダウンロードして自分のサーバーのグラブこのページを持っている: http://www.imdb.com/chart/topIMDBのトップ250リストをスクレイピングすると、外国語でいくつかの結果が得られますか?

をしかし、それがないとき、映画のタイトルの多くは別の言語で表示されています。代わりに、それは私に与えてショーシャンクの空にを言うの例:ПобегはШоушенка

PHPで簡単なのfile_get_contentsをиз再現する最速の方法です、私はカール

誰もが何が起こっているのかについての任意のアイデアを持って使用していますけれども、直し方?

更新:IMDBは、奇妙な理由で自分のサーバーを別の国にあると解釈している可能性があります。それを米国にいるとして強制する方法はありますか?

答えて

0

私はこれをWindows環境で処理する方法を知っています。あなたはあなたのサーバーOSに同じ考えを借りるかもしれません。

WebBrowserコントロールを使用しているWindowsでは、メニューの表示 - >エンコーディングを使用してテキストを正しく表示する言語を選択できます。ブラウザコントロールからソースページを取得すると、正しいコーディングになります。

あなたのムービー分析にはIRobotSoftウェブスクレイパーが使いやすく、Windowsプラットフォームでのみ実行できます。

+0

OPではブラウザを使用してデータを取得していません – ajreal

1

は、その後、あなたのスクレーパー内のログイン・プロセスを自動化し、あなたの通常のプロセスに従うhttps://secure.imdb.com/register-imdb/siteprefs

でユーザーアカウントと設定されたタイトルの表示言語を使用してください。

関連する問題