2010-12-11 15 views
0

単語リストを取得し、Web辞書(Webster学習辞書、Cambridge学習者など)で検索し、この形状で、テキストファイル:最初に、実際のプログラミングプロジェクト:Web辞書からデータベースを作成

word1 pronunciation definition example sentence ... ... 
word2 pronunciation definition example sentence ... ... 
.... 

と私はいくつか質問があります。

ことが可能であるが、これを行うには?
どのツールを使用すればよいですか?
もしPythonで可能ならば、lib。私は使うべきですか?
(私はそれが私が学んでいる言語であるためにPythonの原因を好む)

私はちょうど取る方法の一般的な考えが必要です。

私はまだプログラミングで大きな騒ぎですが、私はいくつかの個人的なプロジェクトで働いていると思います。 私は良い進歩を遂げるでしょう。

P .:私の英語は完璧ではありません。申し訳ありません。

答えて

3

それは難しい、主なものは、ウェブサイトを照会する方法を考え出すされることではないでしょう。 これらは、基本的な手順になります:URLへ

  • マップクエリ文字列:
    • あなたはウェブサイトがどのように機能するかを理解する必要があります(フォームの偶然にを把握するためにHTMLをotのソースを調べます。)一部のWebサイトより簡単にできる公開APIがあります。
  • GETのWebページ:BeautifulSoupurllib2
  • 解析ページあなたの答えのために。他のウェブページと情報を分けてください。
  • ファイルに情報を書き込む
+0

ウェブサイトにパブリックAPIがあるかどうかを確認するにはどうすればよいですか? – Alpagut

-1

これは可能ですが、あなたはrigthアルゴリズムが必要になりますスケーラビリティを維持するために:ちょうど探索木がする状態に到達したイベントをキャプチャhttp://pypi.python.org/pypi/ahocorasick/0.9

:Pythonで http://en.wikipedia.org/wiki/Aho%E2%80%93Corasick_string_matching_algorithm

をこれがあります検索語が発見され、それに作用する。前述のwikiページでは、いくつかの役に立つリソースを紹介しています。

Greetz、 J.

関連する問題