連絡先情報を収集して自分のサイトに入力するために100の奇妙なWebサイトを訪問する必要がある状況があります。私が知りたいのは、プログラムやクローラを書くことができれば、それを正しく置くならば、この情報をすべて得ることができるかどうかです。私は、情報が非構造化HTMLで利用可能になると推測しています。そして、構造化するために解析する必要があります。誰もこれを行うのに似た経験をしていますか?また、使用する言語に関する意見もあります。データ入力のプロセスを自動化する方法
1
A
答えて
1
あなたはWeb Scraperを探しています。いくつかのGoogle検索では、問題を解決するさまざまな無料の商用製品が登場するはずです。収集しているデータがかなりシンプルで構造が整っている場合は、自分で作成する必要はありません。
0
てみルビー(LIBを機械):例として
http://mechanize.rubyforge.org/mechanize/GUIDE_rdoc.html
:
agent.get('http://someurl.com/').search(".//p[@class='posted']")
+0
を解析し、保存することは非常に見える、Googleの人々は、このクロールについて少し知っていると思いますエレガントですが、Rubyを学ぶ必要があります。 – gizgok
関連する問題
- 1. Python:ユーザー入力データを自動化する(複数の順次入力)?
- 2. jar入力の自動化
- 3. データをPDFに自動入力する
- 4. バッチで自動入力する方法
- 5. 入力ボックスにデータを自動的に入力します
- 6. プロセスを自動化するBASH
- 7. 入力ファイルをhdfsに自動的に入れる方法は?
- 8. mvcのテキストボックスを自動入力する方法
- 9. ウェブページの値をExcelで自動的に入力する方法
- 10. Excelからのデータ収集を自動化する方法は?
- 11. DataReceivedEventArgsをインスタンス化する方法、またはデータを入力する方法
- 12. Linux:ライブサーバーにファイルをアップロードする - プロセスを自動化する方法は?
- 13. 選択ドロップダウンを追加して自動入力する方法
- 14. Visual Studio 2010でforeachループを自動入力する方法
- 15. フォームデータを自動入力する方法は?
- 16. 既存のExcelテンプレートにデータを自動入力する
- 17. スクリプトを使用してOpenOffice Calcスプレッドシートへのデータ入力を自動化
- 18. データ挿入時に自動更新をトリガーする方法は?
- 19. 確認デバイスのビルド設定とプロセスを自動化する方法はあり
- 20. Pythonでシェル入力を自動化するには?
- 21. ListViewで動的データ(processNameとpid)を入力する方法は?
- 22. 自動入力 - ドロプボックス
- 23. 入力データの初期化
- 24. フレックスアプリケーションを自動化する方法は?
- 25. インストーラテストを自動化する方法
- 26. データ入力を合理化/自動化するにはどうすればよいですか?
- 27. HTMLフォームの自動入力
- 28. Wordpressフォームの自動入力
- 29. テキストボックスの自動入力asp.net
- 30. ウェブページの自動入力
私は事 – Wes