他のものよりも使い易いかどうかはわかりませんでした。 Java、PHP、またはPerlです。RSSフィードをスクラップしたい場合はどのようなプログラミング言語を使用しますか?
答えて
最高のものは、あなたが最も快適に働くことです。
ジョブを実行するのに適切なツールを使用している限り、実際には問題ありません。
アプリケーションを配備する場所(Web対デスクトップ)、新しいテクノロジ/言語の学習に費やす時間、RSSやXML、および/またはHTMLを解析するためのライブラリの可用性を考慮する必要があります。あなたが名前を挙げた3つの言語はすべて良い候補です。
RSSファイルは、インターネット経由で入手した形式のXMLです。あなたが言語で必要とするのは、HTTPリクエストを行うことができ、XMLを解析する方法があることだけです。
フレームワークコードは何でも構いませんが、XSL変換(またはXPathクエリ)を使用してXMLをより美味しい形式にすることを検討してください。 Espec。あなたがデータの小さなサブセット、または個々の値を探しているならば。
ソースデータが最初に機械で解析されることになっていたのでは、ほとんど「掻き集める」ことはありません。 :)
特定のテクノロジがより強力で、デッドライン(またはその他の要因)がある場合は、すべての機能を備えているので、そのテクノロジに従ってください。
これが当てはまらない場合、それはあなたが取り組んでいるプロジェクトの要件になります。また、新しい技術を習得したい/習得することができます。
PHPは最も自然にWebベースのテクノロジーであり、このようなライブラリを使用してSimple HTML DOM Parser(XMLもサポートしています)を使用して、PHPがサポートするWebスクレイピングの複雑さを深く掘り下げて調べることができます。
Javaは良い結果を持つ過去に使用したWeb Harvestという素晴らしいプロジェクトを持っています(非標準のxml構文を学んでいますが、xsltと似ていますが)。システムがあなたのWebスクレイピングを設定すると簡単に変更することができます。
Perlはregex(Java、特にPHPは私が見つけたregexで作業するとちょっと乱雑になることがあります)とregexはあなたの情報で何をしたいのかに応じてもっとも優れていますreasnobleオプションです。
頻繁に実行し、多数のサイトにコンテンツを集約する必要があるサーバーアプリケーションを作成する場合は、パフォーマンスが重要な基準になります。これは大量のデータをすばやく処理できる言語を意味します。
時折実行し、多くのページからデータのビットを選ぶだけのプログラムが必要な場合は、特殊な言語を検討することができます。製品TestPlanは、RSSコンテンツをすばやく取得し、簡単な方法で公開できるようにする非常に単純な言語を提供します。
私はこれを重要なスクレイピングプロジェクトで使用しました。驚くほど高速ではありませんが、スクリプトは非常に保守しやすいです。
- 1. ゲームエンジンと3Dモデリングソフトウェアを使用している場合は、どのようなプログラミング言語を使用しますか?
- 2. RSS/Atomフィードの作成:テンプレート言語またはXMLライブラリ?
- 3. プログラミング言語がcamelCaseを使用している場合、PostgreSQL識別子の下線またはキャメルケース?
- 4. Dプログラミング言語でインクリメンタルガベージコレクタを使用していますか?
- 5. グラフAPIを使用したRSSフィードのコメントとどう違うのですか?
- 6. 異なるGPL(汎用プログラミング言語)を使用して実装されたDSL(汎用プログラミング言語)
- 7. どのプログラミング言語が言語レベルの状態をサポートしていますか?
- 8. プログラミング言語プロジェクトを使用して
- 9. RSSフィードからアジア言語をフィルタリングする方法は?
- 10. ダミーのプログラミング言語をお探しの場合
- 11. PHPなどのプログラミング言語でメールを確認しますか?
- 12. xAgentを使ってRSSフィードを読むには?私はxAgentを使用して外部のRSSフィードを読み込むしようとしています
- 13. グラフを解釈するためにどのようなプログラミング言語を使用できますか?
- 14. 論理プログラミングのためのPrologより新しいプログラミング言語
- 15. プログラミング言語を使用してErlang(k)変数をどのようにシミュレートしますか?
- 16. RSSフィードが変更されていない場合は何もしない
- 17. プログラミング言語/ライブラリはハードウェアとどのように通信しますか?
- 18. 関数型プログラミング言語はどのように実装しますか?
- 19. より高い言語でILを使用する場合
- 20. メールサーバーにはどのようなプログラミング言語が使用されていますか?
- 21. iPhoneアプリケーションにはどのようなプログラミング言語が使用されていますか?
- 22. マルチメディアリモコンにはどのようなプログラミング言語が使用されていますか?
- 23. lvalueという用語はどのような言語を作りましたか?
- 24. 電子コンポーネント(ステッピングモータなど)とのインターフェイスには、どのようなプログラミング言語(またはC++のライブラリセット)を使用しますか?
- 25. プログラミング言語または「教師なしの言語学習」の逆工学
- 26. プログラミング言語で 'use'または 'using'を使用する
- 27. パースRSSフィードasp.netを使用してC#
- 28. Googleの新しいプログラミング言語:Noopについてどう思いますか?
- 29. どのようなプログラミング言語がGoogleアナリティクスの設計に使用されていますか(グラフセクション)
- 30. GWTとGAEを使用してRSSフィードを読むにはどうすればよいですか?