一部の友人と私は、ユニにマシンでの作業を簡単にする一連のスクリプトを作成しています。これらのツールの1つは現在Nokogiriを使用していますが、これらのツールをできるだけ設定の少ないすべてのマシンで実行するために、ユーザーにRVMとカスタム宝石をインストールするのではなく、ネイティブのhtmlパーサーを見つけようとしていますほとんどのユーザーのディスクスペースの制限のため)。Rubyコアライブラリを使用してHTMLを解析しますか? (つまり、宝石は必要ありません)
Nokogiri/Hpricot /にはかなり制限されていますか?私たちのニーズに合った独自のカスタムパーサを書くだけでよいでしょうか?
乾杯。
編集:ここに私の検索で逃した投稿がある場合は、私に教えてください!そう。
XMLパーサよりも悪いマークアップのより寛容でなければならないあなたがきちんとしてもHTMLを実行することができルビーSTDLIB
HTMLパーサにはHTMLパーサはありません...時々
に速くREXMLを作ることに取り組んでいましたオープンソースでは、あなたはいつでも宝石から必要なものを抽出し、カスタムパーサーで使用することができます。その後、あなた自身のコードを提供する必要があります。 –
あなた自身の書き込みをお勧めします。 –
既存の魂を使う方がはるかに信頼できるでしょう。 @MarcTalbotが言っていることは鍵です。もし宝石がオープンソースであれば、あなたはあなたのアプリケーションにソースをコピーすることができます(非GPLライブラリを必要としないと仮定します)。 – Linuxios