2016-11-28 5 views

答えて

2

これは、ダウンロードアクションがダイレクトファイルへの単なるリンクであれば、ボタンがどのように実装されているかにはまったく依存しません。ダウンロードアクションが、いくつかのjavascriptイベントまたは<button>要素を持つフォームで発生した場合、Nutchはこれを検出しません。おそらくprotocol-seleniumを使用すると、リンクがいくつかのjavascriptを使用して生成される場合に役立ちます。

EDITはボタンのonclickイベントのようなものでトリガされているので

、その後、あなたの最善の策はprotocol-interactiveseleniumhttps://github.com/apache/nutch/blob/master/src/plugin/protocol-interactiveselenium/README.md)を使用し、必要であれば、おそらくカスタムハンドラを実装することです。私はこれを個人的にテストしていませんが、うまくいくはずです。

+0

ありがとうございます:)ファイルをダウンロードするためのハイパーリンクは、ページがロードされた後、javascriptによってボタンにアタッチされます。私はnutch-default.xmlでseleniumプラグインを使用しようとしましたが、運はありません:( – ammu

関連する問題