Nutchクローラーがクロールしていますlet's
としてLet’s
y ???この文字セットを変更する設定がありますか?Nutchクローラーが「ように」クロールしています
0
A
答えて
1
’
は、アポストロフィではない単一引用符のUTF-8エンコーディングであり、Windows-1252として解釈しています。適切なエンコーディング(UTF-8)を使用する必要があります。 This linkが役に立ちます。
1
私はNutchの自分自身を使用していないが、それは、関連だようthis pageに見えます:
$ TOMCAT/confに/ server.xmlを編集、UTF-8文字の通過を可能にするために。このパラメータの割り当てを<コネクタ> Web用のタグ(「8080」を探してください)を見つけて挿入しますはURIEncoding =「UTF-8」http://tomcat.apache.org/faq/connectors.html#utf8
関連する問題
- 1. Nutchへの代替Webクローラー
- 2. nutch 1.3のURLを再クロールする
- 3. Nutchで深くクロールする方法
- 4. nutchのフォームに書かれているように、Nutchの
- 5. 次のように分布する(展開)モードでNutchのクロール後フレンドリーフォーマット
- 6. Nutchを使用してクロールされたページの後処理
- 7. Nutchは特定のサイトをクロールできませんでした
- 8. 一部のURLがクロールされないようにします
- 9. Nutch 2.3.1でウェブサイトをクロールすると、製品リンクはスキップされますが、他のリンクはクロールされます
- 10. フォームの上にnutchクロールはありませんか?
- 11. Nutch 1.3でさまざまなスケジュールされたクロールの異なるサイトを再クロールするにはどうすればよいですか?
- 12. Nutchを記事のクロールに拡張する方法
- 13. Nutch-Hadoop:再クロールを行うURLの更新情報をクロールするにはどうすればよいですか?
- 14. Nutchを使用して指定されたURLリストをクロールする
- 15. Nutchがクロールしたsolrデータのインデックス作成中にエラーが発生しました
- 16. Nutch 1.10 - 同じTLDで100を超えるサブドメインをクロールしません
- 17. NutchはHadoopクラスタでどのように動作しますか?
- 18. apache nutchを使って外部リンクをクロールするのを防ぐ方法は?
- 19. ページネーションが、私はこのウェブサイトをクロールしようとしているscrapy
- 20. Googleはどのように動的ページをクロールしますか?
- 21. IOExeption最後に、私は例外下記の悪い、悪いを持って... Nutchの(1.4)とクロール1日後Nutchの
- 22. Googleクロール用に別のページが用意されています
- 23. Apache Nutch 1.4を使用してクロールおよび解析後に取得されたHTMLドキュメントから特定のタグを取得します。
- 24. Webクローラーが、私はRoRのを使用してい
- 25. Nutch 1.11 JAVA_HOMEが設定されていませんエラーです。
- 26. Googleはどのようにしてブログをクロールする必要がありますか?
- 27. Nutchはオンザフライで質問しています
- 28. Perl WebクローラーはどのようにASP.NETポストバックに従うことができますか?
- 29. アネモネによるサブドメインのクロール
- 30. Pythonクローラー。
でTomcat 5のFAQで説明したように私はそれを思ういけないがためのTomcatです私のcmdプロンプトも同じものを表示しているので... – ragaa
@ragaa:どのようにコマンドプロンプトを使用していますか? –
私は両方の端末(ubuntuで)とtomcatでチェックしました – ragaa