特に、java(preferred)またはperlでurlを入力してそのページのテキストをコピーできるかどうか疑問に思っていますか?具体的には、私はgoogle上で何かを検索し、出てくる最初の5つのリンクをコピーするだけでコピーできるようにしたい。 SEOや何かをやっているのは、そのプログラムだけです。WebプログラムからテキストをコピーするJavaプログラムまたはPerlスクリプト
答えて
これはどちらの言語でも間違いなく可能です。 Java用の次を見てみましょう:
http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html
ドキュメントから:
URL oracle = new URL("http://www.oracle.com/");
BufferedReader in = new BufferedReader(
new InputStreamReader(
oracle.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
これはあなたのページのHTMLを与えるだろう。
うわーなので、これはHTML全体を1つの動きにするだけでしょうか?驚くべきことに、それは空白を削除するでしょうか? – CMOS
このコード例はHTMLを出力しますが、htmlを文字列に連結するために簡単に変更できます。空白を取り除くのはやや難解です。 http://stackoverflow.com/questions/1963337/how-to-strip-insignificant-whitespace-out-of-htmlを見てください – nolt2232
これはGoogle検索ではうまくいくと思いますか?私はちょうどGoogle検索のソースコードを表示しようとしました。すべての緑色のリンクを調べてtext = /に変換するために、ある種のイメージスキャナを使用する必要があります。助けてくれてありがとう。 – CMOS
Javaではわかりませんが(確かに可能です)、PerlではCPANモジュールを試すことができます。LWP/UserAgentはページを取得できます。簡単
上記のあなたのコメントを見require LWP::UserAgent;
my $ua = LWP::UserAgent->new;
$ua->timeout(10);
$ua->env_proxy;
my $response = $ua->get('http://search.cpan.org/');
if ($response->is_success) {
print $response->decoded_content; # or whatever
}
http://search.cpan.org/~gaas/libwww-perl-6.03/lib/LWP/UserAgent.pm
、私は追加しようと思いました。 Perlで空白をストリッピングするのは簡単です:$string =~ s/\s//g;
または上記のコードに適用される
$response->decoded_content =~ s/\s//g;
- 1. Perlプログラムでバイナリファイルをコピーする方法
- 2. Java Swing - プログラムでJTableからクリップボードにコピー
- 3. Perl/CGIスクリプトでJavaプログラムを実行する
- 4. WordからPowerpointにプログラムでプログラムをコピーする方法は?
- 5. perl cgiスクリプトからPythonプログラムを呼び出す方法
- 6. JavaプログラムからPerlスクリプトを実行するにはどうすればよいですか?
- 7. あるJavaプログラムから別のJavaプログラムへ値を渡す
- 8. Javaプログラムから実行されたスクリプトの一部だけ
- 9. PHPプログラムまたはWebアプリケーション
- 10. JavaプログラムからモバイルWebブラウザをシミュレートする
- 11. Excelテキストから列プログラムで
- 12. Perlスクリプトは、私は別の文字列を置き換えるPerlスクリプトを実行していたターミナルで実行しますが、Javaプログラム
- 13. プログラムでJava Webアプリケーションを作成する
- 14. PythonプログラムからWebアプリケーションへ
- 15. Python WebアプリケーションからPerlプログラムに環境を渡すにはどうしたらいいですか?
- 16. EditTextからプログラムにテキストを送るソフトキーボード
- 17. Javaプログラムから特定のURLのWebブラウザを閉じる
- 18. JavaプログラムをJavaプログラムでコンパイルする...
- 19. JavaプログラムからC++プログラムを起動する
- 20. 別のJavaプログラムからRMIプログラムを実行する
- 21. JavaプログラムからJMeter WebDriver APIをプログラムで使用する方法。
- 22. perlからプログラムを起動するには?
- 23. C#プログラムでWebフォームにテキストを入力しますか?
- 24. JavaプログラムからPHPスクリプトに要約値を取得するには?
- 25. プログラムへのargs []によるJava Beanshellスクリプト?
- 26. プログラムでJavaプログラムからAndroidアプリをインストールします(Runtime.getRunTime()。幹部は、(adb.exeインストールapp_package_name)
- 27. Java Web Startプログラムからサーバへの応答を取得
- 28. Webサーバーで作成したJavaプログラムを使用する
- 29. QTプログラムからターミナルでbashスクリプトを起動する方法は?
- 30. Javaプログラム内から.javaファイルをコンパイルしますか?
スクレイピングのこの種は、使用のGoogleの利用規約で禁止されています。代わりに[API](http://code.google.com/more/#google-search)を使用してください。 – daxim