2009-04-27 8 views
1

英語以外の言語で何かをするのは初めてです。今まで私がプログラムでやったことは、基本的な英字+数字で入力して出力することだけです。今ではロシア語のテキスト(特にロシアのwikipediaページ)を操作する必要がありますが、どこから始めるべきかわかりません。私はグーグルとグーグルだが、私が得るのは、ユニコード、UTF-8などについて語っている結果だが、それらは私が意味するものではない。 Wikipediaのエントリ自体は、すでにこのことを知っている人のために書かれているようです。Perlでロシア語のテキストを処理するにはどうすればよいですか?

誰も私を良い出発地に向けることができますか?

答えて

7

Unicodeが何であるかをまず知る必要があるようです。 Joel Spolskyの記事The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)が良い出発点になるかもしれません(経験豊かな人にとっては、それは非常に有益ではありません)。

その後、Perl Unicode Tutorialを見てみると、PerlがUnicodeをどのように処理するかを調べる必要があります。

+0

ありがとうございました。私はその記事が私が探していたものだと思っています:) – Mike

+0

注:実際、Joelの記事は技術的な観点からかなりひどいものであり、おそらくそうではないはずのものが多くあります。私はより良いものを書くことができると主張していないが、半分の知識が実際に傷つき、おそらく上記の記事を読んだ後にはそれほど多くないことが何度も証明されている。 – Joey

関連する問題