2012-02-20 19 views
1

背景:文章の言語を検出します(20〜200文字)。

  • 私は、自動的にフィールドのテキストで、ユーザによって書かれた言語を検出したいと思います。
  • ユーザーは10文字から200文字まで書き込みます。
  • ほとんどがスペイン語と英語になります。
  • 私はPHPとCodeIgniterのでウェブをプログラミングしています。

私の解決策:私はライブラリを使用しています。私が見つけた最高のものはです。Text LanguageDetect 0.3.0です。しかし、それは時々失敗します(たとえ私が言語をスペイン語と英語に制限しても)。

ヘルプ/アドバイス: ライブラリがあまり良くないのですか?あなたは誰よりもよく知っていますか? それは私が多くを求めているからですか?わずか20文字で言語を検出します。

ありがとうございます!

+1

おそらく20の文字が悪いサンプルサイズかもしれません。通常は、その言語で最も一般的な単語を探すのがあなたの最善の策です –

+0

正しく検出されない20文字のテキストの例を挙げられますか? –

+0

こんにちはMr Listerさん。私を明確にしましょう。言語を英語とスペイン語に制限すると、20文字でうまくいきます(10文字未満の問題のみです)。しかし、私がポルトガル語やイタリア語を含むと、スペイン語を検出することができません。(20 ch。時には長い文章 - > 100 ch。) –

答えて

2

あなたは、GoogleがAPIを翻訳使用しようとすることができますが、このサービスはnon-free

http://code.google.com/apis/language/translate/v2/using_rest.html#detect-language

+0

Victorに感謝します。私はこのツールを知っていましたが、可能であれば、まずは無料のものを試してみたいと思います。 –

+0

http://translate.google.com/にアクセスするには、テキストを入力し、ドロップダウンメニューで[From]を選択し、[Detect Language] –

関連する問題