- 私は、自動的にフィールドのテキストで、ユーザによって書かれた言語を検出したいと思います。
- ユーザーは10文字から200文字まで書き込みます。
- ほとんどがスペイン語と英語になります。
- 私はPHPとCodeIgniterのでウェブをプログラミングしています。
私の解決策:私はライブラリを使用しています。私が見つけた最高のものはです。Text LanguageDetect 0.3.0です。しかし、それは時々失敗します(たとえ私が言語をスペイン語と英語に制限しても)。
ヘルプ/アドバイス: ライブラリがあまり良くないのですか?あなたは誰よりもよく知っていますか? それは私が多くを求めているからですか?わずか20文字で言語を検出します。
ありがとうございます!
おそらく20の文字が悪いサンプルサイズかもしれません。通常は、その言語で最も一般的な単語を探すのがあなたの最善の策です –
正しく検出されない20文字のテキストの例を挙げられますか? –
こんにちはMr Listerさん。私を明確にしましょう。言語を英語とスペイン語に制限すると、20文字でうまくいきます(10文字未満の問題のみです)。しかし、私がポルトガル語やイタリア語を含むと、スペイン語を検出することができません。(20 ch。時には長い文章 - > 100 ch。) –