1
私はJava 1.5を使用しています。文字列 (thisàèìòù---> aeiou)を正規化する必要があります。ノーマライザは使用できません> 1.6>のためです アイデアはありますか?アクセント記号付きの文字をJavaで変換する方法
私はこれを試してみた:
public String normalizeText(String text) {
text = normalizer(text);
text = text.replaceAll("\\p{InCombiningDiacriticalMarks}]", "");
return text;
}
public static String normalizer(String word) {
try {
int i;
Class<?> normalizerClass = Class.forName("java.text.Normalizer");
Class<?> normalizerFormClass = null;
Class<?>[] nestedClasses = normalizerClass.getDeclaredClasses();
for (i = 0; i < nestedClasses.length; i++) {
Class<?> nestedClass = nestedClasses[i];
if (nestedClass.getName().equals("java.text.Normalizer$Form")) {
normalizerFormClass = nestedClass;
}
}
assert normalizerFormClass.isEnum();
Method methodNormalize = normalizerClass.getDeclaredMethod(
"normalize",
CharSequence.class,
normalizerFormClass);
Object nfcNormalization = null;
Object[] constants = normalizerFormClass.getEnumConstants();
for (i = 0; i < constants.length; i++) {
Object constant = constants[i];
if (constant.toString().equals("NFC")) {
nfcNormalization = constant;
}
}
return (String) methodNormalize.invoke(null, word, nfcNormalization);
} catch (Exception ex) {
return null;
}
私はそれをテストしていませんが、おそらく[この答え](http://stackoverflow.com/a/10831704/1682559は)うまくいくかもしれません。これは、プレJava 6で動作するはずだと述べています。答えに説明されているように、変換する文字の範囲とその順序を知る必要があります。 –
コードの恐ろしい部分はどこから取得しましたか?それは完全に不必要に反射を使用し、プログラムを必要以上に複雑で非効率的にします。そして、Java 6クラス 'java.text.Normalizer'をJava 5で動作させることは魔法のようには進んでいません。 – Jesper