異なるブラウザではテキストが異なって見えるようにエンコーディングに問題があります。別のブラウザでこのjsfiddleを考えてみましょう:すべてのブラウザで奇妙なフォントエンコーディング
https://jsfiddle.net/w3297yLt/
テキストは次のように正確になります。これは、フォントの問題ではないことを
Apple Museum je první muzeum svého druhu v České republice,
které bylo nedávno otevřeno v Husově ulici v centru Prahy.
Můžete zde nahlédnout do nedávné minulosti a vžít se do doby,
kdy Steve Jobs sestrojil spolu se Stevem Wozniakem v garáži
svých rodičů první osobní ...
注意、これは完全に健全であるフォントで発生します。
クローム(そのブレーキでも非付加記号文字は、単語garáži
を確認することに注意してください):
のFirefox:
クロムに似サファリ(が、問題garáži
は発生しません)。
最初の文字は正しく表示されていますが、いくつかの問題があるようです。当社のウェブサイト上のFirefoxで、それはさらに奇妙に見える(https://goout.net/cs/muzea/apple-museum/wucb/):
私の印象では、フォントが実際に文字と発音区別符号に分割されていることです。しかし、どうすればこの問題を解決できますか?アルゴリズムやツールはありますか?私たちはJavaを使用していますので、実装する必要があります。後者のFirefoxのインスタンスに向け
後者のFirefoxインスタンスの方へ:どのようなtext/htmlエディタを使用していますか? [テキストは正規化されずに分解されます](http://www.unicode.org/reports/tr15/#Norm_Forms)。例えば、 'm e 'と' n s k m'の代わりに 'm e s' '' '' '' '' '' '' m ''(隣接アクセントを適切に組み合わせるために隣接するグリフの間にスペースを追加する)ちなみに、この質問はSuperUserに属しています... – JosefZ
も参照してください[テキストの実行はUnicode正規化フォームCではありません](http://stackoverflow.com/q/5465170/3439404)。 _相互運用性を向上させるために、W3CはWeb上でNFC正規化テキストを使用することを推奨します._ – JosefZ
このテキストは、編集者によって別のサイトからコピー貼り付けされました。彼らはちょうど普通の人であり、背後にあるどんな技術も理解していません。編集者が心配する必要がないように、テキスト構造を修復するために何かを実装する必要があります。私はこれを修正するためのJavaコードを実装しているので、スーパーユーザーではなく、ここに投稿しています。私はそれを再標準化することを喜んでしますが、私はちょうど方法を知らない。 –