私はテキストのデコードに取り組んでいます。私は—
文字の文字コードを見つけようとしていますが、-
と誤解されることはありません。私はうまくいっていない。誰もそれを変換する方法を知っていますか?ウィキから' - 'のASCII文字コードとは何ですか?
答えて
引用(Em dash)
実際全角ダッシュが使用できない-として設定-ASCII文字ダブル( " - ")であるか、トリプルハイフンマイナス( "---" ) 使用されている。 Unicodeでは、emダッシュはU + 2014(10進数8212)です。
Emダッシュ文字はASCII文字セットの一部ではありません。
—
は、Em Dashとして知られています。文字コードは\u2014
です。 ASCII文字ではないため、ASCII文字セットを使用してそれをデコードすることはできません。代わりにUTF8を使用したいと思うでしょう。
JavaScript文字列はUnicode対応ですが、内部的にはUTF-8ではなくUCS-2を使用します。いずれにせよ、それを表現するエンコーディングを知る必要はありません。あなたが言ったように、 '\ u2014'という形式でUnicodeコードポイントと照合することができます。 – thomasrutter
この文字はASCIIではなく、通常はUTF-8でエンコードされたUnicodeでのみ存在します。
UTF-8では、2バイトまたは3バイトのいずれも有効なASCIIコードではなく、2バイトまたは3バイトのシーケンスでエンコードされます(すべてがASCII範囲外です)。
1人はあなたの質問に部分的にしか答えていないと考えていますが、もしそうなら、おそらくあなたの質問が誤って一部しか尋ねられていない可能性があります。詳細については、より詳細な質問を広げることができます。
- 1. 文字をASCIIコードに変換する
- 2. HTML ASCIIコードを文字の対応文字に変換する
- 3. 同じASCIIコードの2文字ですか?
- 4. ASCII文字とASCII以外の文字を含む文字列を逆転
- 5. ASCII文字62は
- 6. ASCII文字
- 7. ASCII NULL文字
- 8. sedで文字のASCIIコードを取得する方法はありますか?
- 9. 「文字列...」とは何ですか?コードで
- 10. SELECT文でASCIIコードを使用できますか?具体的にSOH文字
- 11. ASCII文字のみの文字列php
- 12. ASCIIのスーパーセットではない文字セット
- 13. メモリ内容をASCIIコードで文字列に変換する
- 14. 文字列内のASCII文字
- 15. これらの数字(ASCIIまたは?)は何ですか?
- 16. コードの代わりにASCII文字を送信する方法
- 17. URLの非ASCII文字
- 18. ASCII文字の正規化
- 19. ASCIIへの特殊文字
- 20. Cの非ASCII文字
- 21. サークル内の感嘆符の文字コードは何ですか?
- 22. Objective-Cコードの^文字の意味は何ですか?
- 23. 「ワイルドカード文字」とは何ですか?
- 24. エスケープ文字とは何ですか
- 25. マルチバイト文字セットとは何ですか?
- 26. **グロブ文字とは何ですか?
- 27. バイナリヌル文字とは何ですか?
- 28. ASCII以外の文字にはweb.configが必要ですか?
- 29. HttpServletRequest.setAttributeは()のASCII文字に変換
- 30. 文字エンコーディングASCIIでの互換性
「この文字をデコードする」とはどういう意味ですか?ソーステキストにはどのようなエンコーディングが使用され、結果にはどのエンコーディングを使用する必要がありますか? – raina77ow
@ raina77ow:私はアスキーテーブル –
でこの文字の番号を見つけようとしています。したがって、そのコードはどのエンコードが使用されているかによって異なります。例えば、Latin-1のテキストでは、 'mdash'は数字151で表されます。 – raina77ow