私は、人があらゆる場所からコピー/貼り付けを行うコンテンツ(ほとんどの場合Word文書)から生成されるXML文書を持っています。U + 001Aを含むXML文書のエンコーディング
それは次のようになります。私はいつもUTF-8
またはiso-8859-1
のエンコーディングを使用しましたが、今誰かがなくなって、コピー/ Unicode文字U+001A
(0x1a
)貼り付けると、私は見つけることができません
<?xml version="1.0" encoding="UTF-8"?>
<response>
<data> <![CDATA[
(whatever was pasted)
]]></data>
</response>
それを受け入れるエンコーディング使用するエンコーディングの種類にかかわらず、XMLファイルを(Firefox、Internet Explorer、XML Spyなど)に入れたものはすべて無効だと言います。
ファイルが停止するのを防ぐために使用できるエンコーディングがありますか、またはこれらの文字を1つずつ取り除く必要がありますか?
私は聞くことを望んでいなかったが、ありがとう。 「確かに非常に速く修正する」という別のものは、別の長い一日に変わるようです。 –