ユニコードクッキー(特にFirefox)で検出される非標準の%uXXXXユニコード文字のエンコード/デコードに適したPerl XSモジュールがありますか?ユニコード%uXXXXのエンコード/デコードPerlのXSモジュール
復号:入力= ...%uXXXXという...、出力=正常UTF8のPerl列
エンコーディング:入力=正常UTF8 Perlの文字列、出力= ...%uXXXXという...
$string =~ s/%u([A-Fa-f0-9]{4})/chr(hex($1))/eg;
を、それのC-実装されたバージョンを持っていいだろう。今、私はこのコードを使用して、これらの文字列をデコードしています。
ありがとう、それは必要とされているようです。私はURI :: Escapeを探していましたが、%uxxxxエンコーディングについてのドキュメントでは見つかりませんでした。 XSバージョンはより高度なようです。私はそれをテスト/ベンチマークしていきますが、私はすぐにこの質問に回答としてマークします。一方、他のモジュールがあれば追加することもできます。ありがとうございました。 – ArtM
URI :: Escape :: XSモジュールは必要に応じてエンコード/デコードを行っていますが、残念ながら純粋なPerl正規表現の置換よりも10倍遅く動作します。 – ArtM