ジュリア、Learn Julia in Y Minutesへの入門ガイド、インデックスUTF8文字列からユーザーを思いとどまら:JuliaでUTF8文字列の索引付けが推奨されないのはなぜですか?
# Some strings can be indexed like an array of characters
"This is a string"[1] # => 'T' # Julia indexes from 1
# However, this is will not work well for UTF8 strings,
# so iterating over strings is recommended (map, for loops, etc).
はなぜ落胆このような文字列を反復処理されますか?この代替文字列型の構造について具体的には、インデックスエラーが発生しやすいでしょうか?これはジュリア固有の落とし穴ですか、これはUTF8文字列をサポートするすべての言語にまで及んでいますか?
UTF-8は、ユニコードのマルチバイトエンコーディングであるUTF-8文字列に索引付けのようなもの、またはコード単位とは対照的に文字に(長さを得るため)はO(n)(nは文字列のサイズ)操作です。そのようなことを頻繁に行う必要がある場合は、UTF32Stringを使用し、必要に応じてUTF8に/から変換する方がよいでしょう。これはジュリア固有の落とし穴ではありませんが、Python 3のようないくつかの言語は、文字列に応じて、索引付けのためのO(1)であるUnicode文字列の最適な内部表現を選ぶことができます。 –