ヒンディー語(言語)でcsvファイルを書いていますが、解析すると結果が異なります。特殊文字(別の話し言葉)を含むcsvファイルを読む
たとえば、私は以下のcsvファイルを作成します。
1234444070;आज आप कैसे हैं???
私はopen(csv_aws_url).read
を使用して同じファイルを読むとき。私は得る:
"1234444070;\xE0\xA4\x86\xE0\xA4\x9C \xE0\xA4\x86\xE0\xA4\xAA \xE0\xA4\x95\xE0\xA5\x88\xE0\xA4\xB8\xE0\xA5\x87 \xE0\xA4\xB9\xE0\xA5\x88\xE0\xA4\x82???\r\n"
これは私が解析中に同じ内容を読むことが起こることができますか?
あなたの 'open'の前に' puts'を入れてみてください。あなたが 'String#inspect'の出力を見ているようですが、これは同じデータの視覚的表現が異なっているだけです。 –