可能性の重複をASCIIに変換します
How to get string Objects instead Unicode ones from JSON in Python?Pythonの:Unicodeから文字列の複雑な辞書が
私はJSON API呼び出しから解析されたマルチレベルの辞書などの入力がたくさんあります。文字列はすべてユニコードであるため、u'stuff like this'
がたくさんあることを意味します。私はjqを使用して結果を再生し、これらの結果をASCIIに変換する必要があります。
は、私はちょうどそのようにそれを変換するための関数を書くことができます知っている:
def convert(input):
if isinstance(input, dict):
ret = {}
for stuff in input:
ret = convert(stuff)
elif isinstance(input, list):
ret = []
for i in range(len(input))
ret = convert(input[i])
elif isinstance(input, str):
ret = input.encode('ascii')
elif :
ret = input
return ret
がこのさえ正しいですか?わからない。それは私があなたに尋ねたいものではありません。
私が求めているのは、これが問題の典型的な強硬な解決策です。より良い方法が必要です。より平凡な方法。私はアルゴリズムの専門家ではありませんが、この方も特に高速に見えません。
もっと良い方法がありますか?そうでない場合は、この機能を改善できますか?
ポスト答え編集
Mark Amery's answerは正しいですが、私はそれの修正版を投稿したいと思います。彼の機能は、Python 2.7以降で動作し、私は2.6によので、それを変換する必要がありました:
def convert(input):
if isinstance(input, dict):
return dict((convert(key), convert(value)) for key, value in input.iteritems())
elif isinstance(input, list):
return [convert(element) for element in input]
elif isinstance(input, unicode):
return input.encode('utf-8')
else:
return input
Python 2をお使いの場合、unicodeは 'str'のインスタンスではなく' unicode'のインスタンスです。また、 'list'と' dict'処理では間違っています。 – agf
リストの場合、反復可能なものを扱うことを検討することをお勧めします。いずれの場合でも、if文のその枝を 'ret = [入力のxの変換(x)]'で置き換えることができます。また、あなたの辞書の場合を確認してください。 'ret'はディクショナリの最後のキーが変換されたものだけを含みます。 –
@MichaelMior説明したように繰り返し可能なものを扱うことの問題は、すべてのiterableがリストのようなものではないということです。例えば、辞書は反復可能ですが、 'ret = [input in xの変換(x)]'は、 'input'が辞書の場合には欲しいものではありません。 –