0
doc = open("1.html").read().strip()
doc = doc.decode("utf-8","ignore")
この例は問題ありません。私は正しいユニコードの文字列docを得ることができます。Python文字列を文字列検索で変更できますか?
doc = open("1.html").read().strip()
if u"charset=utf" in doc or u"charset=\"utf" in doc:
doc = doc.decode("utf-8","ignore")
エラーがある「UnicodeDecodeError: 『ASCII』コーデックは位置289でバイト0xe7をデコードすることはできません:序ない範囲(128)で」 誰もがこれを説明することができますが?文字列docは文字列findによって変更できますか? 1.htmlには中国語が含まれています。