1、
json.loads Python错误:
'utf8' codec can't decode byte ...
由于需求,要用python读取网页返回json,并取得其中的数据但是却遇到以上编码的问题。
终于找到了解决方案:
我们只需要对字符串进行unicode化,忽略错误就行了~
代码如下:
[python] view plain copy
str2 = unicode( str, errors='ignore')
但是要注意,这里的str必须为字符串,处理之后再送入json.load就可以了~
[python] view plain copy
data = json.loads(str2)
unicode化+忽略错误真给力。。。
2、
ValueError: Invalid \escape: line 1 column 35442 (char 35441)
问题在于编码中是\xa0之类的,当遇到有些 不用转义的\http之类的,则会出现以上错误。
解决方案如下:
[python] view plain copy
import re
regex = re.compile(r'\\(?![/u"])')
fixed = regex.sub(r"\\\\", original)