在处理python字符串尤其是汉语时会遇到各种编码错误。 我们可以用一个叫chardet的库中的detect检查字符串的编码方式。然后进行转换。 我通过下面的函数解决汉语编码问题。
import chardet
def codingurf8(str):
if chardet.detect(str)['encoding'] != 'utf-8':
str = str.decode(chardet.detect(str)['encoding']).encode('utf-8')
return str
|