=
var.decode('ascii')可能会出错。
只要var的值是英文(内码0-127),转换不转换,都已经是gb2312编码。
其中, encoding 为检测出的编码, confidence 为可信度, language 是语言。另外一个例子:
检测的编码是GB2312,注意到GBK是GB2312的超集,两者是同一种编码,检测正确的概率是74%,language字段指出的语言是'Chinese'。
注意:chardet支持检测的编码列表请参考官方文档 Supported encodings 。