但在windows下编写python程序的时候,我们一般采用的编码是utf-8
二者不一致是导致乱码的根本原因!
在pycharm下,为了中文不乱码,那么需要注意一下几个方面:
一、每一个源程序文件头部,需要加上
#-*-coding:utf-8-*-
这样就没有乱码了
获得response.text有如下类似的乱码:
解决方法有两种:
第一种:
apparent_encoding方法是requests库利用chardet对字节流编码进行了猜测。一般来说使用这种方法,大部分网页的中文乱码都会恢复。如果还是不行,那就试试第二种方法。
第二种:
从网页格式中获得网页内容的编码方式(一般content-type字段会出现在HTML的header的头几行)。
如果直接拿来用,会报错
所以需要给decode加上第二个参数,decode([encoding], [errors='strict']), 第二个参数设置为ignore,则会忽略非法字符。
这样就能获得正确的中文内容了。
练习网址 https://news.mydrivers.com/1/628/628585.htm
python解决报表显示中文乱码的方法:
在代码文件的第一行添加“# coding=utf-8”语句,该语句可以使编译器以utf-8格式对中文解码,这样中文就不会出现乱码了
示例如下:
执行结果:
更多Python知识,请关注:Python自学网!!