linux python运行报编码错误

2023-02-26 15:17:02Python013

linux python运行报编码错误,第1张

一次重启服务器后，supervisor接管的python脚本中的函数 open() 和 print() 都会报下面的编码错误：

UnicodeEncodeError: 'ascii' codec can't encode

使用的是python3，按理说编码都会默认utf-8，而且本地运行的python脚本并没有这个问题。

经大佬指点，增加环境变量 export LC_ALL="en_US.UTF-8" 后，再重启supervisor，问题解决

下面是复制的： https://www.cnblogs.com/badboy200800/p/11215981.html

Locale是一个软件在运行时的语言环境,。是根据计算机用户所使用的语言，所在国家或者地区，以及当地的文化传统所定义的。它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。

一个locale的书写格式为: 语言[ 地域[.字符集]]。完全的locale表达方式是 [语言[ 地域][.字符集] [@修正值]。例如：

zh_CN.GB2312 ＝> 中文_中华人民共和国＋国标2312字符集。

（1）locale把按照所涉及到的文化传统的各个方面分成12个大类

（2）查看标准字符集列表

常用字符集：en_US.utf8、zh_CN.gb2312、zh_CN.gbk、zh_CN.utf8等

3.Locale的设定

LC_ALL和LANG优先级的关系：LC_ALL >LC_* >LANG

（1）如果需要一个纯中文的系统的话，设定LC_ALL= zh_CN.XXXX即可。或者设定LANG=zh_CN.XXXX也可以，但是LC_ 不要有任何特殊设定才可以（因为LC_ 优先级高）。

（2）如果需要个性化的环境，例如只想要一个可以输入中文的环境，而保持菜单、标题，系统信息等等为英文界面，那么只需要设定LANG=en_US.XXXX，然后 LC_CTYPE＝zh_CN.XXXX就可以了。

（3）假如什么也不做的话，也就是LC_ALL，LANG和LC_*均不指定特定值的话，系统将采用POSIX作为lcoale，也就是C locale。

4.查看与设定字符集实践

（1）查看当前系统字符集三种方式（LC_ALL、LC_CTYPE和LANG），以查看LANG为例：

（2）更改系统字符集

备注：直接执行上述命令，可以临时修改系统字符集。如果写入环境变量可以永久改变字符集。

（3）取消当前系统字符集（设定为空）

备注：直接执行上述命令，可以临时修改系统字符集。如果写入环境变量可以永久改变字符集。

你需要明白两个概念：

什么叫字符串、字节串

在Python中字符串是指一串可以展示在终端里、供人阅读的字符，至于字符采用什么编码并不重要，同样的文字，可能是用Unicode、UTF-8或GBK编码，但打印在终端中的内容相同，那么就认为是同一串字符串。而字节串是指将字符串通过某种编码转换得到的一串字节，同样一个字符串，使用不同的编码转换后得到的字节串可能完全不同。

什么叫encode、decode

encode中文为编码，顾名思义，是将字符串以某种编码形式编码得到字节串的过程；相反，decode中文为解码，是将字节串以某种编码形式翻译得到字符串的过程。

a是一个字符串，它的内容是“周杰伦”这三个字，类型是str；b = a.encode('utf-8')是将a以utf-8形式编码得到的字节串，它的内容是“周杰伦”这三个字的utf-8编码，类型是bytes。

python3默认内码是UTF-8，不能设置为其他默认格式，文件需要保存成UTF-8格式。

操作系统默认字符环境是GBK的话，就需要手动转换，输入需要str.encode('UTF-8')转换,输出需要str.encode('GBK')转换。主要是操作系统的问题，如果操作系统是采用UTF-8编码的，就没有这个问题。

字符集字符串字节的话系统

# 上一篇：R语言缺失值处理

# 下一篇：C语言21点循环问题