python str与bytes编码解码

2023-02-26 11:57:02Python034

python str与bytes编码解码,第1张

下面一张图搞懂编码、解码、编码表之间的关系。

不难看出，它们是一种根据编码表进行翻译、映射的过程：

实际上，字符串类型只有encode()方法，没有decode()方法，而bytes类型只有decode()方法而没有encode()方法。

二进制格式的数据也常称为裸数据(raw data)，所以str数据经过编码后得到raw data，raw data解码后得到的str。

上面说了，编码是将字符数据转换成字节数据(raw data)，解码是将字节数据转换成字符数据。在Python中字符数据也就是字符串，即str类型，字节数据也就是bytes类型或bytearray类型。

编码时，可以使用字节类型的构造方法bytes()、bytearray()来构造字节，也可以使用str类型的encode()方法来转换。

解码时，可以使用str类型的构造方法str()来构造字符串，也可以使用bytes、bytearray()类型的decode()方法。

另外需要注意的是，编码和解码的过程中都需要指定编码表(字符集)，默认采用的是utf-8字符集。

例如，使用encode()的方式将str编码为bytes数据。

使用bytes()和bytearray()将str构造成bytes或bytearray数据，这两个方法都要求str->byte的过程中给定编码。

实际上，bytes()、bytearray()这两个方法构造字节数据的时候还有点复杂，因为可以从多个数据源来构造，比如字符串、整数值、buffer。如何使用这两个方法构造字节数据，详细内容参考help(bytes)和help(bytearray)给出的说明，这里给几个简单示例。

构造bytes的方式：

构造bytearray的方式：

解码是字节序列到str类型的转换。

例如，使用decode()方法进行解码"我"字，它的utf-8的编码对应为"\xe6\x88\x91"：

使用str()进行转换。

当编码、解码的过程使用了不同的(不兼容的)编码表时，就会出现乱码。所以，解决乱码的唯一方式是指定对应的编码表进行编码、解码。

例如，使用utf-8编码"我"字，得到一个bytes序列，然后使用gbk解码这个bytes序列。

这里报错了，因为utf-8的字节序列里有gbk无法解码的字节。如果使用文本编辑器一样的工具去显化这个过程，得到的将是乱码字符。

原文地址： https://www.cnblogs.com/f-ck-need-u/p/10185965.html

再MacOs运行的PyCharm中，执行python文件，如果不指定python文件字符编码会报错：

SyntaxError: Non-ASCII character '\xe6' in file /Users/yuchao/PycharmProjects/oldboy_python/python_lesson/模块与包/spam.py on line 6,

but no encoding declaredsee http://python.org/dev/peps/pep-0263/ for details

所以

找到FIle >Default settings >Editor >File and Code Templates >Python Script

如此创建python文件后就有头部信息了

PyCharm中的文件模版变量：

字节数据方法类型码表

# 上一篇：go语言开发过什么产品

# 下一篇：C语言中布尔类型如何打印为true或者false？

给您推荐相同类型的内容：

昆明Java培训：Java培训好不好？
Java培训好不好？可能对于不同的小伙伴得到的答案也是不一样的，这主要取决于每个小伙伴自己的感受，与这位同学学的好坏有关系、与这位同学的就业情况有关系而且还与Java培训机构有关系，今天小编从客观上分析一下Java培训好不好？Java培训好
r语言r可视化程序怎么编写与常用的可视化函数调用
最简单的方法就是每次引用时把写好的函数复制一下，到R console 中，然后写其他的。然后，编好的函数写成.r 文件，下次直接使用命令 source（function.r）就能导入使用了。 1、通过选择菜单：程序包-&gt安装程序
java都学哪些内容？学完之后可以做哪些工作？
java是目前主流的开发语言，程序员不论是大数据、云计算、web前端、后端开发等都需要从java学起，如果你想计入IT高薪行列，建议学java！java学习内容主要有：①JAVA编程基础（基础语法、面向对象、和谐特性等）②WEB应用开
怎么安装r语言中的rjava包
WINDOWS版的配置第一步：安装rJava和jdkinstall.packages("rJava")配置好java第二步：设置环境变量，涉及java调用R（我的电脑右键-属性-高级设置-环境变量）CLASSPAT
C语言写Pop函数取栈的出错
Pop函数改成这样：int Pop (Stack * pstack, int * pname){if(pstack-&gttop&lt=0){return 0}pstack-&gttop-- * pname =
请问SSE指令集怎样使用?谢谢！
你懂汇编么？不懂的话先学一下汇编语言懂的话，你要弄懂sse中每条指令所做的操作，知道所做的操作应该就会了。sse指令集使用的是自己的xmm0~xmm78个寄存器，每个寄存器128位。sse主要是对浮点数进行操作，也有对整数运算进行优化的。1
go的uint64转换成java的哪种类型
Golang 和javac不同，Go在不同类型的变量之间赋值时需要显式转换。也就是说Golang中数据类型不能自动转换。基本语法表达式T（v））将值v 转换为类型TT∶就是数据类型，比如int32，int64，float32等等v∶ 就是
c语言输出结果怎么分行显示？
在代码中加入换行符就可以实现分行显示，下面介绍2种的方法：#include&ltstdio.h&gtvoid main(){int a[2]={1,2}int i,jprintf("a[0]=%dn&qu
北大青鸟java培训：小程序的九种入口设计与使用方法？
说起小程序相信大家应该都不陌生了吧。经过长时间的推广和使用，现在大多数人都接受了小程序的使用方法。下面我们就一起来了解一下，小程序的入口都有哪些类型的。1社交立减金入口适用类型：需要使用微信支付的小程序入口位置：接入社交立减金的微信支付页面
R语言实用案例分析-相关系数的应用
R语言实用案例分析-相关系数的应用在日常工作中，经常会存在多个变量之间存在关联关系，比如学习数学好的同学，物理成绩可能也比较高。在公司中外貌和讨人喜欢的关系往往也比较大，在人事招聘过程中，如果想要更加综合的评价某个人，需要把相关系数比较高的
false是什么意思，C语言
false是布尔类型的变量，表示假。但是在C语言中并不支持该类型的变量。C++支持布尔类型的变量。布尔类型变量只有true和false两个值。通常用来表示条件的真与假，与常用的1(真)和0(假)相对应。可以通过宏定义的方式来对false和t
stdlib. h是什么意思？
是C语言中的一个头文件，stdlib 头文件里包含了C语言的一些函数，该文件包含了的C语言标准库函数的定义。1、意思是标准输入输出头文件。2、用到标准输入输出函数时，就要调用这个头文件。3、stdlib.h中，包含了C语言的一些常用且
R基础（2）：Rstudio的基本介绍
相比于RGui，Rstudio作为R语言的编辑器使用方便太多，从我开始学习R语言，我就用起来Rstudio。虽然R的界面都是英文的，但其实用起来并不那么复杂，常用的功能就那么几个。这次，我来给R语言学习的新手们做一个Rstudio的基本介绍
用 Python 为接口测试自动生成用例
基于属性的测试会产生大量的、随机的参数，特别适合为单元测试和接口测试生成测试用例尽管早在2006年haskell语言就有了QuickCheck来进行”基于属性的测试“，但是目前来看这依然是一个比较小众的领域，参考资料有限
如何用C语言来使用openssl rsa进行公钥加密，已有公钥和明文
1. 本程序使用2048位密钥对,每次加密时,原始数据的最大长度为245字节,加密后的密文长度为256字节.(采用打PADDING 的加密方式)2. 如果所加密数据长度大于245字节,请分多次加密,后将密文按顺序存储解密时,每次读取256字
C语言与CAD
有C++的接口，第三方的，Opendwg，不过这个软件包是收费的，对新版本的图纸支持总是慢一拍Adesk自己提供的，realdwg，这个要合作伙伴才给，私人的话，只能是了解一下了学CAD完全不用学C语言这两个是不同性质的东西CAD属于计算机
C语言中assert的作用是什么？
是程序调试很重要的手段，ASSERT( f )在Debug模式下，每次运行到这里后会计算括号中的表达式，如果表达式为0，则中断执行，弹出一个警告框，用户可选择“继续”，“重试”，“忽略”在Release模式下，这句语句不会被编译进代码。AS
c语言文件问题： 1."rb"与 "r"的含义分别是什么 2.while（！feof(fp)）是什么意思？
"r".为读而打开文本文件.(不存在则出错)"rb".为读而打开二进制文件while（！feof(fp)）文件到尾判断最常用的文件使用方式及其含义如下:"r".为读而打开文本
C语言中的class函数有什么用~
Class可以通过extend关键字实现继承。super关键字表示父类的构造函数，用来新建父类的this对象。子类须在constructor方法中调用super方法，这样才能得到父类的this，否则会报错。这是因为子类自己的this对象，
Java如何学习？
Java是一种面向对象的编程语言，任何功能都需要通过编写代码程序来实现，一般在有开设信息技术类相关课程的大学可能会教授一些Java基础内容，但反之对于偏文科类的学校或专业的学生来说，Java对于他们是很陌生的，甚至一无所知。那么Java如何
如何评价佳沃(JAVA)牌自行车?
挺好的，中端品牌。Java的原装配件（以我使用过的终结者为例），除了手变和前后拨是实打实的禧玛诺，别的东西，牙盘和轮组是自家的deca，夹器是彦豪。这三个是配置上主要的槽点，至于日辉的飞轮和没注意是哪家的链条，还算够用。牙盘。终结者的原装
python用哪个版本好呢
可以使用python3.9的版本。Python 提供了高效的高级数据结构，以及简单有效的面向对象编程。 Python 语法和动态类型，以及解释型语言的性质，使其成为在大多数平台上编写脚本和快速应用程序开发的编程语言。随着版本的不断更新和
R语言计算方差
nrow(leadership)是leadership这个数据集的行数（可能就是样本数），1:nrow(leadership) 是一个向量，从1到nrow(leadership)，sample(1:nrow(leadership)) 是将里
C语言里itoa函数的功能是什么？
itoa为c语言的一个函数。itoa函数是一个广泛应用的，从非标准扩展到标准的C语言。它不能被移植，因为它不是标准定义下的C语言，但是，编译器通常在一个不遵循程式标准的模式下允许其通过header，因为它是一个从逻辑对应到标准库的函数。it
go语言为什么没有minmax函数
go语言math包里面定义了minmax函数，但是是float64类型的，而并没有整数类型的minmax。因为go没有重载，这是个大坑。所以math库里minmax函数都只能定义一个，所以官方选择了比较难实现的float64类型。而简
GO语言学习系列八——GO函数(func)的声明与使用
GO是编译性语言，所以函数的顺序是无关紧要的，为了方便阅读，建议入口函数 main 写在最前面，其余函数按照功能需要进行排列 GO的函数不支持嵌套，重载和默认参数GO的函数支持无需声明变量，可变长度，多返回值，匿名，闭包
c语言扑克牌
定义个字符数组，存放 A-K 牌面的字母 char ch[][3]={"A","2","3","4","5","6",&
python开发一个web留言板
实现http服务监听，所用的库urllib，httplib，对于header或者cookie有要求可以使用httplib2。在接到响应后传给客户端信息或者给出trace信息这是最简单的实现，对于线程，安全，密码验证都一概没有Django时下
python异步有哪些方式
yield相当于return，他将相应的值返回给调用next()或者send()的调用者，从而交出了CPU使用权，而当调用者再次调用next()或者send()的时候，又会返回到yield中断的地方，如果send有参数，还会将参数返回给yi
go语言语法(基础语法篇)
import "worknamepacketfolder"导入多个包方法调用包名.函数不是函数或结构体所处文件或文件夹名 packagename.Func()前面加个点表示省略调用，那么调用

推荐阅读

热门文章

最新发布

标签列表

python str与bytes编码解码

给您推荐相同类型的内容：