Python如何将Unicode中文字符串转换成 string字符串

2023-02-26 15:25:01Python019

Python如何将Unicode中文字符串转换成 string字符串,第1张

Unicode字符串可以用多种方式编码为普通字符串，假设unicodestring = u"Hello world"，依照所选择的编码(encoding)，如下：

1、#将Unicode转换成普通的Python字符串:"编码(encode)"。

2、 #将普通的Python字符串转换成Unicode: "解码(decode)"。

扩展资料：

Python转换字符和字符串的原因：为了处理不适合用ASCII字符集表示的数据。

在以ASCII码为中心的语言和环境中，字节和字符被当做相同的事物。由于一个字节只能有256个值，这些环境就受限为只支持256个字符Unicode码，另一方面，有数万个字符，那意谓着每个Unicode字符占用多个字节，因此，你需要在字符和字节之间作出区别。

（1）UTF-8编码能处理任何的Unicode字符。它也是与ASCII码向后兼容的，因此一个纯粹的ASCII码文件也能被考虑为一个UTF-8文件，而且一个碰巧只使用ASCII码字符的 UTF-8文件和拥有同样字符的ASCII码文件是相同的。

这个特性使得UTF-8的向后兼容性非常好,尤其使用较旧的Unix工具时。UTF-8 无疑地是在 Unix上的占优势的编码。它主要的弱点是对东方文字是非常低效的。

（2）UTF-16编码在微软的操作系统和Java环境下受到偏爱。它对西方语言是比较低效,但对于东方语言是更有效率的。一个UTF-16 的变体有时叫作UCS-2 。

（3）ISO-8859编码系列是256个字符的ASCII码的超集。他们不能够支援所有的Unicode码字符他们只能支援一些特别的语言或语言家族。

ISO-8859-1,也既Latin-1,包括大多数的西欧和非洲语言,但是不含阿拉伯语。ISO-8859-2,也既Latin-2,包括许多东欧的语言,像是匈牙利语和波兰语。

参考资料：

百度百科--Unicode

对于单个字符的编码，Python提供了ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符：

最常用的编码是UTF-8，如果没有特殊业务要求，请牢记仅使用UTF-8编码。

在爬虫中会经常遇见，需要用encode和decode来进行互相转码

str转bytes

注意，含有中文字符的str不能用acsii格式转码

bytes转str

** 程序中经常会遇到个别字符转码不成功而报错，因此在decode方法中需要这个参数errors='ignore'忽略错误的字节

注意格式化的数据格式

字符字符串语言字节转换成

# 上一篇：R语言中有哪些取整运算？

# 下一篇：c语言随机点名

给您推荐相同类型的内容：

golang-指针类型
tips： *号，可以指向指针类型内存地址上的值，&amp号，可以获取值类型的内存地址每一个变量都有内存地址，可以通过变量来操作内存地址中的值，即内存的大小 go语言中获取变量的内存地址方法：通过 &amp 符号
c语言随机点名
“为了公平起见，我们决定做一个随机点名小程序”不是说你们决定做一个小程序吗？为什么不自己做呀？没有必要一个班的学生都没有能力编写一个这种简单程序吧百度知道并不是一个提交结果的平台，所谓知道就是将知识贡献，让大家获得启发，不是给人当奴隶干活！
微信是用什么语言开发的
一般安卓手机的应用软件目前都是以Java为主的程序语言开发的，包括微信。许多的 Android应用都是Java程序员开发者开发。虽然 Android运用了不同的JVM以及不同的封装方式，但是代码还是用Java语言所编写。相当一部分的手机中
python一个类可以有两个子类吗
class subclass(superclass1,superclass2):一个子类当然可以继承多个超类,以上表示定义一个subclass类,从类superclass1,superclass2继承比如下面的代码子类C就继承了A和B类cl
求《java工程师修炼之道》全文免费下载百度网盘资源,谢谢~
《java工程师修炼之道》百度网盘pdf最新全集下载:链接: https:pan.baidu.coms1uF5Q85XHoMu266iXiudkVQ?pwd=tz9a 提取码: tz9a简介：《Java工程师修炼之道》可以看作一本
Python API快餐教程(1) - 字符串查找API
字符串是7种序列类型中的一种。除了序列的操作函数，比如len()来求字符串长度之外，Python还为字符串提供丰富到可以写个编辑器的API. 首先，下面的查找API都是为了查找位置，或者查一共有几次这样的操作。如果只是想判断
GO语言（十六）：模糊测试入门（上）
本教程介绍了 Go 中模糊测试的基础知识。通过模糊测试，随机数据会针对您的测试运行，以尝试找出漏洞或导致崩溃的输入。可以通过模糊测试发现的一些漏洞示例包括 SQL 注入、缓冲区溢出、拒绝服务和跨站点脚本攻击。在本教程中，您将为一个
推荐几个北京的网站建设公司，想做网站
极其流行，同样也是竞争力极其大的一种商业模式。虽然国内软件开发公司都发展壮大起来了，但是各地软件开发公司的实力及资质仍然参差不齐。下面为大家介绍下近期国内软件开发公司的排名汇总。1：华盛恒辉科技有限公司上榜理由：华盛恒辉是一家专注于高端软件
r语言中pr是什么意思
pr的英文全称为PageRank，中文意思是网页级别技术(PageRank):指的是PR值,用来标识网页的等级,越高说明越受欢迎。 pr还包含其他意思，分别有：1、Premiere视频编辑软件；2、public relations公共关系英
求问R语言怎么用ecdf的结果
相当于一个函数,你可以看下:x &lt- rnorm(1000)y &lt- ecdf(x)y(x)plot(x,y(x), ylab = "ECDF(x)")ks.test()实现了KS检验，可以检验任
想学Java开发，去Java培训机构有用吗?
Java成为世界上最为受欢迎的编程语言，有用Java工程师工资不错为此很多小伙伴加入Java行业学习Java编程语言，当然也有部分小伙伴提出质疑那就是参加Java培训有用吗?参加Java培训真的可以获得高薪吗?其实针对这点没有任何一家Jav
请问python中怎么用正则表达式匹配用户的输入中是否有逗号呢？求请教！
python 3.3 脚本import res1 = 'adkkdk's2 = 'abc123c,efg'an = re.search(',', s1)if an:print(
写r语言 cpu重要吗
写r语言对cpu有一定的要求，但是对内存的要求还是比较大的。如果说你想用电脑进行程序的编程，电脑的最低配置，现在来讲也要达到I5的CPU，8G的内存最好能再配一个独立显卡，这样效果才最理想。R是用于统计分析、绘图的语言和操作环境。R是属于G
想学Java，看哪家的Java视频好？
想学java最好看千锋教育的视频。而且千锋教育就有线上免费Java线上公开课。但是如果是学java零基础的新手最好不要选择自学，因为Java自学相对比较难，正确的学习资料的获取、学习中遇到的问题以及如何合理运用学到的知识等都是自学中常会遇到
R语言和Spark谁更胜一筹
R语言适合单机版吧，函数肯定比spark丰富；spark是分布式计算引擎，里面包含ml（machine learning），函数和功能没有R多，而且输入格式要求比较高。适合大数据量下的计算（十亿或百亿级别，TB级别以上的数据），不过Spar
TextGrocery，实用的短文本分类Python库
在目前能看到的文本分类技术中，最好的毋庸置疑就是支持向量机------SVM。但是在我初次接触分类技术时，不断的接触着算法原理，分词，向量化，tf-idf等技术基础，随后就是sklearn这样的超大功能技术包，sklearn有的时候
八款常用的 Python GUI 开发框架推荐
作为Python开发者，你迟早都会用到图形用户界面来开发应用。本文将推荐一些 Python GUI 框架，希望对大家有所帮助。 Python 的 UI 开发工具包 Kivyhttps:www.oschina.
vs怎么创建c语言项目
vs软件主要就是来编程c语言项目，所以学会创建c语言项目是必须，所以今天就由小编来为大家介绍vs软件怎么创建c语言项目。电脑：华为MateBook系统：Windows10软件：vs软件2.01、第一首先在电脑打开vs软件。再点击左上
什么是区块链区块链工程专业是学什么的
区块链是一个信息技术领域的术语。从本质上讲，它是一个共享数据库，存储于其中的数据或信息，具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。基于这些特征，区块链技术奠定了坚实的“信任”基础，创造了可靠的“合作”机制，具
C语言不换行输入
把逗号去掉，在输入时用空格间隔开。而且scanf语句中不能出现n根据你给的代码我改进后如下：#include&ltstdio.h&gt#include&ltmalloc.h&gttypedef struc
R语言中，mode和class有何区别
1、对象类属性的不同首先，mode和typeof可以归为一个类别，class是另外一个类别。mode和typeof描述的是数据在内存中的存储类型；class描述的是对象的类属性，因为历史的原因更新过好多次，前身是S语言，所以R语言中数据对
C语言中的math函数
一些数学计算的公式的具体实现是放在math.h里,具体有：double sin (double x)x的正弦值double cos (double x)x的余弦值double tan (double x)
如何使用Python3读写INI配置文件
python读取ini配置需要用到configparser包，所以要先加载它。importconfigparser之后我们需要载入配置文件。config=configparser.configparser()#ipconfig.ini可以是
C语言编写程序后，为什么执行时自动关闭？
出现这种情况与溢出造成的有关，可以设置断点观察下，在哪里自动关闭。常见的容易溢出的原因是第一个是数组下标越界，第二个是除数为0当然还有其他的。常见的原因因为程序没有设置暂停，运行完了之后，就自动关闭。可以在程序最后加上getchar()
scanf()函数是什么意思？
scanf函数的作用是按照指定的格式从标准输入流读取数据。标准输入流就是指我们从键盘上输入的按键。比如我们一般输入2个整数的话，那么中间会使用空格进行间隔，这个就是scanf默认定义的格式。C语言中scanf是标准库函数，主要用来接收用
java培训费一般多少?
费用一般在1万五到两万元之间。【点击测试我适不适合学设计】 java培训线上费用大部分在几千元到1万元左右，线上培训可能还会分为直播课和录播课，直播课相对来说价钱会高一些。这种学习方式学习时间灵活，学员可自由安排学习时间，并且不会耽误上
正规java培训机构哪个好
正规java培训机构可以选择达内教育、北大青鸟、千锋教育等。达内科技有限公司，由美国国际数据集团IDG投资，由来自SUN、IBM、亚信、华为、东软、用友等国际知名IT公司的技术骨干、海外留学生和加拿大专业技术人员创办，直接引进北美IT技术
如何用Python比较版本号的大小
# -*- coding: utf-8 -*-__author__ = 'ypp' import re def versionCompare(v1="1.1.1", v2="1.2"
Golang怎样实现像C语言那样的枚举类型
可以用注释符和**包围C代码import 逗C地和包含C代码之间是没有空行的动态库的导入和编译选项通过LDFLAGS、CFLAGSCXXFLAGS来设置还可以用pkg-config #cgo pkg-config : xxxxn
c语言怎么写重载函数？
c语言写重载函数：首先明确重载函数的定义：在相同的声明域中的函数名相同的，而参数表不同的，即通过函数的参数表而唯一标识并且来区分函数的一种特殊的函数。当将要定义一组函数，使它们执行一系列的操作，但是它们是应用在不同的参数类型上的。此时可以

推荐阅读

热门文章

最新发布

标签列表

Python如何将Unicode中文字符串转换成 string字符串

给您推荐相同类型的内容：