新手，求教关于python3编码的问题

2023-02-26 15:36:02Python011

新手，求教关于python3编码的问题,第1张

你需要明白两个概念：

在Python中字符串是指一串可以展示在终端里、供人阅读的字符，至于字符采用什么编码并不重要，同样的文字，可能是用Unicode、UTF-8或GBK编码，但打印在终端中的内容相同，那么就认为是同一串字符串。而字节串是指将字符串通过某种编码转换得到的一串字节，同样一个字符串，使用不同的编码转换后得到的字节串可能完全不同。

什么叫encode、decode

encode中文为编码，顾名思义，是将字符串以某种编码形式编码得到字节串的过程；相反，decode中文为解码，是将字节串以某种编码形式翻译得到字符串的过程。

a是一个字符串，它的内容是“周杰伦”这三个字，类型是str；b = a.encode('utf-8')是将a以utf-8形式编码得到的字节串，它的内容是“周杰伦”这三个字的utf-8编码，类型是bytes。

代码如下：

>>>import urllib.request

>>>response = urllib.request.urlopen('h)

>>>html = response.read()

>>>print(html.decode('utf-8'))

结果：

Traceback (most recent call last):

File "<pyshell#3>", line 1, in <module>

print(html.decode('utf-8'))

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

求高手帮忙解答。

问题已经解决，原来这个网页数据是用gzip压缩过的，用Python的gzip包解压缩后再解码就可以了。

url编码：

import urllib

url = 'http://test.com/s?wd=哈哈' #如果此网站编码是gbk的话，需要进行解码，从gbk解码成unicode，再从Unicode编码编码为utf-8格式。

url = url.decode('gbk', 'replace')

print urllib.quote(url.encode('utf-8', 'replace'))

参考资料

Python3 如何对url解码？.CSDN博客[引用时间2018-1-1]

字符串字节它的是指周杰伦

# 上一篇：r语言中lables参数能给出什么标签

# 下一篇：Go语言HTTPServer开发的六种实现

给您推荐相同类型的内容：

一学就会，手把手教你用Go语言调用智能合约
智能合约调用是实现一个 DApp 的关键，一个完整的 DApp 包括前端、后端、智能合约及区块链系统，智能合约的调用是连接区块链与前后端的关键。我们先来了解一下智能合约调用的基础原理。智能合约运行在以太坊节点的 EVM 中。
python基本语法
python语法如下：1、Python标识符在Python里，标识符有字母、数字、下划线组成。在Python中，所有标识符可以包括英文、数字以及下划线（_），但不能以数字开头。Python中的标识符是区分大小写的。以下划线开头的标识
java培训机构哪家比较好？
国内的java培训机构非常多，比较知名的品牌有千锋教育、动力节点等等，学java建议去千峰教育。千锋教育就有线上免费Java线上公开课。随着IT行业特别是Java行业的迅速发展，企业对于技术人才Java程序员的需求量与日俱增。但是因为行
R语言之基础
向量是 R 语言中最基本的数据类型，在 R 中没有单独的标量（例如 1 本质上是 c(1)）。 R 中可以用 = 或者 &lt- 来进行赋值， &lt-的快捷键是 alt + - 。 R的下标是从1开始的，和py
java培训费一般多少?
费用一般在1万五到两万元之间。【点击测试我适不适合学设计】 java培训线上费用大部分在几千元到1万元左右，线上培训可能还会分为直播课和录播课，直播课相对来说价钱会高一些。这种学习方式学习时间灵活，学员可自由安排学习时间，并且不会耽误上
学python推荐的10本豆瓣高分书单，小白到大佬，没看过太可惜了
前言：我自己整理了几本书籍的电子档，需要的可以私信我 “书籍” 免费领取本书一共12章，每一章都会用一个完整的游戏来演示其中的关键知识点，并通过编写好玩的小软件这种方式来学习编程，引发读者的兴趣，降低学习的难度。每章最后都会对
python 除了wmi，是否还有其它方式可以获取windows磁盘空间
本文实例讲述了python使用wmi模块获取windows下硬盘信息的方法。分享给大家供大家参考。具体实现方法如下：# -*- coding: utf-8 -*- #import ##############################
python 中如何将一个字符反转
name = "Hello there, my name is Daniel Fu and I`m 33 years old."print(name[4]) # 字母o（hello的最后一个字母），从左至右第5个字母（因
想学Java，该选择哪家培训机构好点？
国内现在的java培训机构有千锋教育、IT培训网、中软国际教育集团、课工场、开课吧等等，这些都是知名的品牌。千锋教育就有线上免费Java线上公开课。随着IT行业特别是Java行业的迅速发展，企业对于技术人才Java程序员的需求量与日俱增。
怎么初始化包含一个元素的元组?
因为前两个元素不是元组；他们只是字符串。括号不会自动使它们成为元组。你必须在字符串后添加一个逗号，以指示python它应该是一个元组。然后点击初始化就能看到包含的元祖。、基本方法。lst = [1, 2, 3, 4, 5]2、初始化连续数字
ubuntu下如何编译C语言
1、首先打开ubnutu开发环境，直接输入组合键ctrl+alt+t调出命令行界面。2、需要在当前目录下创建一个main.c文件。通过命令touch main.c就可以直接创建该文件。要查看创建是否成功，直接通过命令ls查看即可。3、创建完
基于R语言绘制韦恩图和多集合的UpSetPlot
韦恩图（Venn plot），又称文氏图，是英国的哲学家和数学家约翰·维恩（John Venn）在1881年发明的，主要是用于展示在不同的事物群组（集合）之间的数学或逻辑联系，尤其适合用来表示集合（或）类之间的“大致关系”，它也常常被用来
程序员一般都会用什么网站学习课程啊？求推荐专业又平价的，感谢！
技术网站类1、博客园一个面向开发者的知识分享社区，聚集许多优秀的开发者，分享知识、信息以及技术讨论。2、CSDN这个不用多说吧，中文最大的技术社区，全球知名中文IT技术交流平台，超多大神在这里！3、开源中国目前国内最大的开源技术社区，资源、
go语言的reflect（反射）
1、反射可以在运行时动态获取变量的各种信息，比如变量的类型、类别； 2、如果是结构体变量，还可以获取到结构体本身的信息（包括结构体的字段、方法）； 3、通过反射，可以修改变量的值，可以调用关联的方法； 4、使用反射，需要
arm编程与C语言的编程区别和方法
ARM公司卖的armcpu内核给许多公司，那些公司生产出众多的ARM处理器。ARM编程实际上指的是应用ARM公司自己出产的IDE(集成开发环境)所开发进行的编程，比如现在业界常用的ADS1.2，MDK3.5等等IDE。主要进行ARM汇编和与
web 物联网用什么开发
物联网中最常用的编程语言，即Java，C，C ++，Python，JavaScript和Go。Java：物联网技术最流行的编程语言Java有多个应用领域，从后端编程到Android的移动应用。根据 Eclipse基金会执行的2017年物联网
R 常用语句汇总
## 分组统计 display(df %&gt% filter(RESP_DT == '20191102') %&gt% group_by(colname) %&gt% summarise
想学Java，该选择哪家培训机构好点？
国内现在的java培训机构有千锋教育、IT培训网、中软国际教育集团、课工场、开课吧等等，这些都是知名的品牌。千锋教育就有线上免费Java线上公开课。随着IT行业特别是Java行业的迅速发展，企业对于技术人才Java程序员的需求量与日俱增。
成都java培训班哪个比较好？
成都java培训班【达内教育】的好，该机构拥有行业内完善的教研团队，强大的师资力量，确保学员利益，全方位保障学员学习。选择【Java培训机构】注意以下几点：1、Java培训班级氛围：班级人数最好不要太多，学员最好都是比较爱学习，学历都差不多
如何使用go语言来运行PHP
首页你需要开启apache服务器然后把你要运行的文件放入apache的根目录你如果安装在C盘的话，就是在这个文件夹下C:wampwww还有你要是有数据的话，打开apache后将数据导入到数据库中前言最近工作中遇到的一个场景，php项目中
西安报个java培训班多少钱？
西安报名java培训班大概需要2万元左右，如需java培训班推荐选择【达内教育】，该机构采用因材施教、分级培优差异化教学模式，让每一位来达内学习的学员都能找到适合自己的课程。【达内教育】Java课程拥有在线体验课，学员可以根据体验课选择自身
怎么用C语言编程数字时钟
1、以下例程实现时钟的实时显示基本要求： 1）自行设计界面，模拟表盘式时钟。要求界面美观，清晰。2）数字同步显示时间信息。2、例程：#include&ltgraphics.h&gt #include&ltmath
如何c语言中随机产生1-50的随机数,包括小数？
VC环境下要比TC麻烦一些格式如下：#include "time.h"#include "stdlib.h"#include "stdio.h"void main(){ doubl
用R语言进行关联分析
用R语言进行关联分析关联是两个或多个变量取值之间存在的一类重要的可被发现的某种规律性。关联分析目的是寻找给定数据记录集中数据项之间隐藏的关联关系，描述数据之间的密切度。几个基本概念1.项集这是一个集合的概念，在一篮子商品中的一件消费品即
python 怎么保留2位小数
1、使用字符串格式化大部分语言都可以使用字符串格式化的方法来实现保留两位小数的效果，python也不例外：a = 12.345print("%.2f" % a) # %代表格式化输出，.2代表小数点后保留两位，f代表数据
单片机bit什么意思
单片机bit在C语言里是位定义符号，由其定义的变量数据仅为1位，只有0或1两种状态。单片机（Single-ChipMicrocomputer）是一种集成电路芯片，是采用超大规模集成电路技术把具有数据处理能力的中央处理器CPU、随机存储器RA
r语言ggally包怎么下不了
r语言ggally包怎么下不了如下，由于RStudio的源是Global,所以在使用install命令去安装包的时候可能会出现数据部分丢失的情况，这是直接在Rstudio里安装GGally时的情况。用rattle采用Pairs需要安装GG
R语言之常用的统计函数
用的最多的，是求均值的mean()函数，当然这里也要提到，像sum()这种求和函数，还有sd(x) 标准差函数，var(x) 方差函数。min()求最小值，max()求最大值。我们来具体试试，这里使用一个向量：test
求python书籍推荐
零基础如何学好python，作为一个学了python两三年的过来人，我当初也是从0开始一路摸索过来的，这里给想学python的小白们分享一点我的学习心得。1.《笨方法学Python》、《流畅的python》、《EffectivePython
java项目(java project)如何导入jar包？
右键项目-properties-java build path（左侧菜单）-选择librariesx0dx0a有两种方式，导入jar包实际上就是建立一种链接，并不是copy式的导入x0dx0a一、导入外部包，add external

推荐阅读

热门文章

最新发布

标签列表

新手，求教关于python3编码的问题

给您推荐相同类型的内容：