python有哪几种编码方式

2023-02-14 13:55:01Python020

python有哪几种编码方式,第1张

第一种：ASCII码。是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，它是现今最通用的单字节编码系统，并等同于国际标准IS/IEC

646。

由于计算机是美国人发明的，因此，最早只有127个字母被编码到计算机李，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母a的编码是97，后128个称为扩展ASCII码。

第二种：GBK和GB2312。能在计算机中显示中文字符是至关重要的，然而ASCII表里一个偏旁部首都没有，所以我们需要一个关于中文和数字对应的关系表，一个字节只能最多表示256个字符，用处理中文显然一个字节是不够的，所以我们需要采用两个字节来表示，所以中国制定了GB2312编码，用来将中文编写进去。

第三种：Unicode。因为各个国家都有一套自己的编码，所以无法避免冲突，因此Unicode诞生了。它可以把所有语言都统一到一套编码里，这样就不会存在乱码问题了，现代操作系统和大多数编程语言都直接支持Unicode。

第四种：UFT-8。基于节约的原则，出现了把Unicode编码转化为可变长编码的UTF-8编码。而UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成一个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节，如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。

#encoding:utf-8

import urllib2

url = '

f = urllib2.urlopen(url)

content = f.read()

f.close()

content = content.decode('UTF-8').encode("gb2312")

s1 = content.split(',')

result1 = {}

for s in s1:

s2 = s.split('|')

print s2[1]

result1[s2[1]] = s2[0]

print result1

实测可以了~

还有在字典里的东西直接print 出来就是一大串百分号什么的是正常的~

字节字符中文所以数字

# 上一篇：做网络爬虫，python 的多线程，异步和 node.js 的异步哪个好

# 下一篇：pythondef返回值为数组

给您推荐相同类型的内容：

python,如两图，花括号里的内容分别表示什么意思？谢谢
题主你好,先说第一幅图, 为啥 print('{:.^10.4}'.format('Flower')) 的输出结果是 ...Flow... 简单来说就是一个字符串的格式化,对应该例子来说就是对于&
简述Python程序中语句的缩进规则？
对于类定义、函数定义、流程控制语句、异常处理语句等，行尾的冒号和下一行的缩进，表示下一个代码块的开始，而缩进的结束则表示此代码块的结束。通常情况下都是采用4个空格长度作为一个缩进量(一个Tab键就表示4个空格)。和其他程序设计语言(如Jav
Python 从入门到精通推荐看哪些书籍呢？
本人是一名大学生，在我的大学期间。我辅修了人工智能这门课。在人工智能这门课中有一门课程是 Python 从入门到精通，在这里我为大家推荐几本有助于python学习的书籍。下面是我 Python 从入门到精通课程学习的
python之禅
The Zen of Python, by Tim Peters Beautiful is better than ugly. 优美胜于丑陋 Explicit is better than implicit.明确优于隐晦
python help 怎么用
help(参数)参数可以是函数名、模块名、变量名等等。比如：我不知道math模块中的sin函数是怎么定义的或者返回什么，那么我可以使用help如下：import mathprint help(math.sin)&gt&g
Python析构函数
Python中有两个特殊的方法, 一个是构造函数 init , 另一个是析构函数 del ，统称为魔术方法。构造函数 init ，创建实例对象之后Python会自动执行此方法，把初始化的属性特点放到实例对象里。构造函数是创建并
怎样用c语言编写ATM系统
真正的ATM系统不可能只是用C语言编写的，它应该是一套完整独立的系统，核心代码更机密，不会轻易的泄露。C语言可以写一个类似于ATM系统的框架，用以模拟ATM机上的各种操作。框架代码如下：#include&ltiostream.h
C语言程序设计现代方法怎么样
本科阶段是以C语言作为编程入门语言的，当时采用的教材是清华乔林的一本书，参考教材是谭老先生的书。之后关于C语言自己也看了很多书，一直以来觉得C语言的书目虽汗牛充栋，但是想找到一本适合自己的入门级的书却很难。神书《C程序设计语言》虽然是设计者
利用python实现网页批量截图
几个需要注意的地方： 1.phantomjs的路径要设置好，当然，用有头的浏览器也可以，如果你不嫌麻烦的话。 2本程序实现的是对本地的网页进行截图。python怎么通过url进行截图方法就是各个工具都有一个功能叫是否将tab看做sp
python文本内容替换？
这样编写：fa=open("A.txt","r")ta=fa.readlines()fb=open("B.txt","r")tb=fb.readlines()t
如何在Hadoop环境下搭建Python？
搭建 Python 环境在 Hadoop 上的步骤如下：安装 Hadoop：在你的计算机上安装 Hadoop。安装 Python：请确保你的计算机上已经安装了 Python。配置 Hadoop 环境：编辑 Hadoop 的配置文件，以确
GBDT 如何实现特征组合提取?
以Python调用sklearn为例，在你建立GBDT对象并作fit之后，可以使用如下代码获得你要的规则代码：dot_data = tree.export_graphviz(model_tree, out_file=None,max_d
python的正则表达式
1,正则表达式的一些内容正则表达式主要是用来匹配文本中需要查找的内容,例如在一片文章中找出电话号码,就中国的来说11位纯数字(不说座机),则使用"d{11}" 意味匹配数字11次,就能准
Python豆瓣电影《肖申克的救赎》评论爬取
先看效果图：地址：（ https:movie.douban.comsubject1292052comments?sort=time&ampstatus=P）爬取前1w条评论存储成txt文档数据预处理
Python基础之pytest参数化
pytest是目前比较成熟功能齐全的测试框架，使用率肯定也不断攀升。在实际工作中，许多测试用例都是类似的重复，一个个写最后代码会显得很冗余。这里，我们来了解一下 @pytest.mark.parametrize装饰
python上传图片头像。一个post 提交不知道怎么写？这样的
首先你需要在你的表单上添加enctype="multipartform-data"。&ltform action="message" enctype="multipartf
Python简单加密操作
加密是将一个明文数据，按照指定的算法，运算得到一个其他的可以隐藏真实信息的密文数据，这个过程称为加密；处理的算法称为加密算法；用到的关键数据称为密钥。解密是按照制定的算法和关键数据，将一个密文数据进行逆向运算得到的正确的明文数据的过程
C语言中指向指针的指针怎么理解
指针可以理解为一个存地址的寄存器，存的就是地址，“指向指针的指针” 就是二级指针假设另一个指针是int *q而q的指针就是 &ampq，p = &ampq；作用为了获取这个地址。指针变量能指向任意一个变量(包括指针变量)指向
为啥python读取数据库中文全是问号，应该如何处理
#coding:utf-8st="你从数据库中读入的字符串"st=st.decode("GBK") #或者查看一下数据库中的编码格式print st以前用php连mssqy时也经常出现中文乱码（中文变
如何学习Python爬虫
个人觉得：新手学习python爬取网页先用下面4个库就够了：（第4个是实在搞不定用的，当然某些特殊情况它也可能搞不定）1. 打开网页，下载文件：urllib2. 解析网页：BeautifulSoup，熟悉JQuery的可以用Pyquery3
pythondef返回值为数组
#function to ask user to input name and scoredef GetInput():names=[]percentages=[]for counter in range(0,3):names.append
怎样把拼音转换成汉字
1首先我们在网上下载一个叫汉字转拼音的软件,又名实用中文转换器,然后进行下载。一小会就ok 了。2随便找一个下载,然后我们进行安装。3把这里的前面全部不要勾选,不然就都给您安装上了。下边路径选一下哦。4然后就开始安装了,稍等一下,一会就好了
如何用python对文章中文分词并统计词频
1、全局变量在函数中使用时需要加入global声明2、获取网页内容存入文件时的编码为ascii进行正则匹配时需要decode为GB2312，当匹配到的中文写入文件时需要encode成GB2312写入文件。3、中文字符匹配过滤正则表达式为ur
Python 基础知识全篇-字符串（Strings）
单引号和双引号字符串可以包含在单引号或双引号中。这种灵活的方式可以让我们在字符串中包含引号。当我们需要创建一个多行字符串的时候，可以用三个引号。如下所示：改变大小写你可以很方便的改变字符串的大小写。如下所
python 什么是http异步请求
http请求为耗时IO操作，如果同步阻塞的话，进程会等待请求完成。异步的话，进程会发出http请求(请求以后不需要cpu)，然后跳转到别的任务，直到http请求完成，再调回来继续处理得到的http回应。最经典的例子就是烧水，同步阻塞就是你一
C语言编程，要完整可运行的程序
#include&ltstdio.h&gtvoidmain(){inta[10],b[11],i,j,t,kprintf("请输入10个数字：n")for(i=0i&lt10i++)scanf(
在python中怎么裁剪图片大小？如何利用Python裁剪图片？
先对图片进行二值化处理。由于这些格子大小均匀，所以可以使用常规的除法，先裁剪出第一个格子：e=a[:,:,0].shapef=a[0:int(e[0]9),0:int(e[1]9)]io.imsave('00.pn
Python线上考试测试网络环境必须在家吗
必须在家线上考试”是通过网络进行考试的一种。随着网络的发展，考试的形式不局限于现场的实际考核，为了方便与节省时间、成本等，许多考核采用了线上发布，线上完成，线上考核，其形式也多种多样，诸如采用APP，或者插件小程序等形式。传统考试从出题、
python新项目怎样创建
python创建新项目的方法：1、打开pycharm，按顺序单击File&gtnew Project&gtPure Python2、单击Create，最后单击Attaach就可以在当前窗口创建新项目了更多Python知
python怎么解析txt文件
#!usrbinpython# -*- coding: UTF-8 -*-import osimport sysdef read_file(filePath): lines=open(filePath).readline

推荐阅读

热门文章

最新发布

标签列表

python有哪几种编码方式

给您推荐相同类型的内容：