python3输入字符串如何不转义

Python055

python3输入字符串如何不转义,第1张

转义只发生在代码字面量转换为python内部对象的过程中,已经是字符串了,则不会再次转义。

言外之意是当我们得到的字符串在还没有绑定给Python变量时,这个时候我们对它进行操作,就不会发生转义。

1. unicode是一个编码的standard,表明了字符与数字之间的映射,是可变长的。

2. 映射后的数据如何编码为字节?这个就是具体的编码规则:目前最主流的是UTF-8,同样,它也是变字长的。

python3中的str都是unicode的:“The default encoding for Python source code is UTF-8”

python3中的encode:按照encode()括号中的参数对字符串进行编码,就是生成bytes。

所以:

In:'中文'.encode('utf-8')

Out:b'\xe4\xb8\xad\xe6\x96\x87'

这里的b就是Byte,\x表示这个x是被转义的,意思就是0x。又如:

In: 'abc'.encode('utf-8')

Out: b'abc'

上面的b'a'其实表示的是数字97,b'a'的意思就是字符串'a'的binary数字:

[In]:'abc'.encode('utf-8')[0]

[Out]: 97

同时可以把b'\x'进行解码,即:

In:b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')

Out:'中文'

除了encode('utf-8')外,用ord可以获得单个utf-8字符对应的数字:

In [60]: ord('a')

Out[60]: 97

In [61]: ord('a') #这个是全角的a

Out[61]: 65345

除了decode('utf-8')外,用chr可以获得数字对应的utf-8字符:

In [62]: chr(97)

Out[62]: 'a'

除了unicode还有别的编码标准吗?有啊,比如我国的GBK,别名也叫cp936。

全角和半角之分,是指同样一个意义的字符,显示的大小不同.具体来说,全角和半角的编码是两个结果:

In [70]: "mn".encode('utf-8')

Out[70]: b'\xef\xbd\x8d\xef\xbd\x8e

[In]:"mn".encode('utf-8')

[Out]:b'mn'

它们有什么对应关系呢?(引自这里)

转换说明

全角半角转换说明

有规律(不含空格):

全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)

半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)

特例:

空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)

除空格外,全角/半角按unicode编码排序在顺序上是对应的(半角 + 0x7e= 全角),所以可以直接通过用+-法来处理非空格数据,对空格单独处理。

代码在此基础上改动一下(将unichr改为chr即可,适应python3),即:

def strQ2B(ustring):

"""全角转半角"""

rstring = ""

for uchar in ustring:

inside_code=ord(uchar)

if inside_code == 12288:#全角空格直接转换

inside_code = 32

elif (inside_code >= 65281 and inside_code <= 65374): #全角字符(除空格)根据关系转化

inside_code -= 65248

rstring += chr(inside_code)

return rstring

In [69]: strQ2B('你好python')

Out[69]: '你好python'

Python中文件路径共分为两种:绝对路径和相对路径

1、绝对路径就是文件的真正存在的路径,是指从硬盘的根目录(盘符)开始,进行一级级目录指向文件。

2、 相对路径是以当前文件为基准进行一级级目录指向被引用的资源文件。

其中大小写不影响windows定位到文件

python 文件路径书写方式有两种:

方法一:使用转义字符

filePath = 'E:\Temp\test'

方法二:使用r声明字符串

filePath = r'E:\Temp\test'

上述写法中"\ “为字符串中的特殊字符,加上r后变为原始字符串,则不会对字符串中的”\t"、"\r" 进行字符串转义。