Python的中文字符串遍历问题

Python09

Python的中文字符串遍历问题,第1张

首先一个,你这个'a'是什么编码?可能不是你所想的gbk

>>>

a='测试'

>>>

a

这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明是gbk。

另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会

一个字

一个字拿出来。

虚拟机

把a当成一个

长度

为len(a)的

字符串

了。

接下来是遍历问题。

linux的shell大都默认是utf-8,所以一个

中文

字符是

三个字

,所以要三个三个地读,你可以试下:

>>>

a[:3]

出来就是个测字

windows的command的默认是cp936,也就是gbk,一个中文字符是

两个字

,所以两个字两个字地读。

还有另一种遍历的方法,把字符串转换成unicode,这样中文

英文

都是一个字,就可以用你的for

i

in

a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,

英文字母

只占一个字。

直接使用字符串切片就可以实现:

s = "Thereisastringword"

# 最后一位 + 去头去尾的部分 + 首字符

s1 = s[-1] + "".join(s[1:-1]) + s[0]

print(s1)

用循环也需要等循环结束了再拼接一次字符串

s = "Thereisastringword"

s1 = ""

for i in range(len(s)):

  if i == 0:

      lastword = s[i]

  elif i == len(s) -1 :

      fristword = s[i]

  else:

      s1 += s[i]

print(fristword + s1 + lastword)

总共六个字符

python可以通过str*2重复输出字符串printstr*2#输出字符串两次,循环代码块就是将取到的每个字符进行打印输出,总共六个字符,就循环执行了6次。接下来我们使用For循环遍历一个列表。