首先要使得脚本的汉字使用gb2312编码,然后在字符串中进行搜索,脚本如下:
# -*- coding: gb2312 -*-
findStr='哈哈我不在家'
print findStr.find('在')
一个简单的方法是终端跟脚本编码方法一致就成了. 比如说我的终端是UTF8编码, 我用下面的代码就能直接执行.
# coding:utf-8import re
name = raw_input("名字是?")
print(name)
text = "8hds<djak小明9d93<1"
if re.search(name, text) != None:
print "GET IT!"
如果不统一的话, 在raw_input之后需要自己转码.
#python2使用如下即可:# encoding: UTF-8
import re
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
def extract_number(input):
match = re.search(u"[\u4e00-\u9fa5]+", input)
return match.group()
if __name__ == "__main__":
print extract_number(unicode("dss2第三季度建安大sdssd43fds",'utf8'))
#python3使用如下:
# encoding: UTF-8
import re
def extract_number(input):
match = re.search("[\u4e00-\u9fa5]+", input)
return match.group()
if __name__ == "__main__":
print (extract_number("dss2第三季度建安大sdssd43fds"))