python 根据gb2312区位码查找汉字

Python010

python 根据gb2312区位码查找汉字,第1张

你给的问题不是很详细,所以我只能给你举个简单的例子,如下:

首先要使得脚本汉字使用gb2312编码,然后在字符串中进行搜索,脚本如下:

# -*- coding: gb2312 -*-

findStr='哈哈我不在家'

print findStr.find('在')

一个简单的方法是终端跟脚本编码方法一致就成了. 比如说我的终端是UTF8编码, 我用下面的代码就能直接执行.

# coding:utf-8

import re

name = raw_input("名字是?")

print(name)

text = "8hds<djak小明9d93<1"

if re.search(name, text) != None:

    print "GET IT!"

如果不统一的话, 在raw_input之后需要自己转码.

#python2使用如下即可:

# encoding: UTF-8 

import re 

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

 

def extract_number(input):

    match = re.search(u"[\u4e00-\u9fa5]+", input)

    return match.group()

if __name__ == "__main__":

    print extract_number(unicode("dss2第三季度建安大sdssd43fds",'utf8'))

    

    

    

#python3使用如下:

# encoding: UTF-8 

import re 

def extract_number(input):

    match = re.search("[\u4e00-\u9fa5]+", input)

    return match.group()

if __name__ == "__main__":

    print (extract_number("dss2第三季度建安大sdssd43fds"))