python 根据gb2312区位码查找汉字

Python016

python 根据gb2312区位码查找汉字,第1张

你给的问题不是很详细,所以我只能给你举个简单的例子,如下:

首先要使得脚本的汉字使用gb2312编码,然后在字符串中进行搜索,脚本如下:

# -*- coding: gb2312 -*-

findStr='哈哈我不在家'

print findStr.find('在')

#python2使用如下即可:

# encoding: UTF-8 

import re 

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

 

def extract_number(input):

    match = re.search(u"[\u4e00-\u9fa5]+", input)

    return match.group()

if __name__ == "__main__":

    print extract_number(unicode("dss2第三季度建安大sdssd43fds",'utf8'))

    

    

    

#python3使用如下:

# encoding: UTF-8 

import re 

def extract_number(input):

    match = re.search("[\u4e00-\u9fa5]+", input)

    return match.group()

if __name__ == "__main__":

    print (extract_number("dss2第三季度建安大sdssd43fds"))