如何用Python封装C语言的字符串处理函数

2023-02-26 15:27:01Python012

如何用Python封装C语言的字符串处理函数,第1张

在C语言中，字符串处理是每天都要面对的问题。我们都知道C语言中其实并没有一种原生的字符串类型，‘字符串’在C语言里只是一种特殊的以''结尾的字符数组。因此，如何将C语言与更高层次的Python语言在‘字符串’处理这个问题上对接是一个有难度的问题。所幸有swig这种强大的工具。

如何封装一个函数，它修改参数字符串的内容

假如有这样一个C语言的函数，

void FillZero(char* pc,size_t * piLen)

{

size_t i=0

while(i++<*piLen/2 )

*pc++ = '0'

*pc = 0

*piLen = i+1

}

这个函数的功能是把字符串变成n个0。不过我们更关注函数的形式。这样的函数，表面上看char* pc是函数的参数，可是实际上它才是函数的返回值和执行的结果。piLen这个参数既是pc的最大长度，也是新的字符串的长度。我们直接用python封装，看看运行结果。

Type "help", "copyright", "credits" or "license" for more information.

>>>import cchar

>>>s='123456'

>>>cchar.FillZero(s,6)

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

TypeError: in method 'FillZero', argument 2 of type 'size_t *'

结果差强人意，不是我们想要得到的结果。函数的第二个参数为size_t* 我们很难用python来表示，而且python中也不存在既是输入，也是输出的参数。

swig有一个标准库，其中有一个cstring.i文件就是用来解决C语言字符串类型的问题。

我们在.i文件中加入这样几行

%include "cstring.i"

%cstring_output_withsize(char* pc,size_t* pi)

void FillZero(char* pc, size_t* pi)

然后运行看结果

Type "help", "copyright", "credits" or "license" for more information.

>>>import cchar

>>>cchar.FillZero(10)

'00000\x00'

>>>s=cchar.FillZero(10)

>>>print s

00000

我们看函数的变化。首先在python里， FillZero变成了只有一个参数的函数。然后函数的返回值变成了一个字符串。其实cstring_output_size其实是一个宏，通过这个宏的定义改变了函数的形式，直接在Python中得到我们想要的结果。

其实类似cstring_output_size的宏还有好几个，我列举一下:

cstring_output_allocate(char *s,free($1))

第一个参数是指向字符串地址的指针，第二个参数为释放空间的方法。

大家考虑这一下这样的函数：

void foo(char* &s)

{

s = (char*)malloc(10)

memcpy(s,"123456789",9)

}

s这个参数表面上看是输入，实际上是函数真正的输出。函数中真正改变的东西是char&s指向的字符串的值。而且char&这个类型,

python或者其他脚本语言里应该都没有对应的类型。那么我们用cstring_output_allocate将这个函数转换成另外一个形式的python或者其他脚本语言的函数。转换后的函数其实是这样的，以python为例str

foo()。

%module a

%include "cstring.i"

void foo(char*&s)

%cstring_output_allocate(char *&s, free(*$1))

void foo(char *&s)

在python中的调用：

>>>import a

>>>a.foo()

'123456789'

>>>

cstring_output_maxsize(char *path, int maxpath)

第一个参数也是可以改变的字符串首地址，第二个参数为字符串的最大长度。在Python中调用的时候，只有maxpath这个参数，返回字符串。

cstring_output_allocate(char *s, free($1))

第一个参数为指向字符串首地址的指针，第二个参数为释放指针的方法。这个宏主要是封装一种直接在函数内部malloc空间的函数。在Python中调用时没有参数，直接返回字符串。

cstring_output_allocate_size(char *s, int slen, free(*$1))

这个相当于前面两个函数的组合。在函数内部malloc空间，然后将字符串长度通过slen返回。其实在调用的时候非常简单，没有参数，直接返回字符串。

如何处理c++的std::string

std::string是C++标准类库STL中常见的类。在平时工作中大家肯定是没少用。在python中如何封装std::string? swig提供了标准库

例如函数:

string Repeat(const string&s)

{

return s+s

}

只要在swig中加入这样几行：

%include "std_string.i"

using namespace std

string Repeat(const string&s)

运行结果：

Python 2.6.6 (r266:84292, Dec 27 2010, 00:02:40)

[GCC 4.4.5] on linux2

Type "help", "copyright", "credits" or "license" for more information.

>>>import cchar

>>>cchar.Repeat('123')

'123123'

使用起来很方便，但需要注意的是，假如函数的参数的内容是可以被修改，就不能用这种方式封装。

例如:

void repeat(string s)

{

s+=s

}

这样的函数直接使用 'std_string.i' 就是无效的。遇到这种函数，只能用C语言封装成 void repeat(chars, int maxsize), 再用swig调用 'cstring_output_withsize' 这个宏再封装一次了。

1. python 字符与数字如何转换

python中字符与数字相互转换用chr（)即可。

python中的字符数字之间的转换函数

int(x [,base ]) 将x转换为一个整数

long(x [,base ]) 将x转换为一个长整数

float(x ) 将x转换到一个浮点数

plex(real [,imag ]) 创建一个复数

str(x ) 将对象 x 转换为字符串

repr(x ) 将对象 x 转换为表达式字符串

eval(str ) 用来计算在字符串中的有效Python表达式，并返回一个对象

tuple(s ) 将序列 s 转换为一个元组

list(s ) 将序列 s 转换为一个列表

chr(x ) 将一个整数转换为一个字符

unichr(x ) 将一个整数转换为Unicode字符

ord(x ) 将一个字符转换为它的整数值

hex(x ) 将一个整数转换为一个十六进制字符串

oct(x ) 将一个整数转换为一个八进制字符串

chr(65)='A'

ord('A')=65

int('2')=2

str(2)='2'

扩展资料：

python数字转换为字符串主要包括两种形式：第一种是str（)，将值转换为用户便于阅读的形式；另一种是repr（)，将值转换为合法的python表达式。

>>>print repr("Hello, world!")

'Hello, world!'

>>>print repr(10000L)

10000L

>>>print str("Hello, world!")

Hello, world!

>>>print str(10000L)

2. python怎么实现字符串和数字的转换

#py3

from functools import reduce

DIGITS={'0':0,'1':1,'2':2,'3':3,'4':4,'5':5,'6':6,'7':7,'8':8,'9':9}

def char2num(s)： #单个字符转数字

return DIGITS[s]

def str2int(s)：#整数字串转化整数，不支持浮点数.浮点数得另写一个

if s[0]=='-'： #要判断一下该数字有没有符号

return -reduce(lambda x,y:10*x+y,map(char2num,s[1：：])） #返回负数

else:

return reduce(lambda x,y:10*x+y,map(char2num,s)） #返回正数

a='-123'

print(100+str2int(a))

3. 关于python的字符串格式化

在python中也有类似于c中的printf（)的格式输出标记。

在python中格式化输出字符串使用的是%运算符，通用的形式为格式标记字符串 % 要输出的值组其中，左边部分的”格式标记字符串“可以完全和c中的一致。右边的'值组'如果有两个及以上的值则需要用小括号括起来，中间用短号隔开。

重点来看左边的部分。左边部分的最简单形式为：%cdoe其中的code有多种，不过由于在python中，所有东西都可以转换成string类型，因此，如果没有什么特殊需求完全可以全部使用'%s'来标记。

比如：'%s %s %s' % (1, 2.3, ['one', 'two', 'three'])它的输出为'1 2.3 ['one', 'two', 'three']'，就是按照%左边的标记输出的。虽然第一个和第二值不是string类型，一样没有问题。

在这个过程中，当电脑发现第一个值不是%s时，会先调用整型数的函数，把第一个值也就是1转成string类型，然后再调用str（)函数来输出。前面说过还有一个repr（)函数，如果要用这个函数，可以用%r来标记。

除了%s外，还有很多类似的code：整型数：%d无符号整型数：%u八进制：%o十六进制：%x %X浮点数：%f科学记数法： %e %E根据数值的不同自动选择%e或%f: %g根据数值的不同自动选择%E或%f: %G就跟前面说用\进行转义一样，这里用%作为格式标记的标识，也有一个%本身应该如何输出的问题。如果要在”格式标记字符串“中输出%本身，可以用%%来表示。

上面说的只是格式标记的最简间的形式，来看复杂一点的：'%6.2f' % 1.235在这种形式中，在f的前面出现了一个类似小数的6.2它表示的意思是，总共输出的长度为6个字符，其中小数2位。还有更复杂的：'%06.2f' % 1.235在6的前面多了一个0，表示如果输出的位数不足6位就用0补足6位。

这一行的输出为'001.24'，可以看到小数也占用一位。类似于这里0这样的标记还有-、+。

其中，-表示左对齐，+表示在正数前面也标上+号，默认是不加的。最后来看最复杂的形式：'%（name）s:%(score)06.1f' %{'score':9.5, 'name':'newsim'}这种形式只用在要输出的内容为dictionary（一种python的数据类型）时，小括号中的（name）和（score）对应于后面的键值对中的键。

前面的例子可以看到，”格式标记字符串“中标记的顺序和"要输出的值组"中的值是一一对应的，有顺序，一对一，二对二。而在这种形式中，则不是，每个格式标记对应哪个值由小括号中的键来指定。

这行代码的输出为：'newsim:0009.5'。有时候在%6.2f这种形式中，6和2也不能事先指定，会在程序运行过程中再产生，那怎么输入呢，当然不能用%%d.%df或%d.%d%f。

可以用%*.*f的形式，当然在后面的”要输出的值组“中包含那两个*的值。比如：'%*.*f' % (6, 2, 2.345)就相当于'%6.2f' % 2.345。

这是这本书到此为止看起来最复杂的内容。不过如果记不住，或不想那么耐烦，完全可以全部用%s代替，或者用多个"+"来构造类似的输出字符串。

这里的%真有点除法的味道，怪不得设计者会选择用%这个除号。象C 中的sprintf函数一样，可以用“%”来格式化字符串Table 3.1. 字符串格式化代码格式描述%% 百分号标记%c 字符及其ASCII码%s 字符串%d 有符号整数（十进制）%u 无符号整数（十进制）%o 无符号整数（八进制）%x 无符号整数（十六进制）%X 无符号整数（十六进制大写字符）%e 浮点数字（科学计数法）%E 浮点数字（科学计数法，用E代替e）%f 浮点数字（用小数点符号）%g 浮点数字（根据值的大小采用%e或%f）%G 浮点数字（类似于%g）%p 指针（用十六进制打印值的内存地址）%n 存储输出字符的数量放进参数列表的下一个变量中。

字符串函数整数转换为参数

# 上一篇：c语言如何拆分数字

# 下一篇：c语言怎么写重载函数？