Python对象

Python015

Python对象,第1张

众所周知,Python是一门面向对象的语言,在Python无论是数值、字符串、函数亦或是类型、类,都是对象。

对象是在 堆 上分配的结构,我们定义的所有变量、函数等,都存储于堆内存,而变量名、函数名则是一个存储于 栈 中、指向堆中具体结构的引用。

要想深入学习Python,首先需要知道Python对象的定义。

我们通常说的Python都是指CPython,底层由C语言实现,源码地址: cpython [GitHub]

Python对象的定义位于 Include/object.h ,是一个名为 PyObject 的结构体:

Python中的所有对象都继承自PyObejct,PyObject包含一个用于垃圾回收的双向链表,一个引用计数变量 ob_refcnt 和 一个类型对象指针 ob_type

从PyObejct的注释中,我们可以看到这样一句:每个指向 可变大小Python对象 的指针也可以转换为 PyVarObject* (可变大小的Python对象会在下文中解释)。 PyVarObejct 就是在PyObject的基础上多了一个 ob_size 字段,用于存储元素个数:

在PyObject结构中,还有一个类型对象指针 ob_type ,用于表示Python对象是什么类型,定义Python对象类型的是一个 PyTypeObject 接口体

实际定义是位于 Include/cpython/object.h 的 _typeobject :

在这个类型对象中,不仅包含了对象的类型,还包含了如分配内存大小、对象标准操作等信息,主要分为:

以Python中的 int类型 为例,int类型对象的定义如下:

从PyObject的定义中我们知道,每个对象的 ob_type 都要指向一个具体的类型对象,比如一个数值型对象 100 ,它的ob_type会指向 int类型对象PyLong_Type 。

PyTypeObject结构体第一行是一个PyObject_VAR_HEAD宏,查看宏定义可知PyTypeObject是一个变长对象

也就是说,归根结底 类型对象也是一个对象 ,也有ob_type属性,那 PyLong_Type 的 ob_type 是什么呢?

回到PyLong_Type的定义,第一行 PyVarObject_HEAD_INIT(&PyType_Type, 0) ,查看对应的宏定义

由以上关系可以知道, PyVarObject_HEAD_INIT(&PyType_Type, 0) = { { _PyObject_EXTRA_INIT 1, &PyType_Type } 0} ,将其代入 PyObject_VAR_HEAD ,得到一个变长对象:

这样看就很明确了,PyLong_Type的类型就是PyType_Typ,同理可知, Python类型对象的类型就是PyType_Type ,而 PyType_Type对象的类型是它本身

从上述内容中,我们知道了对象和对象类型的定义,那么根据定义,对象可以有以下两种分类

Python对象定义有 PyObject 和 PyVarObject ,因此,根据对象大小是否可变的区别,Python对象可以划分为 可变对象(变长对象) 和 不可变对象(定长对象)

原本的对象a大小并没有改变,只是s引用的对象改变了。这里的对象a、对象b就是定长对象

可以看到,变量l仍然指向对象a,只是对象a的内容发生了改变,数据量变大了。这里的对象a就是变长对象

由于存在以上特性,所以使用这两种对象还会带来一种区别:

声明 s2 = s ,修改s的值: s = 'new string' ,s2的值不会一起改变,因为只是s指向了一个新的对象,s2指向的旧对象的值并没有发生改变

声明 l2 = l ,修改l的值: l.append(6) ,此时l2的值会一起改变,因为l和l2指向的是同一个对象,而该对象的内容被l修改了

此外,对于 字符串 对象,Python还有一套内存复用机制,如果两个字符串变量值相同,那它们将共用同一个对象:

对于 数值型 对象,Python会默认创建0~2 8 以内的整数对象,也就是 0 ~ 256 之间的数值对象是共用的:

按照Python数据类型,对象可分为以下几类:

Python创建对象有两种方式,泛型API和和类型相关的API

这类API通常以 PyObject_xxx 的形式命名,可以应用在任意Python对象上,如:

使用 PyObjecg_New 创建一个数值型对象:

这类API通常只能作用于一种类型的对象上,如:

使用 PyLong_FromLong 创建一个数值型对象:

在我们使用Python声明变量的时候,并不需要为变量指派类型,在给变量赋值的时候,可以赋值任意类型数据,如:

从Python对象的定义我们已经可以知晓造成这个特点的原因了,Python创建对象时,会分配内存进行初始化,然后Python内部通过 PyObject* 变量来维护这个对象,所以在Python内部各函数直接传递的都是一种泛型指针 PyObject* ,这个指针所指向的对象类型是不固定的,只能通过所指对象的 ob_type 属性动态进行判断,而Python正是通过 ob_type 实现了多态机制

Python在管理维护对象时,通过引用计数来判断内存中的对象是否需要被销毁,Python中所有事物都是对象,所有对象都有引用计数 ob_refcnt 。

当一个对象的引用计数减少到0之后,Python将会释放该对象所占用的内存和系统资源。

但这并不意味着最终一定会释放内存空间,因为频繁申请释放内存会大大降低Python的执行效率,因此Python中采用了内存对象池的技术,是的对象释放的空间会还给内存池,而不是直接释放,后续需要申请空间时,优先从内存对象池中获取。

在Python中,一切目标都共有一些特性,这些特性界说在PyObject中。PyObject界说在Include/object.h中:#definePyObject_HEAD\

简化后即为:typedefstruct_object{

在PyObject中,ob_refcnt用以记载目标的引证数(与引证计数的内存收回有关,这儿暂且不表),当有新的指针指向某目标时,ob_refcnt的值加1,当指向某目标的指针删去时,ob_refcnt的值减1,当其值为零的时分,则能够将该目标从堆中删去(事实上并不会当即删去,这儿暂且不表)。除了ob_refcnt之外,还有一个指向_typeobject指针ob_type。这个构造体用于表明目标类型。越过_typeobject,能够发现,Python目标的中心在于一个引证计数和一个类型信息。

PyObject界说的内容会出如今每个目标所占内存的开端有些。

定长目标与变长目标

在Python中,除了boolfloat这么的定长目标(一旦断定下来需求的内存,便不再有改动),还有另外一种目标:长度可变的目标。这种目标在Python的完成中经过PyVarObject构造体来表明:#definePyObject_VAR_HEAD\

事实上,即是在PyObject的基础上,多了一个ob_size变量,用以标识目标的长度(是长度,不是内存占用)。也即是说,本来PyVarObject即是PyObject的一个拓宽,所以,在Python中,一切的目标都能够经过PyObject*指针来引证,这一点非常重要,它使得许多操作变得一致(这篇博客暂不胪陈)。

由此,Python中一切目标在完成的时分,内存无非如下两种状况:定长目标变长目标

道生一:PyTypeObject

在描绘PyObject的时分,提到了一个_typeobject构造体。那么,它是干什么的呢?幻想一下,一个目标在创立的时分需求多少内存、这个目标的类名是什么等等信息,又是怎么记载和区别的呢?

_typeobject(也即是PyTypeObject)能够被称之为“指定目标类型的类型目标”,其界说如下:typedefstruct_typeobject{

能够理解为,PyTypeObject目标是Python中面向目标理念中“类”这个概念的完成,这儿仅仅简略介绍其界说中的有些内容:

ty_name:类型名tp_basicsize,tp_itemsize:创立类型目标时分配的内存大小信息被省掉掉的有些:与该类型相关的操作(函数指针)

这儿仅仅简略描绘,上面的内容有些偏颇,暂不用过分深究。

再看一眼PyTypeObject的界说,能够发如今最开端也有一个PyObject_VAR_HEAD,这意味着它也是一个目标。那么,PyTypeObject既然是指示类型的目标,那么它的类型又是什么呢?答案是PyType_Type:PyTypeObjectPyType_Type={

事实上,它即是Python语言中的type目标即是PyType_Type,它是一切class的class,在Python中叫做metaclass。本来,在完成中它的ob_type指针又指向了自己自身,既是:PyType_Type