Python 使用对象模型来存储数据?

Python013

Python 使用对象模型来存储数据?,第1张

Python使用对象模型来存储数据。构造任何类型的值都是一个对象。尽管Python通常被当成一种“面向对象的编程语言”,但你完全能够写出不使用任何类和实例的实用脚本。不过Python的对象语法和架构鼓励我们使用这些特性,下面让我们仔细研究一下Python对象。所有的Python对像都拥有三个特性:身份,类型和值。

身份:每一个对象都有一个唯一的身份标识自己,任何对象的身份可以使用内建函数id()来得到。这个值可以被认为是该对象的内存地址。你极少会用到这个值,也不用太关心它究竟是什么。

类型对象的类型决定了该对象可以保存什么类型的值,可以进行什么样的操作,以及遵循什么样的规则。你可以用内建函数type0查看Python对象的类型。因为在Python中类型也是对象(还记得我们提到Python是面向对象的这句话吗?),所以type0返回的是对象而不是简单的字符串。

值:对象表示的数据项。

上面三个特性在对象创建的时候就被赋值,除了值之外,其他两个特性都是只读的。对于新式类型和类,对象的类型也是可以改变的,不过并不推荐初学者这样做。如果对象支持更新操作,那么它的值就可以改变,否则它的值也是只读的。对象的值是否可以更改被称为对象的可改变性(mutability),我们会在后面的4.7小节中讨论这个问题。只要一个对象还没有被销毁,这些特性就一直存在。Python有一系列的基本(内建)数据类型,必要时也可以创建自定义类型来满足你对应用程序的需求。绝大多数应用程序通常使用标准类型,对特定的数据存储则通过创建和实例化类来实现。

顺序存储结构最大的缺点是插入和删除时需要移动大量元素,耗费大量时间。

如果让相邻元素间留有足够余地,也就是不考虑相邻位置了,那么,我们这里可以引入链式存储结构。

链表结构可以充分利用计算机内存空间,实现灵活的内存动态管理。

二、链表的定义

链表(Linked list)是一种常见的基础数据结构,是一种线性表,但是不像顺序表一样连续存储数据,而是在每一个节点(数据存储单元)里存放下一个节点的位置信息(即地址)。

1、单向链表

单向链表也叫单链表,是链表中最简单的一种形式,一个信息域(元素域)和一个链接域组成一个节点。

这个链接指向链表中的下一个节点,而最后一个节点的链接域则指向一个空值。

链表的每个结点中只包含一个链接域,所以叫做单链表。

表元素域elem用来存放具体的数据。

链接域next用来存放下一个节点的位置(python中的标识)

变量p指向链表的头节点(首节点)的位置,从p出发能找到表中的任意节点。

链表中第一个结点的长处位置叫做头指针

显著性链表的最后一个结点指针为“空”(通常用NULL或“^”符号表示)

通常会在单链表的第一个结点前附设一个结点,称为头结点。它的信息域可以不存储数据,也可以存储线性表长度等附加信息,头结点的链接域指向第一个结点的指针。

头指针与头结点的异同

无论链表是否为空,头指针均不为空,头指针是链表的必要元素;头结点不一定是链表的必要要素。

头指针具有标识作用,所以常用头指针冠以链表的名字。

以python3版本为例说明, int 类型在python中是动态长度的。因为python3中int类型是长整型,理论支持大的数字,但它的结构其实也很简单, 在 longintepr.h 中定义:

struct _longobject {

PyObject_VAR_HEAD

digit ob_digit[1]

}

这结构是什么意思呢,重点在于 ob_digit 它是一个数组指针。digit 可认为是 int的别名。python的整型存储机制是这样的。比方要表示一个很大的数:123456789 。而每个元素只能表示3位十进制数(为理解打的比方)。那么python就会这样存储:

ob_digit[0] = 789

ob_digit[1] = 456

ob_digit[2] = 123

低位存于低索引下。python中整型结构中的数组,每个元素存储 15 位的二进制数(不同位数操作系统有差异32位系统存15位,64位系统是30位)。

因此,sys.getsizeof(0) 数组元素为0。此时占用24字节(PyObject_VAR_HEAD 的大小)。 sys.getsizeof(456) 需使用一个元素,因此多了4个字节。