1.1python先把代码(.py文件)编译成字节码,交给字节码虚拟机,然后解释器会从编译得到的PyCodeObject对象中一条一条执行字节码指令,
并在当前的上下文环境中执行这条字节码指令,从而完成程序的执行。Python解释器实际上是在模拟操作中执行文件的过程。PyCodeObject对象
中包含了字节码指令以及程序的所有静态信息,但没有包含程序运行时的动态信息——执行环境(PyFrameObject)
2. 字节码
字节码在python解释器程序里对应的是PyCodeObject对象
.pyc文件是字节码在磁盘上的表现形式
2.1从整体上看:OS中执行程序离不开两个概念:进程和线程。python中模拟了这两个概念,模拟进程和线程的分别是PyInterpreterState和
PyTreadState。即:每个PyThreadState都对应着一个帧栈,python解释器在多个线程上切换。当python解释器开始执行时,它会先进行一
些初始化操作,最后进入PyEval_EvalFramEx函数,它的作用是不断读取编译好的字节码,并一条一条执行,类似CPU执行指令的过程。函数内部
主要是一个switch结构,根据字节码的不同执行不同的代码。
3. .pyc文件
PyCodeObject对象的创建时机是模块加载的时候,及import
Python test.py会对test.py进行编译成字节码并解释执行,但是不会生成test.pyc
如果test.py加载了其他模块,如import urlib2, Python会对urlib2.py进行编译成字节码,生成urlib2.pyc,然后对字节码进行解释
如果想生成test.pyc,我们可以使用Python内置模块py_compile来编译。
加载模块时,如果同时存在.py和pyc,Python会尝试使用.pyc,如果.pyc的编译时间早于.py的修改时间,则重新编译.py并更新.pyc。
4. PyCodeObject
Python代码的编译结果就是PyCodeObject对象
typedef struct {
PyObject_HEAD
int co_argcount/* 位置参数个数 */
int co_nlocals/* 局部变量个数 */
int co_stacksize/* 栈大小 */
int co_flags
PyObject *co_code/* 字节码指令序列 */
PyObject *co_consts/* 所有常量集合 */
PyObject *co_names/* 所有符号名称集合 */
PyObject *co_varnames/* 局部变量名称集合 */
PyObject *co_freevars/* 闭包用的的变量名集合 */
PyObject *co_cellvars/* 内部嵌套函数引用的变量名集合 */
/* The rest doesn’t count for hash/cmp */
PyObject *co_filename/* 代码所在文件名 */
PyObject *co_name/* 模块名|函数名|类名 */
int co_firstlineno/* 代码块在文件中的起始行号 */
PyObject *co_lnotab/* 字节码指令和行号的对应关系 */
void *co_zombieframe/* for optimization only (see frameobject.c) */
} PyCodeObject
5. .pyc文件格式
加载模块时,模块对应的PyCodeObject对象被写入.pyc文件
6.分析字节码
6.1解析PyCodeObject
Python提供了内置函数compile可以编译python代码和查看PyCodeObject对象
6.2指令序列co_code的格式
opcode oparg opcode opcode oparg …
1 byte 2 bytes 1 byte 1 byte 2 bytes
Python内置的dis模块可以解析co_code
7. 执行字节码
Python解释器的原理就是模拟可执行程序再X86机器上的运行,X86的运行时栈帧如下图
Python解释器的原理就是模拟上述行为。当发生函数调用时,创建新的栈帧,对应Python的实现就是PyFrameObject对象。
PyFrameObject对象创建程序运行时的动态信息,即执行环境
7.1 PyFrameObject
typedef struct _frame{
PyObject_VAR_HEAD //"运行时栈"的大小是不确定的
struct _frame *f_back//执行环境链上的前一个frame,很多个PyFrameObject连接起来形成执行环境链表
PyCodeObject *f_code//PyCodeObject 对象,这个frame就是这个PyCodeObject对象的上下文环境
PyObject *f_builtins//builtin名字空间
PyObject *f_globals//global名字空间
PyObject *f_locals//local名字空间
PyObject **f_valuestack//"运行时栈"的栈底位置
PyObject **f_stacktop//"运行时栈"的栈顶位置
//...
int f_lasti//上一条字节码指令在f_code中的偏移位置
int f_lineno//当前字节码对应的源代码行
//...
//动态内存,维护(局部变量+cell对象集合+free对象集合+运行时栈)所需要的空间
PyObject *f_localsplus[1]
} PyFrameObject
每一个 PyFrameObject对象都维护了一个 PyCodeObject对象,这表明每一个 PyFrameObject中的动态内存空间对象都和源代码中的一段Code相对应。
学python需要的基础知识说明如下:
Python作为一种跨平台的计算机程序设计语言,有自己独特的知识点与技术层面。入门学习要掌握Python特点、Python的优缺点、Python代码的执行过程、Python中的基础语法等基础知识。
一、Python的特点:
1、Python是一门面向对象的语言,在Python中一切皆对象;
2、Python是一门解释性语言;
3、Python是一门交互式语言,即其在终端中进行命令编程;
4、Python是一门跨平台的语言【没有操作系统的限制,在任何操作系统上都可以运行Python代码】;
5、Python拥有强大和丰富的库,又被称为胶水语言,能把其他语言(主要c/c++)写的模块很轻松地结合在一起。
二、Python的优缺点:
1、优点:
a、易于维护和学习
b、广泛的标准库【提供了大量的工具】
c、可扩展性
d、Python对于大多数据库都有相应的接口【Mysql、sqlites3、MongoDB、Redis等】
e、支持GUI编程【图形化界面】
f、语法简单,易于学习
2、缺点:
a、和C语言相比较Python的代码运行速度慢
b、代码无法加密
三、Python代码的执行过程:
大致流程:源码编译为字节码(.pyc)----->Python虚拟机------->执行编译好的字节码----->Python虚拟机将字节码翻译成相对应的机器指令(机器码)。
Python程序运行时,先编译字节码并保存到内存中,当程序运行结束后,Python解释器将内存中的字节码对象写到.pyc文件中。
第二次再运行时,先从硬盘中寻找.pyc文件,如果找到,则直接载入,否则重复上面过程。
四、Python中的基础语法:
1、Python中变量在内存中的存储
2、基本数据类型
3、关键字、标识符和内置函数
4、Python运算符
5、Python中的语句
易于编程如果你是一名新手,且读过Python相关文章,你一定了解这点,Python语言非常容易学习和编程,与C、C#、Javascript和Java等语言相比,Python是一种更直接的语言,基础知识可以再数小时或数天内掌握。
开源
开源即表示每个人都可以构建和修改它,Python有一个由成千上万程序员组成的在线社区,Python语言在官网是免费提供的,通过点击下载链接即可完成下载。
GUI编程支持
在用户访问你的程序、网站时,首先看到的就是图形用户界面(即GUI),良好的用户界面可以极大提升平台的声誉和用户数,Python可以使用PyQT5、PyQT4、wxPython等模块来创建图形用户界面。
支持高级语言
意味着对用户来说非常容易,在编程程序时,不需要回忆机器结构或操作内存,在很多方面的应用中,它的设计理念首先要考虑代码的可读性。
可扩展性
在必要时,可以用其他语言编写 Python 代码的一部分,例如 C++。Python 可扩展的特性是指 Python 的部分代码可以用 C 或 C++
来编写。
可移植性
Python是一种跨平台的编程语言,这意味着建立在Mac
OSX上的Python应用程序可以在Linux操作系统上运行,反之亦然。只需安装解释器,Python程序就能在Windows PC上执行。
大型标准库
包含用于日常编程的一系列模块,随Python标准版提供,无需额外安装。Python包含了正则表达式、单元测试、Web浏览器以及其他实用工具。
解释型语言
Python使用了解释器,这意味着它的代码是逐行执行的。不同于C、C++、Java等其他编程语言。这是Python的特性之一,Python的代码无需编译,因此更易于调试。Python的源代码被转换为字节码,是代码的实例化。