python的源码值得去读吗

2023-02-23 19:53:02Python09

python的源码值得去读吗,第1张

python的源码值得去读！

1.无论是有没有其他语言的经验，入门Python都很简单。Python拥有简单直观的语法，方便的语法糖，以及丰富的第三方库。只要一个基础的Python教程，大家基本上都能无障碍的入门。

2.在入门之后，很多人对于进一步学习的建议都是“做项目”、“看源码”，然而这样的建议实际是较难实现的，自己执行的效率会很低。

3.对于初学者而言，Python入门很简单。入门之后只靠基础语法也完全可以做到平时写写脚本，解决自己工作、生活上的重复性劳动。想要什么功能，基本上都能找到方便的库。在只求应用，不求理解的情况下，很快就能实现日常表格处理、文件下载、邮件发送等功能。甚至像图像处理、OCR这样“高端”的功能也有对应的工具库可以使用。

4.但是做到这种程度只是小打小闹，想要真正的在开发工作中使用Python语言，或者是在GitHub上贡献开源代码，都是远远不够的。这时候，初学者的常见问题主要集中在以下四点：

4.1学会了语法，但是不会应用。

仍然是用其他语言的逻辑在写Python代码，不是Pythonic的代码。

4.2Python项目结构不合理。

缺少对更深入主题的研究，例如装饰器、异常处理、多进程多线程、设计模式等。

5.传统建议的解决方案

5.1对于初学者而言，应聘到一个使用Python语言做开发的团队显然是不现实的。那么基本上项目的来源就是自己找的练手课题或者在GitHub上参与开源项目。

5.2自己找个项目进行练手可以说是效果最差的方式了。它实际上还是摸着石头过河，接触不到优秀的源码和实现方法，也没有人指导。最终也只是实现了功能而已，不论是代码设计还是项目结构，都是闭门造车，提升有限。最大的作用也就是提高对语法、基本数据结构和标准库的熟练程度。

编写python源代码的软件.首推的Pycharm。

PyCharm用于bai一般IDE具备的功能，比如，调试、语法高亮、Project管理、du代码跳转、智能提示、自动完zhi成、单元测试、版本控制

另外，PyCharm还提供了一些很好的功能用于Django开发，同时支持Google App Engine，更酷的是，PyCharm支持IronPython。

其次是sublime text，Sublime Text 支持多种编程语言的语法高亮、拥有优秀的代码自动完成功能，还拥有代码片段(Snippet）的功能，可以将常用的代码片段保存起来，在需要时随时调用。支持 VIM 模式，可以使用Vim模式下的多数命令。支持宏，简单地说就是把操作录制下来或者自己编写命令，然后播放刚才录制的操作或者命令。

还有Jupyter, Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本，支持运行 40 多种编程语言。

最后就是最基本的nopad++，最开始的时候是实用这款作为开发工具进行基础练习。

朋友圈很多人都想学python，有一个很重要的原因是它非常适合入门。对于 人工智能算法 的开发，python有其他编程语言所没有的独特优势， 代码量少 ，开发者只需把精力集中在算法研究上面。

本文介绍一个用python开发的，自动与美女尬聊的小软件。以下都是满满的干货，是我工作之余时写的，经过不断优化，现在分享给大家。那现在就让我们抓紧时间开始吧！

准备：

编程工具IDE：pycharm

python版本： 3.6.0

首先新建一个py文件，命名为：ai_chat.py

PS：以下五步的代码直接复制到单个py文件里面就可以直接运行。为了让读者方便写代码，我把代码都贴出来了，但是排版存在问题，我又把在pycharm的代码排版给截图出来。

第一步：引入关键包

简单介绍一下上面几个包的作用： pickle 包 是用来对数据序列化存文件、反序列化读取文件，是人类不可读的，但是计算机去读取时速度超快。（就是用记事本打开是乱码）。而 json包 是一种文本序列化，是人类可读的，方便你对其进行修改（记事本打开，可以看到里面所有内容，而且都认识。） gensim 包 是自然语言处理的其中一个python包，简单容易使用，是入门NLP算法必用的一个python包。 jieba包 是用来分词，对于算法大咖来说效果一般般，但是它的速度非常快，适合入门使用。

以上这些包，不是关键，学习的时候，可以先跳过。等理解整个程序流程后，可以一个一个包有针对性地去看文档。

第二步：静态配置

这里path指的是对话语料（训练数据）存放的位置，model_path是模型存储的路径。

这里是个人编程的习惯，我习惯把一些配置，例如：文件路径、模型存放路径、模型参数统一放在一个类中。当然，实际项目开发的时候，是用config 文件存放，不会直接写在代码里，这里为了演示方便，就写在一起，也方便运行。

第三步：编写一个类，实现导数据、模型训练、对话预测一体化

首次运行的时候，会从静态配置中读取训练数据的路径，读取数据，进行训练，并把训练好的模型存储到指定的模型路径。后续运行，是直接导入模型，就不用再次训练了。

对于model类，我们一个一个来介绍。

initialize() 函数和 __init__() 函数是对象初始化和实例化，其中包括基本参数的赋值、模型的导入、模型的训练、模型的保存、最后返回用户一个对象。

__train_model() 函数，对问题进行分词，使用 gesim 实现词袋模型，统计每个特征的 tf-idf , 建立稀疏矩阵，进而建立索引。

__save_model() 函数和 __load_model() 函数是成对出现的，很多项目都会有这两个函数，用于保存模型和导入模型。不同的是，本项目用的是文件存储的方式，实际上线用的是数据库

get_answer() 函数使用训练好的模型，对问题进行分析，最终把预测的回答内容反馈给用户。

第四步：写三个工具类型的函数，作为读写文件。