β

Python 爬虫的工具列表

36大数据 77 阅读

工具

译者:伯乐在线 – LynnShaw

这个列表包含与网页抓取和数据处理的Python库。

网络

通用

异步

网络爬虫框架

功能齐全的爬虫

其他

HTML/XML解析器

通用

清理

文本处理

用于解析和操作简单文本的库。

通用

转换

字符编码

Slug化

通用解析器

人的名字

电话号码

用户代理字符串

特定格式文件处理

解析和处理特定文本格式的库。

通用

Office

PDF

Markdown

YAML

CSS

ATOM/RSS

SQL

HTTP

微格式

可移植的执行体

PSD

自然语言处理

处理人类语言问题的库。

浏览器自动化与仿真

多重处理

异步

异步网络编程库

队列

云计算

电子邮件

电子邮件解析库

网址和网络地址操作

解析/修改网址和网络地址库。

URL

网络地址

网页内容提取

提取网页内容的库。

HTML页面的文本和元数据

视频

维基

WebSocket

用于WebSocket的库。

DNS解析

计算机视觉

代理服务器

其他Python工具列表

End.

作者:36大数据
关注大数据和大数据应用_大数据第一科技网
原文地址:Python 爬虫的工具列表, 感谢原作者分享。

发表评论