·NLTK(Python自然语言工具包)用于诸如标记化、词形还原、词干化、解析、POS标注等任务。该库具有几乎所有NLP任务的工具。
·Spacy是NLTK的主要竞争对手。这两个库可用于相同的任务。
·Scikit-learn为机器学习提供了一个大型库。此外还提供了用于文本预处理的工具。
·Gensim是一个主题和向量空间建模、文档集合相似性的工具包。
·Pattern库的一般任务是充当Web挖掘模块。因此,它仅支持自然语言处理(NLP)作为辅助任务。
·Polyglot是自然语言处理(NLP)的另一个Python工具包。它不是很受欢迎,但也可以用于各种NLP任务。
参考: http://www.coderjie.com/blog/60740e24d2f711e6841d00163e0c0e36
把nltk的各种应用讲的很全面
习python几面入手:习基本语包括数据结构(数组字典等)解数据类型及类型转换
流程控制---选择循环
函数模块熟练使用用内建函数
class类
线程