NER----pythonNLP工具包

Python014

NER----pythonNLP工具包,第1张

使用python进行自然语言处理,有一些第三方库供大家使用:

·NLTK(Python自然语言工具包)用于诸如标记化、词形还原、词干化、解析、POS标注等任务。该库具有几乎所有NLP任务的工具。

·Spacy是NLTK的主要竞争对手。这两个库可用于相同的任务。

·Scikit-learn为机器学习提供了一个大型库。此外还提供了用于文本预处理的工具。

·Gensim是一个主题和向量空间建模、文档集合相似性的工具包。

·Pattern库的一般任务是充当Web挖掘模块。因此,它仅支持自然语言处理(NLP)作为辅助任务。

·Polyglot是自然语言处理(NLP)的另一个Python工具包。它不是很受欢迎,但也可以用于各种NLP任务。

参考: http://www.coderjie.com/blog/60740e24d2f711e6841d00163e0c0e36

把nltk的各种应用讲的很全面

习python几面入手:

习基本语包括数据结构(数组字典等)解数据类型及类型转换

流程控制---选择循环

函数模块熟练使用用内建函数

class类

线程