NER----pythonNLP工具包

Python012

NER----pythonNLP工具包,第1张

使用python进行自然语言处理,有一些第三方库供大家使用:

·NLTK(Python自然语言工具包)用于诸如标记化、词形还原、词干化、解析、POS标注等任务。该库具有几乎所有NLP任务的工具。

·Spacy是NLTK的主要竞争对手。这两个库可用于相同的任务。

·Scikit-learn为机器学习提供了一个大型库。此外还提供了用于文本预处理的工具。

·Gensim是一个主题和向量空间建模、文档集合相似性的工具包。

·Pattern库的一般任务是充当Web挖掘模块。因此,它仅支持自然语言处理(NLP)作为辅助任务。

·Polyglot是自然语言处理(NLP)的另一个Python工具包。它不是很受欢迎,但也可以用于各种NLP任务。

参考: http://www.coderjie.com/blog/60740e24d2f711e6841d00163e0c0e36

把nltk的各种应用讲的很全面

pattern.en 是一个基于Python的自然语言处理工具包,en代表English(没错,还有西班牙语es、德语de、法语fr、意大利语it、荷兰语nl),它可以做的事包括:

词性标注(part-of-speech tagger)、情感分析(sentiment analysis)、动词处理(verb conjugation,不知道怎么翻译啦)、名词的单复数处理(noun singularization &pluralization)以及一个WordNet的接口。