SnowNLP:一个强大的python中文文本处理库

Python012

SnowNLP:一个强大的python中文文本处理库,第1张

笔者由于最近做一个监控应用评论内容的项目,为满足需求,需要对抓取下来的应用评论做中文语义识别,结果搜出来的大部分都是仅限英文语义识别的库,搜好久才找到这个国人开发的中文文本处理库(包含语义识别功能),特此介绍给大家。

跟其他python类库一样,使用pip安装就行了

用的时候,有时候可能会觉得有些语句分析出来的结果会不太准确,这时候你就需要更新语料库,再进行训练,这样下次分析出来的结果就更加准确了。下面介绍一下如何进行训练

首先准备两份语料文本,neg.txt(负面语料文本) pos.txt(积极语料文本)

再次把生成好的sentiment.marshal放入类库的/sentiment 就可以了

试用效果如下,分析各渠道应用市场评论内容的情感:

目前笔者也仅仅试用了情感分析的功能而已,其他功能欢迎读者自行试用,总之就是相当强大

「蟒蛇」的意思。

而实际上这个名字的来历是发明者为了纪念他喜爱马戏团的一个角色,角色名就是python。

Python(英语发音:/_pa_θ_n/),是一种面向对象、解释型计算机程序设计语言,由GuidovanRossum于1989年底发明,第一个公开发行版发行于1991年Python语法简洁而清晰,具有丰富和强大的类库它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。

编程语言没有汉化版,有中文的编程语言"易语言",具体我就不多说了

python没有汉化版

不过python的编辑器有汉化版,具体可以自己去百度

我用的是pycharm