python如何做词云 一步一步教你如何做

Python015

python如何做词云 一步一步教你如何做,第1张

如果你之前没有编程基础,没关系。希望你不要限于浏览,而是亲自动手尝试一番。到完成的那一步,你不仅可以做出第一张词云图,而且这还将是你的第一个有用的编程作品。

1、请确保你的python环境没有问题,用的开发工具是VsCode,首先你要在Python扩展中安装python开发环境(当然,这不是为你的windows安装python)。

2、那么你还需要安装所需要的第三方库,那么在VSCode中并没有PyCharm那么专业,这里需要获得你自己的Python脚本位置。

3、我们可以发现里面有一个名为pip.exe文件,这个文件就是python官方给我们去安装python第三方库的一个程序,那么我们可以在VsCode的终端中就可以去通过它,这也是我们为什么要获取python安装位置的根本原因。

4、python做词云呢,需要导入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平台图像处理标准库,功能是真的强大。首先需要读取文件 。

5、如果python引入无误,并代码无误,那么会弹出你生成的图片,该图片会储存在你的系统。

词云(Word Cloud)又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。每个词的重要性以字体大小或颜色显示。

词云(Word Cloud)主要用来做文本内容关键词出现的频率分析,适合文本内容挖掘的可视化。词云中出现频率较高的词会以较大的形式呈现出来,出现频率较低的词会以较小的形式呈现,词云的本质是点图,是在相应坐标点绘制具有特定样式的文字的结果。

目前已有多种数据分析工具支持这种图形,如Matlab, SPSS, SAS, R和Python等等,也有很多在线网页能生成word cloud,例如wordclouds.com。

wordcloud是python的一个三方库,根据文本中的词频,对内容进行可视化的汇总,可以用来绘制用户画像。

wordcloud的API总体来说并不多,且需要进行的配置并不复杂,适合新手上手。安装wordcloud可以使用python自带的pip工具来进行,本文使用的是python3.7,pip的版本是19.2.1。由于wordcloud依赖于numpy包、pillow包和matplotlib包,所以我们要先装好上述这三个包然后再装wordcloud包。

word cloud

wordcloud库把词云当作一个WordCloud对象,所以使用wordcloud可以大致分为三个步骤(以英文为例):

1、创建对象:wc= wordcloud.WordCloud。

2、加载文本:wc.generate("Choose a life of action, not one of oste-ntation.")。

3、输出文件:wc.to_file("./picture/1.png")。

wordcloud.to_file。

将生成的词云保存为output1.png图片文件,保存出到wordcloud.to_file图云.png文件夹中。

词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。基于Python的词云生成类库,很好用,而且功能强大。