如何生成简单好看的词云?

JavaScript011

如何生成简单好看的词云?,第1张

想要做出简单好看的词云,一般是要借助工具的。我之前用过Word Art, 效果还可以,现在也挺多人推荐。现在,我也在用另一个工具凡科快图,效果也很OK。因为网上已经有挺多人介绍过Word Art的使用方法,那我今天就重点分享一下快图里的词云功能怎么用吧。

打开官网进入“设计管理”页面,自定义创建空白画布或者直接把想要当成背景的图片拖进浏览器;

2.接下来,就进入图片的编辑页面了,点击左边“工具”,就能找到词云工具

3. 系统自带3种创建词云的方式,第一种是图形形状,里面包括心形、多边形、名片、社交等多种类型;第二种是文字形状,可以自己创建文字;第三种是自定义上传图片

4. 创建好词云框架后,下一步就是输入要填充的文字,还有调整大小、颜色、间距、密度等细节,所有的步骤都是在左边的功能框里选择和编辑

5. 需要注意的是,每一次调整之后都要点击右下角的“生成词云”才能预览修改后的效果;

6. 我们根据自己的需要调整好细节,就可以将其“应用到画板”后保存并下载使用了。

爬虫部分

首先 解析页面

在关闭js后发现 页面完全是静态的 所以只需要一次请求 就完全加载页面

先拿到page的数量

然后根据page数生成url

定义一个微博类和处理微博的方法draw

以微博为单位把每一页的微博存入list 调用draw方法提取目标字段

定义一个存入方法,本次选择使用mysql

爬取部分完成,接下来先对数据进行去重,按照mid分组即可

定义一个读方法把微博的content部分合起来

再定义一个词云生成方法generate_wc

最终结果展示

本次爬虫只完成了一个原型,理论上可用于任意关键字微博爬取,但还有很多地方可以改进,如微博的过滤。因为数量级不大,也没有使用断点的设计,cookie也是手动添加,没有打验证码的操作。有待改进。

词云是一种直观展示数据频率的图表类型,可以对出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”,从而过滤掉大量的文本信息,是浏览者只要一眼扫过文本就可以领略重点:

拿帆软报表举例,打开finereport设计器:

1、准备数据

新建工作簿,添加内置数据集file1,分别记录搜索词和浏览量,如下图所示:

2、插入图表

以单元格图表为例,合并一片单元格,点击插入>单元格元素>插入图表,选择词云,如下图:

选中图表,在右侧图表属性表中选择图表属性表-类型,默认已选择词云:

3、图表数据设置

选中图表,在右侧图表属性表中选择图表属性表-数据,设置如下:

4、图表样式设置

选中图表,在右侧图表属性表中选择图表属性表-样式>图例,形态选择区域段,区间配置选择自定义,设置如下:

图例新增高亮功能,默认开启,鼠标移动到图例,对应的图表内容高亮显示:

选择图表属性表-样式>系列,形状可设置为默认,云朵/漏斗/金字塔/小屋/拇指/地图/货币/汽车,自定义,这里选择云朵:

词云只可设置图表区背景,考虑到美观度,选择图表属性表-样式>背景,此处背景颜色设置为黑色

5、保存与浏览

保存模板,点击分页预览,效果如上。