想要做出简单好看的词云,一般是要借助工具的。我之前用过Word Art, 效果还可以,现在也挺多人推荐。现在,我也在用另一个工具凡科快图,效果也很OK。因为网上已经有挺多人介绍过Word Art的使用方法,那我今天就重点分享一下快图里的词云功能怎么用吧。
打开官网进入“设计管理”页面,自定义创建空白画布或者直接把想要当成背景的图片拖进浏览器;
2.接下来,就进入图片的编辑页面了,点击左边“工具”,就能找到词云工具
3. 系统自带3种创建词云的方式,第一种是图形形状,里面包括心形、多边形、名片、社交等多种类型;第二种是文字形状,可以自己创建文字;第三种是自定义上传图片
4. 创建好词云框架后,下一步就是输入要填充的文字,还有调整大小、颜色、间距、密度等细节,所有的步骤都是在左边的功能框里选择和编辑
5. 需要注意的是,每一次调整之后都要点击右下角的“生成词云”才能预览修改后的效果;
6. 我们根据自己的需要调整好细节,就可以将其“应用到画板”后保存并下载使用了。
爬虫部分首先 解析页面
在关闭js后发现 页面完全是静态的 所以只需要一次请求 就完全加载页面
先拿到page的数量
然后根据page数生成url
定义一个微博类和处理微博的方法draw
以微博为单位把每一页的微博存入list 调用draw方法提取目标字段
定义一个存入方法,本次选择使用mysql
爬取部分完成,接下来先对数据进行去重,按照mid分组即可
定义一个读方法把微博的content部分合起来
再定义一个词云生成方法generate_wc
最终结果展示
本次爬虫只完成了一个原型,理论上可用于任意关键字微博爬取,但还有很多地方可以改进,如微博的过滤。因为数量级不大,也没有使用断点的设计,cookie也是手动添加,没有打验证码的操作。有待改进。
词云是一种直观展示数据频率的图表类型,可以对出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”,从而过滤掉大量的文本信息,是浏览者只要一眼扫过文本就可以领略重点:
拿帆软报表举例,打开finereport设计器:
1、准备数据
新建工作簿,添加内置数据集file1,分别记录搜索词和浏览量,如下图所示:
2、插入图表
以单元格图表为例,合并一片单元格,点击插入>单元格元素>插入图表,选择词云,如下图:
选中图表,在右侧图表属性表中选择图表属性表-类型,默认已选择词云:
3、图表数据设置
选中图表,在右侧图表属性表中选择图表属性表-数据,设置如下:
4、图表样式设置
选中图表,在右侧图表属性表中选择图表属性表-样式>图例,形态选择区域段,区间配置选择自定义,设置如下:
图例新增高亮功能,默认开启,鼠标移动到图例,对应的图表内容高亮显示:
选择图表属性表-样式>系列,形状可设置为默认,云朵/漏斗/金字塔/小屋/拇指/地图/货币/汽车,自定义,这里选择云朵:
词云只可设置图表区背景,考虑到美观度,选择图表属性表-样式>背景,此处背景颜色设置为黑色
5、保存与浏览
保存模板,点击分页预览,效果如上。