如果文字很多,并且需要提取高频词的话,目前有两个词云在线生成器比较合适实现上述功能.
第一个就是微词云生成器,词功能在创建词云页的【内容】栏中导入大文本分词
把大段文本输入进去,点击分析,就会出现高频词了,在点击生成词云,最后点击加载词云就可以生成可视化词云图了,效果更加直观
第二个就是图悦也有此大段文本高频词功能
希望能帮助你!
爬虫部分首先 解析页面
在关闭js后发现 页面完全是静态的 所以只需要一次请求 就完全加载页面
先拿到page的数量
然后根据page数生成url
定义一个微博类和处理微博的方法draw
以微博为单位把每一页的微博存入list 调用draw方法提取目标字段
定义一个存入方法,本次选择使用mysql
爬取部分完成,接下来先对数据进行去重,按照mid分组即可
定义一个读方法把微博的content部分合起来
再定义一个词云生成方法generate_wc
最终结果展示
本次爬虫只完成了一个原型,理论上可用于任意关键字微博爬取,但还有很多地方可以改进,如微博的过滤。因为数量级不大,也没有使用断点的设计,cookie也是手动添加,没有打验证码的操作。有待改进。
利用ppt制作文字云效果,主要利用了口袋动画,现在就分享制作的具体过程和截图,希望对你有所帮助。
工具/原料
ppt2010
方法/步骤
首先启动ppt 2010,新建一个空白文档。
接着执行口袋动画-文字云命令,从菜单中选择文字云。
在云形状中选择自己喜欢的一个形状。这里选择苹果形状。
切换到词云内容,接着输入文字内容点击添加。
接着在左边的文字云中,点击下面的刷新预览图,自动进入生成阶段。
这样就自动生成了一个苹果形状的文字云效果。