用Python实现小说里的高频词统计并显示

2023-02-26 10:41:02Python021

用Python实现小说里的高频词统计并显示,第1张

用jieba做分词，用wordcloud包做词云就可以了

# 读取文件内容

file = 'd:/艾萨克·阿西莫夫/奇妙的航程.TXT'

f = open(file, 'r', encoding='gbk')

text = f.read()

f.close()

# 使用jieba分词,因为wordcloud是以空格识别单词边界的

import jieba

text = ' '.join(jieba.cut(text))

# 掩码图片,单色图就好

from scipy.misc import imread

color_mask = imread('D:/Pictures/7218.png')

# 建立词云对象,因为是中文,指定一个中文字体,不然可能会乱码

# WordCloud的参数可以控制很多内容,请自行阅读包的文档

import wordcloud

w = wordcloud.WordCloud(font_path='C:/Windows/Fonts/msyh.ttc',

max_words=100,

mask=color_mask)

# 载入以空格分词的字符串

w.generate(text)

# 生成图片

w.to_file('d:/img1.png')

import re

from collections import Counter

from matplotlib.pyplot import pie,show

f = 't.txt'

c = Counter(re.findall(r'(\w{3,})',open(f).read().lower())).most_common(20)

pie([i[1] for i in c],labels=[i[0] for i in c])

show()

分词阿西莫夫空格因为内容

# 上一篇：go语言适合做什么

# 下一篇：如何在golang 中调用c的静态库或者动态库

给您推荐相同类型的内容：

Java培训班都需要学什么？
java培训一般需要4-6个月的时间。上课是进行集中化的学习。【点击测试我适不适合学设计】Java技能的核心和基础JavaSE。这一阶段会接触到Java基础语法、面向对象编程思维、Java常用API、多线程并发编程、数据结构集合结构
网络爬虫是语言go，为什么？
不是啊，都可以啊，比如C（万能的啥都可以做），C++（也基本是万能的，爬虫不算啥），python（简单，几十行代码能搞定一个小型爬虫），go当然也可以。没有限制的！希望我的回答对你有帮助望采纳！Go语言由Google公司开发，并于2009年
现在it好不好学
首先，你一定要有兴趣。爱因斯坦说兴趣是最好的老师，如果你想转行IT，你有兴趣是肯定的，它会是你今后在这个行业里越走越好的动力。其次，你要问问自己，真的适合自己吗？你是否能承受996的压力，耐得住单调、枯燥的寂寞，具有较好的逻辑思维，拥有终生
R语言中$是什么意思
$是S3类的引用方式，@是S4类的引用方式。$比较常用，@比较少用。通常我们的data.frame, list. 向量等用$就可以。S4也有例如，有个维恩包Vennerable：S4类型，想取得里面IntersectionSets，信息必
Python语音识别,调用的是哪个客户端接口函数
调用腾讯云的语音识别(一句话识别)接口-Python版。安装语音识别，语音识别器编码，处理Ubuntu服务器，处理WSL。要运行我们代码的语音识别库，我们首先需要安装语音识别，然后还必须安装PyAudio。首先，我们从主包开始：sudo p
如何快速入门学习Java？
如何快速入门学习Java？其实很多时候都是万事开头难，我们一旦接触Java学习可能并不是很难，当然需要我们制定Java学习路线图对于我们的学习非常有帮助，那么Java入门怎么学习呢？1、Java免费视频教程学习首要去找一个Java的根底教
java怎么强行终止程序
在java程序中，可以使用java.lang.System的exit方法来终止程序的执行，12345678public static void main(String[] args) {System.out.println("开始
r语言两个百分号什么意思
输出百分号。%具有特殊含义，比如%d输出整数，所以%%就是输出%, %%d就是输出%d。语言中主要有两个地方使用%作为运算符：一个为取余运算符，另一个为格式输入输出的时候格式控制符。% 是取余运算符。一个表达式的值除以另一个表达式的
急求c语言编程答案
test.cpp : 定义控制台应用程序的入口点。 test1.cpp : Defines the entry point for the console application. test.cpp : Defines
什么是R语言
什么是R语言R是用于统计分析、绘图的语言和操作环境。R是基于S语言的一个GNU项目，所以也可以当作S语言的一种实现，通常用S语言编写的代码都可以不作修改的在R环境下运行。R 是统计领域广泛使用的诞生于 1980年左右的 S 语言的一
《Python学习手册（第4版）》pdf下载在线阅读全文，求百度网盘云资源
《Python学习手册（第4版）》（[美] Mark Lutz）电子书网盘下载免费在线阅读资源链接：链接: https:pan.baidu.coms1vR_OkfCkNm9p8ueB08eWOw提取码: 6fvx 书名：P
java培训一般要多久？上课时间如何安排？
java培训一般需要4-6个月的时间。上课是进行集中化的学习。【点击测试我适不适合学设计】Java技能的核心和基础JavaSE。这一阶段会接触到Java基础语法、面向对象编程思维、Java常用API、多线程并发编程、数据结构集合结构
学java应该从哪里开始？
一、学习基础语言：掌握基础语言是非常重要的一个步骤。在学习过程中，如果你不了解基础语言知识，在后期就会出现不知道该做什么的情况，但不是要求你把所有的基础知识背熟，最重要的是掌握Java的核心概念和编码技术，这样对于理解代码知识有很大的帮助。
r语言中%%什么意思
整数除法，取小数点前面的数字。比如5%%2会得到2。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。发展历史：R是统计领域广泛使用的诞生于1980
C语言写计算分段函数
你确定y也是0-40间的整数吗？如果是的话，那么该分段函数中的第三段计算的结果已经超出了数值范围啊；如果y的取值没有限制，那么程序如下：#includevoidmain(){intx,yscanf("%d",&a
C语言中 delay 函数如何运用？
1、delay函数是一般自己定义的一个延时函数。2、C语言定义延时函数主要通过无意义指令的执行来达到延时的目的。下面给出一个经典的延时函数。定义一个延时xms毫秒的延时函数void delay(unsigned int xms)
c语言指针如何赋值
指针的赋值int*pintaintb[1]p=&ampap=b指针的赋值，“=”的左操作数可以是*p，也可以是p。当“=”的左操作数是*p时，改变的是p所指向的地址存放的数据；当“=”的左操作数是p时，改变的是p所指向的地址。数组的
ASN.1语法以及在python中如何编码解码
“ ASN.1的文章本来是免费的，但是有的人一定要搞小动作，咱惹不起就只能躲着了，做了一些修改后，改为付费文章 ” 应用程序在网络协议的应用层对payload数据，多使用ASN.1标准进行处理 ASN.1 ASN.1
深圳java培训哪个机构好
深圳比较好的Java培训机构有【达内教育】。该机构在学员报名之前完全公开所有授课讲师的授课安排及背景资料，并与学员签订《指定授课讲师承诺书》，确保学员利益。【达内教育】java培训班的优势：1、从理论教学到实战教学，每一个教学过程中，都是为
go语言中fmt.Println(s0==nil)什么意思？
对于某些类型的变量，如指针、切片、map、接口、通道、函数等，如果从未为它赋过值，则它将具有默认值nil。这句代码的意思就是，如果s0未初始化过，就打印true，否则打印false。队列的概念在顺序队列中，而使用循环队列的目的主要是规避
C语言冒泡排序法代码
冒泡排序每一趟排序把最大的放在最右边。比如：87 12 56 45 7887和12交换：12 87 56 45 7887和56交换： 56 87 45 7887和45交换： 45 87 7887和78交换：
用串口服务器采集设备的输出数据时,显示串口是打开的,为何不能采集到数据？
串口服务器的串口要设置波特率，要与设备串口发送数据的波特率相同，看一下设备说明书，它串口发送数据的协议是什么，包括波特率，数据位数(有7位的)，停止位位数等，另外串口服务器要通过网线连接到交换机上，电脑也连接的交换机，设置网络配置等，才能收
C语言中ab+是什么意思
a&ampb在c语言中的意思是a和b按位进行与运算。&amp后面是个变量。每个变量对应一块存储空间。每个存储空间有一个编号，也就是地址，&amp变量名，表示取出这个编，变量名表示取出这个编号所对应的存储空间里的值。C
Python2 与 Python3 的 map 函数
Python2 的 map 函数将函数 func 应用到一个序列的每个元素，或者多个序列的相同索引位置对应的元素，最终返回一个 list。 Python3 的 map 函数与 Python2 功能一致，最后返回的是一个 map 对象。可
R语言中$是什么意思
$是S3类的引用方式，@是S4类的引用方式。$比较常用，@比较少用。通常我们的data.frame, list. 向量等用$就可以。S4也有例如，有个维恩包Vennerable：S4类型，想取得里面IntersectionSets，信息必
r语言两个百分号什么意思
输出百分号。%具有特殊含义，比如%d输出整数，所以%%就是输出%, %%d就是输出%d。语言中主要有两个地方使用%作为运算符：一个为取余运算符，另一个为格式输入输出的时候格式控制符。% 是取余运算符。一个表达式的值除以另一个表达式的
怎么安装r语言中的rjava包
WINDOWS版的配置第一步：安装rJava和jdkinstall.packages("rJava")配置好java第二步：设置环境变量，涉及java调用R（我的电脑右键-属性-高级设置-环境变量）CLASSPAT
c语言结构体是什么？
在C语言中，结构体(struct)指的是一种数据结构，是C语言中聚合数据类型(aggregate data type)的一类。结构体可以被声明为变量、指针或数组等，用以实现较复杂的数据结构。结构体同时也是一些元素的集合，这些元素称为结构体
我是做java开发刚进一个新公司怎么才能快速融入公司项目里能读懂项目
应届生：普通5K左右，能力强6K左右； 1年工作经验：普通6K，能力强7K；2年工作经验：普通7-8K，能力强8-9K；3年工作经验：普通9-10K，能力强10-12K；3-5年：普通10-12K，能力强12-18K。5年以上：15K+，5
如何在golang 中调用c的静态库或者动态库
Cgo 使得Go程序能够调用C代码. cgo读入一个用特别的格式写的Go语言源文件, 输出Go和C程序, 使得C程序能打包到Go语言的程序包中.举例说明一下. 下面是一个Go语言包, 包含了两个函数 -- Random 和 Seed --

推荐阅读

热门文章

最新发布

标签列表

用Python实现小说里的高频词统计并显示

给您推荐相同类型的内容：