python文本处理--统计

2023-02-26 19:19:02Python012

python文本处理--统计,第1张

text = ['3\n', '35\n', '5\n', '75\n']

count = [0 for i in range(10)]

for line in text:

line = int(line.strip())-1

index = line / 10

count[index] += 1

print count

#=> 结果

[2, 0, 0, 1, 0, 0, 0, 1, 0, 0]

这样正好就第一位是1-10，第四位是31-40.。

text是你从文件中读取的内容。这个用open和readlines就可以完成了。

其中line = int(line.strip())-1是为了将每个index中的检测范围向上扩1，即本身第一位是0-9的，数字-1后，就能将1-10算入第一个中了。

写一个文本统计的脚本：计算并打印有关文本文件的统计数据，包括文件里包含多少个字符、行、单词数，以及前10个出现次数最多的单词按顺序排列

import time

keep=['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z',' ','-',"'"]

stop_words=['the','and','i','to','of','a','you','my','that','in','she','he','her','his','it','be','was','had']

def normalize(s):

result=''

for c in s.lower():

if c in keep:

result+=c

词数文本文件第一个中了

# 上一篇：如何在windows下安装GIT

# 下一篇：Java运算符？

给您推荐相同类型的内容：

4种Python爬虫（4. 手机APP，如，乐刻运动）
目录:1. PC网页爬虫 2. H5网页爬虫 3. 微信小程序爬虫 4. 手机APP爬虫爬取乐刻运动手机APP的课表数据。Android和iOS都可以。要制定具体方案，还是要从抓包分析开始。如果你在前一章《三、微信小程
初学C语言应该用什么软件？
学c语言可以用的软件推荐如下：1、TurboC是由美国Borland公司开发的一套C语言程序开发工具，Borland公司是一家专门从事软件开发、研制的大公司。该公司相继推出了一套Turbo系列软件，如TurboBASIC、TurboPasc
java中的（或运算，异或运算，与运算）解释下
java中或运算、异或运算、与运算的使用实例和解释如下：public class Test { public static void main(String[] args) { 1、左移( &lt&
R语言 Testlink excel 转XML 批量导入测试用例
Testlink作为一个开源的项目管理工具，功能是非常强大的。不得不说，在测试用例创建方面功能有些弱。大家都习惯了在excel中写测试用例，当要导入到Testlink中时需要一个一个的创建。这耗费了大量的时间，在网络不好的情况下
区块链技术架构有些什么课程介绍？
目前市场上区块链培训课程跨度很大，课程内容和授课形式也是五花八门。区块链1、编程基础入门计算机软硬件基础、字符集及字符编码、HTML+CSS（含HTML5+CSS3）、ECMA + BOM + DOM、jQuery、node.js、Aj
java中%代表什么意思？
Java是一门面向对象编程语言，不仅吸收了C++语言的各种优点，还摒弃了C++里难以理解的多继承、指针等概念，因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表，极好地实现了面向对象理论，允许程序员以
电脑培训主要学习哪些知识啊？
电脑培训主要是学习计算机语言，而且计算机语言的种类非常的多，要精通电脑就需要基本都要求掌握，总的来说需要掌握的可以分成机器语言，汇编语言，高级语言三大类。一： JavaScriptJavaScript一种直译式脚本语言，是一种动态类型、弱类
Java运算符？
1.运算符1)算术运算符+-*%++--+:如果有加数为“”（字符串），表示连接%：2%1 0++：自增1 num++:先参与运算，然后在自增 ++num：先自增，再参与运算--：自减1 num-- --num2)赋值运算符
对于初学者而言，如何学习编程？
对于初学者而言，如何学习编程？首先,应该掌握最基本的编程知识,这样才能够保证明白自己想要做什么(能够看懂代码,但是不会自己编写,没关系!)再次,多动手编一些简单的小程序,并且逐步加深上面都是计算机处理信息、理解信息的例子。上个世纪，几个超
go的垃圾回收算法
从Gov1.12版本开始，Go使用了非分代的、并发的、基于三色标记清除的垃圾回收器。关于垃圾回收，比较常见的算法有引用计数、标记清除和分代收集，Golang语言使用的垃圾回收算法是标记清除。Golang语言的标记清除垃圾回收算法，为了防
鲁比·洛斯是男是女
女的。鲁比·洛斯（Ruby Rose），1986年3月20日出生于澳大利亚墨尔本，澳大利亚MTV音乐电视台主持人、电台MC、模特、演员。鲁比·洛斯的职业生涯是从音乐主持人起步的，后来做过电台主持人和模特。代表作品有女子监狱、生化危机：
Groovy脚本实现轻量级规则引擎
1）当业务规则变更时，对应的代码也得跟着更改，每次即使是小的变更都需要经历开发、测试验证上线等过程，变更成本比较大。 2）长时间系统变得越来越难以维护。 3）开发团队一般是由一个熟悉业务的BA（业务分析人员）和若干个熟悉技术
java语言if语句三种形式分别在什么时候使用
java语言if语句三种形式分别在什么时候使用java中if三种形式分别为if(){}、if(){}else{}、if(){}else if(){}else if(){}...else{}第一种：if(){}当符合某种条件时需要
QXL29-1.25130-70-AIII是几吨锅炉
QXL29-1.25130-70-AIII这是强制循环式链条炉排热水锅炉，额定功率为29MW，蒸汽压力为1.25MPa，额定出口水温130℃，额定进口水温70℃，使用三号烟煤。要问是多少吨的锅炉？也是大约相当于41.4th蒸汽锅炉。一般
什么是java jdk?
jdk安装好配置环境变量后，系统就承认了 java，javac等命令，当编译好java文件，就可以在开始——运行——cmd的dos系统下运用指定命令运行java文件。JDK 是整个Java的核心，包括了Java运行环境，Java工具和Jav
RVM 简易使用教程
虽然可以用 sudo 命令将 rvm 安装到 usrlocal 目录下，但官方推荐的还是单用户安装，命令是：默认安装会修改 dotfiles 比如 ~.bash_profile ，如果不想要修改 dotfiles，则执行如下命
R语言|绘制物种累计曲线
物种累积曲线( species accumulation curves)用于衡量和预测群落中物种丰富度随样本量扩大而增加的幅度，在生物多样性和群落调查中，被广泛用于判断样本量是否充分的并估计群落丰富度。一般而言，在样本量较少的情况下，
急!!!请问各位高手：如何用C语言编程产生高斯白噪声？万分感谢啊！
http:topic.csdn.nett20020911091013593.html 有程序和头文件（还有3处更正）自己添加主程序和参数，调用 mrandom 即可。高斯白噪声就是一组高斯分布的随机数，如下面是产生均值为nois
有没有会用rubytk的大神求教
-吹奏筒音的指法（六孔全闭）不难，难的是气息的控制——双唇要软一点，口风稍大一点，气量给多一点，响了就行，音量还不能太大，否则低音5就变成中音5了。中音5要开第六孔，口风要硬一点，要稳稳地顶住，不能掉到低音5来。Ruby 是开源的，在Web
Go语言输出打印--排坑
一.几种公共方法 1)Print: 输出到控制台(不接受任何格式化，它等价于对每一个操作数都应用 %v)print 在golang中是属于输出到标准错误流中并打印,官方不建议写程序时候用它。可以再debug时候用 2)Pr
java中的if表达式什么意思
if是条件判断，如果不满足条件的话，执行else；如int i =5if(i==4){判断是否为4System.out.println(“这个数是:4”)；如果是，输出结果。}else{System.out.println(“这个数
影响变量是什么意思
心理健康正日益成为一个传统上被掩盖的话题。我们已经开始理解心理健康对生产力，总体健康，人际关系和身体健康的影响，并将更多的注意力放在心理健康上。甚至雇主也开始更加重视提供工作环境和条件，以保持员工尽可能快乐和健康，而先进的公司则提供津贴
网络-R语言进行网络分析的基础包 igraph
图有一个类' Igraph '。下面是一个示例，一个使用make_ring创建的环形图: 如果想查看图形的边，可以使用print_all函数: 要创建具有给定结构的小图形，graph_from_literal函数
如何学习GO语言？
Go语言也称 Golang，兼具效率、性能、安全、健壮等特性。这套Go语言教程（Golang教程）通俗易懂，深入浅出，既适合没有基础的读者快速入门，也适合工作多年的程序员查阅知识点。Go 语言这套教程在讲解一些知识点时，将 Go 语言和其
python播放音频
anaconda建立环境 python=3.7.9 切换到虚拟环境里安装pyaudio 这个库好像只能播放.wav文件而且wav文件内部有不同的格式我们需要sox转换格式 sox在python里安装 pip ins
app java是什么
app java应该是java application的简称java application是Java应用程序，应用程序运行于本计算机，与本机用户交互，完成一定的功能，像word、excel、windows录音机都属于应用程序，Java应用
为什么要使用 Go 语言？Go 语言的优势在哪里
1、学习曲线它包含了类C语法、GC内置和工程工具。这一点非常重要，因为Go语言容易学习，所以一个普通的大学生花一个星期就能写出来可以上手的、高性能的应用。在国内大家都追求快，这也是为什么国内Go流行的原因之一。2、效率Go拥有接近C的运行效
R语言数组和矩阵
R语言数组和矩阵 1 数组数组可以看成一个由递增下标表示的数据项的集合，例如数值。数组的生成如果一个向量需要在R中以数组的方式被处理，则必须含有一个维数向量作为它的dim属性。维度向量由dim()指定，例如，z是一个由1500个元素组成的向
r降雨量化代表什么意思
(R)威廉指标是由LarryWilliams于1973年首创的，WMS表示的是市场处于超买还是超卖状态。WMS的计算公式是：n日WMS=（Hn－Ct）(Hn－Ln)×100。Ct为当天的收盘价；Hn和Ln是最近n日内（包括当天）出现的最高
R语言常用函数整理（基础篇）
R语言常用函数整理本篇是基础篇，即R语言自带的函数。 vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列表 data.frame：数据框 c：

推荐阅读

热门文章

最新发布

标签列表

python文本处理--统计

给您推荐相同类型的内容：