python如何去除重复行并分别统计重复的行数？已有去除重复的代码

2023-02-25 01:49:02Python019

python如何去除重复行并分别统计重复的行数？已有去除重复的代码,第1张

python的速度效率是不高的，如何对速度要求比较高的话建议可以用c来写。

我写了这个代码，python2.6+windows xp测试通过。

希望能帮到你~

===================================================

a=[] #初始化要用到的列表a，用于记录原始行信息

b=[] #初始化要用到的列表b，用于记录结果数据，由两项构成。前一项为行信息如“小明：90”，后一项为该行对应的出现次数如2

f1=file("1.txt", "r") #打开1.txt文件

for line in f1:

a.append(line) #将1.txt文件每一行作为一个元素，存入列表a

f1.close

for n in a: #遍历a中每一项（记为n），即1.txt中每一行

flag=1

for i in range(0,len(b)):

if n == b[i][0]: #n与列表b中的每一项对比，如果有相等的：

b[i][1]=b[i][1]+1 #那么对应的出现计数加1

flag=0

break

if flag==1: #如果前面的比对没有一个相等的，即该行是第一次出现：

b.append([n,1]) #那么在列表b中添加改行为新的一项

f2=file("2.txt", "w") #打开2.txt文件，用于输出

for n in b: #输出格式为：行信息（tab）出现次数（回车）

f2.write(str(n[0][0:-1]) + "\t")

f2.write(str(n[1]) + "\n")

f2.close

print "Finished" #完成

使用open函数逐行读取文件，依次对比，如包含要求字符串，则数量累加1，读取完成后可统计出行数，代码如下：

n = 0

for line in open('filename','r'):

if '固定字符串' in line:

n += 1

print(n)

说明：

使用 for line in open这种方式可以提高代码效率，如需要更复杂统计，例如重复行，则可以使用hash函数，把行hash值存入列表，再做统计。

列表代码文件要用初始化

# 上一篇：如何学习GO语言？

# 下一篇：R语言里的求变量里多少观察值是真值

给您推荐相同类型的内容：

2019年流行的编程语言有哪些?入门Web前端学那个编程语言更好?
很多想要学习编程的小伙伴在入行前，都会纠结选择什么的样编程语言去学习，到底是选C++还是选JavaScript?Python和Java哪个更有前途呢?编程语言与应用场景有密切的关联关系，每一种编程语言都有自己的应用领域和特点，所以不能单纯的
python三个数比较大小
哈喽，小朋友们，今天酷酷老师带大家用C语言、Python、Scratch语言这三种不同的编程语言来比较三个数的大小。你们准备好小本本，和老师一起学习了吗？首先我们先来看一下C语言中如何比较三个数的大小：这是最容易理解的方法在之前判断两个数大
C语言中形参与实参怎么传递？
我简单描述一下~c语言传递参数机构是这样的~非指针类的数据传递参数时传数值，指针类数据传递参数时传地址（这里数组名也算指针）比如intmax(inta,intb)这时候如果调用这个函数max(x1,x2)仅仅将x1和x2的数值传递给函数ma
WPS中如何生成饼状立体图
1、以下以WPS的PPT文档为例，打开PPT，点击工具栏中的“插入”。2、选择“图表”选项。3、在弹出的对话框中，点击“饼图”并选择立体的饼图图形。4、点击后会弹出WPS表格，可以在表格内更改具体的数据。5、更改后会自动形成立体的饼图，显示
用c语言求四阶幻方,要求输出所有的由1~16组成的四阶幻方.
#include &ltstdio.h&gt #include &ltstdlib.h&gt #include &ltwindows.h&gt #define EVEN_DOUBLE_4 4
range()函数用法简述
语法： range(stop) range(start, stop[, step]) range函数是一个用来创建算数级数序列的通用函数，返回一个[start, start + step, start + 2 * step, .
R语言时间序列怎么改格式？？
&gtformat(t$dates[1], "%Y")[1] "2010"&gtformat(t$dates[1], "%m")[1] "01"
Go语言编程入门时需要注意什么
刚入门Go语言小白需要注意以下五点：1、注意书写代码的一些规范吧，特别是注意大小写、英文标点符号区别等，在特别的位置写上注释。2、主要是理解伪代码所描述的算法，伪代码要注意是不能直接运行的。3、注意编译器版本与书籍上所介绍版本是否一致，也注
前端开发工程师薪资怎么样？
根据职友集数据显示，全国web前端开发平均工资：¥ 11240月，取自 46734 份样本，较 2019 年，减少 26%。web前端开发工资按工作经验统计，其中应届生工资¥6030，1-3年工资¥9630，3-5年工资¥13560，5-
请大家帮忙解释下面这段所表达的意思，c语言的。
这些都是些ASCII码对应的十六进制形式，我帮你翻译了一下“L I am waitting for you I miss you”冷冰冰的十六进制转义在这个凌晨感动我了，大半夜的写代码的感觉一下子温馨了呢，衷心祝福lz吧~~~~~猜测下：这
go语言怎么输出字符串中的某个中文字符？
for index,val := range a {if val == '好' {fmt.println(index,x)}}对string做range得到的val是int32类型，直接用单引号比较就行我们的网站经常需要
面试问题总结（一）Golang
使用go语言的好处: go语言的设计是务实的, go在针对并发上进行了优化, 并且支持大规模高并发, 又由于单一的码格式, 相比于其他语言更具有可读性, 在垃圾回收上比java和Python更有效, 因为他是和程序同时执行的.1.
你为什么放弃golang?
因为内存管理粗糙。经常看到fmt.xxx导致内存占用太多，反射导致内存占用太多的抱怨。go语言适合写服务器组件，那种和业务数据无关的服务器。比如数据库服务器、web服务器、日志搜索引擎等。如果用来写一个crm管理系统，非常累，因为缺乏好多
Golang入门到项目实战 | golang for循环语句
go语言中的for循环，只有for关键字，去除了像其他语言中的while和do while. 注意：for表达式不用加括号循环输出1到10 运行结果初始条件，可以写到外面运行结果初始条件和结束条件都可以省略
Ruby中的|XXX|意义
在 ruby 中，{|args| statements} 叫做匿名函数，就是没有名字的小型函数。然后 each_byte 是一个方法，它接收一个可调用对象。有时候左花括号可以用 do 代替，有花括号用 end 代替，就是do |args|
python环境安装与配置
在windows下可以直接打开浏览器搜索python，进入官网，然后点击Download，去选择适合自己电脑的版本。以ubuntu为例：安装完以后可以运行python注：很多linux操作系统会默认安装pyth
学习c语言哪个书比较好些？
1.C语言入门经典《C语言入门经典》例子简单生活化，而且每个例子分析很细。章节安排合理，章末的例子还特别注重思路的引导，而且分析起来特别有成就感。这本书是自学过程的一本好书。2.C primer plus这本书很适合希望系统学习C语
linux服务器ruby
Ruby可以安装到你的用户目录。设定Ruby的path即可。但这样只能你的用户才可以运行Ruby和rb程序。你可以下载Ruby，然后安装到Home下，再修改用户de.bashrc，把ruby可执行程序的path加入PATH变量，此后就可以正
C语言中，%7.2f 表示数据占七列，其中小数占两列这句话是什么意思
表示最大场宽m，小数位为n位，整数位则为m-n-1位，够m位右对齐。%7.2f表示输出场宽为7的浮点数，其中小数位为2，整数位为4，小数点占一位，不够9位右对齐好，我来回答你。首先：%f代表会输出一个float的数据，意思是带小数点的（这你
GM（1，n）的R语言代码，有会编的给一个！！
#灰色预测模型GM(1,1)#用法：#假设数列1 2 3 4 5.5 6 7.5 为已知数据，你要预测后面3项，gm11([1 2 3 4 5.5 6 7.5],10) # 10=7+3# 序列输入格式为：x&lt-c(1,2,3,
电子科技大学的c语言教材都有哪些，难度都是怎么样的？
有电子科技大学出版社出版的C语言程序设计(第三版) 陈文宇，黄迪明，侯孟书，霍永青，熊志斌编著。给计算机学院使用。个人感觉教材比较简单，有些啰嗦。其他学院使用教材清华大学出版社出版的C程序设计，红皮。因为我是计算机学院的只是看过几眼。个人感
mac python3 轻松安装教程
首先要知道，mac自带一个2.7版本的python，如果你之前没装过其他版本，在终端运行python --version就会看到这个版本号打印出来。你可以直接使用这个版本的python进行操作。这里教你轻松安装
c语言培训机构排名
1、动力节点2、 IT培训网3、北大青鸟4、传智播客5、优就业6、潭州教育7、小码哥8、中软国际9、新华电脑学校10、尚观锦程动力节点专注Java教培12年,12年来多数的生源来自与口碑介绍,至于为什么毕业的
python中如何获得文件的修改时间？
我们通过文件属性的获取，os.stat() 方法：x0dx0a x0dx0a&gt&gt&gtimport osx0dx0a&gt&gt&gtstatinfo=os.stat(r&
Python win32 使用方式
handle = win32gui.FindWindow('Galaxy2DEngine',None) left, top, right, bottom = win32gui.GetWindowRect(handle
python能编辑同花顺指标广场指标吗?
能。Python配置同花顺全数据接口的教程，python能编辑同花顺指标广场指标，将同花顺、通达信、文华财经等的公式移植到了Python中。同花顺、通达信、文华财经麦语言等公式的表达十分简洁，适合做技术分析。市面上大家可以接触到的量化交易软
3.6 Go语言函数的延迟调用(Deferred Code)
在以下这段代码中，我们操作一个文件，无论成功与否都需要关闭文件句柄。这里在三处不同的位置都调用了file.Close()方法，代码显得非常冗余。我们利用延迟调用来优化代码。定义后的defer代码，会在return之前返回，让代
C语言是谁发明的？
C语言是“C语言之父”Dennis MacAlistair Ritchie（中文名：丹尼斯·里奇）创造出来的。C语言是D.M.Ritchie在B语言的基础上创造出来的。C语言的出现经历了以下历程：在1970年，美国贝尔实验室的 Ken
怎么自学C语言入门
在开始学习C语言基础时，要反问自己为什么学C语言，如何学好C语言。同时要知道什么是C语言以及C语言的发展。当对这些知识有了一个概念之后，就正式开始学习C语言了，其中，可能会学到数据类型、运算符、表达式、数组、函等，这些是为了对C语言的基
go语言的出现非常奇怪，有几个问题请高手答案一下~~~~？？
1：go与c语言相比，go有垃圾回收，不会造成内存泄露问题，go的语法简洁优美，同样的c++100行代码go大概50行可以做到，go的目标是能做C++能做的事，虽然目前可能不太实际2：go的并行机制并不是一般的线程，通过channel和go

推荐阅读

热门文章

最新发布

标签列表

python如何去除重复行并分别统计重复的行数？已有去除重复的代码

给您推荐相同类型的内容：