python读取大文件处理时使用多线程

2023-02-26 02:45:02Python017

python读取大文件处理时使用多线程,第1张

如果有个很大的文件，几十G?，需要每次读取一部分，处理后再读取剩余部分。

with open as f 已经从内部处理难点，使用 for line in f 以迭代器的形式每次读取一行，不会有内存问题。

下面程序的思路是用一个列表存放读取到的数据，达到长度后就开始处理，处理完就清空列表，继续执行

工作中经常会遇到处理日志文件的问题：为了得到日志的最新状态，我们需要获取日志文件的最后部分行来做判断。那么，这种情况下我们应该怎么做呢？

1）常规方法：从前往后依次读取

步骤：open打开日志文件。

读取文件，获取文件的总行数。

遍历所有行，提取指定行的数据。

优点：简单，方便

缺点：当文件大了以后时间太慢，无法忍受

2）推荐方法：

步骤：open打开日志文件。

移动文件读取指针到文件末尾。

从后往前移动指针直到合适的位置。

读取文件，提取指定行的数据。

优点：时间相对固定，适合处理大文件

示例：

[python] view plain copy

logFile = open('logFilePath.log', 'r')

logFile.seek(0,2)

logFile.seek(-1000000,2)

rowCount = 0

for row in logFile.readlines()[1:]:

pass

seek():移动文件读取指针到指定位置

tell():返回文件读取指针的位置

seek()的三种模式：

（1）f.seek(p,0) 移动当文件第p个字节处，绝对位置

（2）f.seek(p,1) 移动到相对于当前位置之后的p个字节

（3）f.seek(p,2) 移动到相对文章尾之后的p个字节

文件指针位置日志字节

# 上一篇：在python 3.5中，cmp(a,b)被代替为(a>b)-(a<b)，请解释下(a>b)-(a<b)是什么意思

# 下一篇：win7下python2.7怎么安装pip

给您推荐相同类型的内容：

python中怎么调用自己的方法
CC++对Python的调用层次可以分为三个层次, (1) 高层次的调用, (2)纯Python调用, (3) Python方法的扩展(也就使向Python输出调用函数). 这里我主要讨论(1)和(2)两种方法.1 高层次的调用这是最简单
win7下python2.7怎么安装pip
1、找到easy_install.exe工具。在windows下安装Python后，在其安装路径下的scripts文件中默认安装好了easy_install工具。完整路径如下例：D:Python27Scriptseasy_instal
python给pdf添加文本框
1、使用阅读PDF，创建一个包含要使用ReportLab添加的文本的新pdf文件。2、将其另存为字符串对象使用读取字符串对象。3、使用创建一个新的PDF对象PdfFileWriter，将其称为输出遍历，输入内容并申请。4、要添加文本的每个页
Python将两个字典合并成一个字典
d1={'tudou':3,'yangcong':1,'mitao':8}d2={'mitao':3,'pantao':5,'wu
C语言中整型常量有几种形式？它们是如何表示的?
在C语言中，整型常量分为十进制整型常量、八进制整型常量和十六进制整型常量三种表示形式。1、十进制整型常量此种格式的整型常量只能出现 0～9 的数字，且可带正、负号。比如：0 1 364 28 -342、八进制整型常量此种格式的整型常量以数字
c语言培训机构排名
1、动力节点2、 IT培训网3、北大青鸟4、传智播客5、优就业6、潭州教育7、小码哥8、中软国际9、新华电脑学校10、尚观锦程动力节点专注Java教培12年,12年来多数的生源来自与口碑介绍,至于为什么毕业的
Python怎样卸载?
python彻底卸载的方法（不残留）：1、进入电脑主界面。打开这台电脑上的开始。2、然后点击在开始上点击这个运行。3、在运行上输入图一的cmd点击这个确定。4、接着按红色方形框里面输入命令，得到一个程序的版本。5、然后到这个网上下载对应的
python中列表的增删改查
关于列表首先需要知道它是一系列按特定顺序排列的元素组成你可以创建包含字母表中所有字母、数字0至9或所有家庭成员姓名的列表；也可以将任何东西加入列表中，其中的元素之间可以没有任何关系。鉴于列表通常包含多个元素，给列表指定一个表示复的名称
c语言闰年的判断编程是什么?
四种方法判断闰年：第一种：条件嵌套语句（三个if…else…）。如果普通年能被4整除但不能被100整除，则为闰年，例如2020年为闰年。如果世纪年可被400整除，则为闰年，例如2000年为闰年。第二种则是直接条件判断，if…else
python3IDE怎么导入cv 2
1.在命令行窗口输入python确定自己的版本，我用的是3.6.3 2.我原先就有numpy，就不需要下载了。（没有的自行下载）3.下载对应版本的opencv，电脑64位的还是32位的要认真看好，下载地址：https:www.lfd.u
c语言for嵌套循环
这段代码的意思是：三层嵌套，每层都是循环两次：0和1。然后把三层嵌套当前的值都打印出来。结果实际上是从0到7的二进制数，就是：000001010011100101110111里面的for循环相当于外部for循环的循环体，举一个例子：for(
python-docx生成默认有页码的word文档
要求：页码从第1章开始，按阿拉伯数字连续编排。页码位于页面底端，居中书写；虽然在python-docx 0.8.8 (2019-01-07)的版本中已经支持了word文档的页眉页脚的设置，但目前我也尚未找到怎么在页脚中显示页码。
c语言链表建立
#include#includestructchain{intvaluestructchain*next}structchain*create(){structchain*head,*tail,*pintxhead=tail=nullwhi
python中如何判断一个数是否为整数
python中如何判断一个数x是否为整数x是整数，取整后仍是整数，int（x）==x 为Truex不是整数，就是含有小数部分，int（x）！=x 为Trueisinstance()函数&gt&gt&gtisin
c语言中sum是什么意思
这是自定义关键字，不属于C语言关键字，无固定含义。开发者可以自定义sum，一般用来表示求和变量。举例如下：#include&ltstdio.h&gtint main(){int a,b,suma=1b=1s
c语言培训机构排名
1、动力节点2、 IT培训网3、北大青鸟4、传智播客5、优就业6、潭州教育7、小码哥8、中软国际9、新华电脑学校10、尚观锦程动力节点专注Java教培12年,12年来多数的生源来自与口碑介绍,至于为什么毕业的
树莓派上用什么编程？
树莓派用python来进行编程。树莓派项目的一个核心思想是Python编程语言的使用。Python允许树莓派的拥有者将项目扩展到令人难以置信的规模。Python是一个解释型的面向对象的、跨平台的编程语言。良好的可靠性、清晰的语法和易用性，使
C语言中是如何定义常量的啊
C语言的常量有整数常量，实型常量，字符常量，符号常量等。1、整数常量整数常量是指直接实用的整形常数，又称整形常数或者整数，例如，1，-9等。整数常量可以是长整形、短整型、符号整型和无符号整型。a)八进制数八进制整数必须以0开头，即以0作为八
为什么qq空间源代码与爬取到的不一样
因为页面有些DOM是在js执行之后渲染出来的，你要在右键-页面源码这里看，才是浏览器拿到的页面源码。如果你要爬取的数据是js渲染得到的，那么有两种办法。一种是直接调用浏览器帮你执行js，拿到你希望拿到的数据。这个可以用selenium这个工
树莓派中设置Python虚拟开发环境
我们可以创建虚拟开发环境，避免开发时所使用的环境与本机环境发生冲突。首先，为开发环境创建一个子目录然后使用下面的命令创建虚拟环境目录：然后进入虚拟环境这是，我们可以升级虚拟环境中的pip: 升级完成后，查看一下pip的
python的for循环语句怎么写
python的for循环语句写法：while 判断条件(condition)；执行语句(statements)。执行语句可以是单个语句或语句块。判断条件可以是任何表达式，任何非零、或非空（null）的值均为true。当判断条件假 fal
Python GUI项目实战（二）主窗体的界面设计与实现
上一节我们介绍了登录窗体的GUI设计与功能实现，用户的账号和密码校验完成后应当跳转到主窗体内容，这一节我们将具体介绍主窗体界面的设计与功能实现！我们新建一个900x640的窗口，顶部加入图片，下面主体部分创建两个Panedwindow
python正则表达式是什么呢？
python正则表达式如下：在python中，所谓的“正则表达式”指的是通常被用来检索、替换那些符合某个模式的一段文本。具体而言，它的作用是检测某个字符串是否符合规则和提取网页字符串中想要的数据。正则表达式是对字符串提取的一套规则，我们
python中时间戳小数点后面位数的含义
time.time()获取的字串为linux时间戳表示从1970年1月1日起至当前的天数或秒数如1394521866.78表示，这个时间为获取时到1970年1月1日的秒数，也就是1394521866.78s小数点后嘛，当然就是看你精确到多少
程序化交易里面主流的语言是C++,python是趋势吗?主流的平台软件有...
语言只是工具，各有优势，用自己顺手的就行了，但对于通常的金融交易来讲，大部分语言效率都足够了，不明白为什么一直有这样的争论存在，对于程序而言，执行效率只是其中一个重要的方面，但不是全部，还要考虑开发效率，可维护性，程序健壮性等众多因素。
python中变量哪些加引号
python中变量的字符串中含有特殊符号,加单引号。忽略掉单引号内所有特殊字符,包括变量、$,,`和空格 myname='zhu jiasheng' 变量中本身带有单引号,用双引号。使用到变量,保留$和反引号``等的
谭浩强版C语言答案
C语言设计谭浩强第三版的课后习题答案（一)1．5请参照本章例题，编写一个C程序，输出以下信息： ************ Very Goodj! ************ 解： main() { printf(" ********
python调用微信内置浏览器
1、首先F12或者右键审查元素进入开发者模式，点击Emulation。2、其次点击Network，把Spoofuseragent改成Other，并把下面的带复制进去，有三句。3、然后回车然后刷新页面即可。Python由荷兰数学和计算机科学研
ubuntu如何升级python2.7
在ubuntu 的终端中用代码下载最新的Pythonsudo apt-get install python3系统会提示输入Linux 的密码，输入密码后下载刚才下载的Python程序被安装在usrlocallibpython3.5
C语言编写一个程序输出一个正方形
思路：输出正方形即输出正方形的外围就行，外围有个特点就是行列下标必有0或者是正方形的大小减一，输入一个n表示正方形大小，输出一个由*组成的正方形。参考代码：#include &ltstdio.h&gtint main()

推荐阅读

热门文章

最新发布

标签列表

python读取大文件处理时使用多线程

给您推荐相同类型的内容：