使用Python解析nginx日志文件

2023-02-23 08:25:01Python012

使用Python解析nginx日志文件,第1张

本文使用Python2.7解析nginx日志文件，并把nginx的时间转化为时间戳（1970纪元后经过的浮点秒数），并存放到特定文件中。

Nginx的http日志格式：

示例如下：

这里使用Python的glob模块来获取所有日志文件。日志文件每天0时进行备份，命名为nginx.log.YYMMDD。

模块linecache允许从任何文件里得到任何的行，并且使用缓存进行优化，常见的情况是从单个文件读取多行。

使用python的re模块解析每一条日志。

其中body_bytes捕获非空字符串，而不是数字，因为日志里可能存在该字段值为“-”，即没有请求体。

date、method、request等参数可以采用以下方式进行提取。

使用python的time模块把时间转为时间戳。

产生文件time.log，内容如下：

可以使用beautifulsoup解析，或者自己使用正则表达式：(import re)

首先获取所有的tr标签内的内容

tr_tags = re.findall(r"<tr>(?P[\w\W]*?)</tr>", jsp_html_content)

对于每个tr内的标签内容：

for tag in tr_tags:

first_str = re.findall(r"title=\"(?P[\w\W]*?)\"", tag)[0]

second_str = re.findall(r"encode(\"(?P[\w\W]*?)\"", tag)[0]

third_str = re.findall(r"%>\">(?P[\w\W]*?)</a>", tag)[0]

此时first_str, second_str, third_str 就对应于【文件中所有的 "文件11", "/file/1文件11.pdf", "文件11" 这三个信息"】

文件日志模块时间有的

# 上一篇：c语言round 函数怎么用？？

# 下一篇：java启用另外一个线程设置无超时状态

给您推荐相同类型的内容：

go语言现在很重要么？？
Go作为Google2009年推出的语言，其被设计成一门应用于搭载 Web 服务器，存储集群或类似用途的巨型中央服务器的系统编程语言。对于高性能分布式系统领域而言，Go 语言无疑比大多数其它语言有着更高的开发效率。它提供了海量并行的支
学习C语言的网站
VC知识库提供Visual C++程序源代码、编程文摘、及其它VC资料，还有论坛交流。唯C世界主要包括C语言教室、C数据结构、软件下载、技术论坛等，这里的论坛不错的。VC大本营VC爱好者制作的网站，规划还是挺系统的，内容也不错。C语言之家提
java in int 类型什么意思
AIDL是 Android Interface definition language的缩写，一看就明白，它是一种android内部进程通信接口的描述语言，通过它我们可以定义进程间的通信接口。通常我们在定义aidl文件里面的方法的时候，很
C语言二级电子版证书在哪里
教育部考试中心可查看。全国计算机等级合格者，由教育部考试中心颁发合格证书。考后 45 个工作日教育部考试中心将证书发给各省级承办机构，然后由各省级承办机构逐级转发给考生。《C程序设计语言（第2版·新版）》（[美] Brian W. Kern
博美BOO市场价多少?
博美，各个地方价格不一样，还要分纯种，如果是白色球形的话，在1000元左右，如果不太纯，长腿的都在500到800左右！但是博美特别娇气，三个月之下的狗狗特别难养活，劝你最好别养满月的，养三个月左右的生存率比较高！因为是人为故障，苹果不保修，
R语言-17决策树
是一个预测模型，分为回归决策树和分类决策树，根据已知样本训练出一个树模型，从而根据该模型对新样本因变量进行预测，得到预测值或预测的分类从根节点到叶节点的一条路径就对应着一条规则．整棵决策树就对应着一组表达式规则。叶节点就代表该规则下
什么是java,蓝牙,SMS,EMS,MMS短信息?
EMS又称增强型短信，除了发送普通文字信息以外还可以发送简单的图片，声音等。MMS为多媒体短信，和EMS差不多。SMS就是文字短信。蓝牙:短距离无线传播，简单说就是你的手机有蓝牙，我的手机也有蓝牙，咱们俩个就可以通过蓝牙，传些图片和音乐等。
如何用C语言编写一个显示时间的函数，要求时间显示精度到毫秒级别。
#include &ltcstdio&gt#include &ltctime&gtusing namespace std* run this program using the console paus
python怎么在天气数据中筛选最高气温大于10度的日期
python在天气数据中筛选最高气温大于10度的日期步骤如下。1、在命令行中直接使用pip进行模块安装。2、利用select语句找到网页中天气数据所在的div即可。前面的回答也足够简明了。首先，找出出问题的代码行数。其次，找出出问题的变
Go语言在国内比在国外火的原因是什么
文章是这么说的it seems like Google technologies are popular in China for no reason other than that they were made by Google.不过说
idear和idea的区别
词性不同，含义不同，读音不同。Idear可作形容词，是“理想的”的意思；idea是名词。Idear虽然也能当名词使用，意思也是idea的意思，但是，一般都用它作形容词。idea的用法 idea的基本意思是“想法，主意”
c语言编写一个标准身高体重自测程序
#include &ltstdio.h&gtint main(){ double bmi, w, h printf("请输入你的体重（kg）: ") scanf("%lf&qu
ruby copy 文件
今天下载了spring3.2.0的新版本，打开libs目录后，发现除了要正常使用的jar之外，还有好多javadoc和sources的jar文件，想把正常使用的Jar拷贝出来，但一个个选又太麻烦，就想着反正最近在学ruby，干脆用ruby
R语言图片出不来
你是不是关闭了图像显示？比如是不是用过Dev.off语句呢？如果有的话，你可以输入Dev.new，重新打开新图像之后，再试一下你的代码，看看是不是能显示图像呢。我也是刚刚开始学，就只想到了这一点，因为我之前就是遇到了同样的问题。画上三角矩阵
二战各国钢盔型号，最好能带图
1、M35头盔（德国）颜色为黑色，盔檐很明显，盔型弧线比较浅。形状与星球大战中的黑武士的头盔类似。德国的陆军部队在二战期间普遍性的装备此头盔。中国的抗战初期，国民党军主力曾经大量装备此头盔。2、美国M1钢盔（美国）颜色为深绿色，盔檐明显
林欣如资料.
[基本资料]原名：林心如昵称：Ruby 英文名：Ruby 生日：127 生肖：龙星座：水瓶座血型：B型身高：167公分体重：46公斤学历：高中小学：日新国小初中：静修女中高中：中兴高中出生地：台北现居地：台北通晓语
你为什么放弃golang?
因为内存管理粗糙。经常看到fmt.xxx导致内存占用太多，反射导致内存占用太多的抱怨。go语言适合写服务器组件，那种和业务数据无关的服务器。比如数据库服务器、web服务器、日志搜索引擎等。如果用来写一个crm管理系统，非常累，因为缺乏好多
ruby英文名是什么意思？
RUBY（鲁比）寓意着爱情、仁爱。本意为红宝石（爱情的象征）例句：Ruby had come downstairs one morning and said Daddy，I am taking you to Disneyland bef
Python中的模块
import osprint(os.name) # 操作系统名称 Windows nt 非Windows posix print(os.sep) # 路径分隔符 Windows 其他import
java零基础自学教程免费？
现在网上的教学视频资源非常多的。网络时代，电子化的资源极大的便利了我们的学习，打破了信息壁垒。适合零基础的java免费自学教程，这里我推荐大家可以了解一下千锋的java入门基础教程，他们家的这套视频教程还是相对比较全面的，视频+߅笔记+资料
深入剖析：一套在 Go 中传递、返回、暴露错误，便于回查的解决方案
作者：andruzhang，腾讯 IEG 后台开发工程师在后台开发中，针对错误处理，有三个维度的问题需要解决：一个面向过程的函数，在不同的处理过程中需要 handle 不同的错误信息；一个面向对象的函数，针对一个操作
有一首歌开始打了一声雷然后下雨之后就是一段萨克斯音乐后面就是舞曲，请问谁知道是什么歌
专辑：红苹果乐园电视原声专辑艺人：红苹果乐园公司：水晶音乐网语言：国语发行：2003-4-251. 幸福的序曲2. 红苹果乐园有一天你突然出现像一阵风轻轻吹来有一天我突然感觉生活有一点微妙的色彩曾经有过拒绝好像心不在焉可是我的心总在跳总想起
python爬虫如何分析一个将要爬取的网站？
首先，你去爬取一个网站，你会清楚这个网站是属于什么类型的网站（新闻，论坛，贴吧等等）。你会清楚你需要哪部分的数据。你需要去想需要的数据你将如何编写表达式去解析。你会碰到各种反爬措施，无非就是各种百度各种解决。当爬取成本高于数据成本，
c语言32个关键字详解
C语言32关键字如下：auto：声明自动变量；break：跳出当前循环；case：开关语句分支；char：声明字符型变量或函数返回值类型；const：声明只读变量；continue：结束当前循环，开始下一轮循环；default：开关语句中
Java中有哪些锁，区别是什么
【1】公平所和非公平所。公平锁：是指按照申请锁的顺序来获取锁，非公平所：线程获取锁的顺序不一定按照申请锁的顺序来的。默认是不公平锁，传入true为公平锁，否则为非公平锁ReentrantLock reentrantLock =n
python的内建函数和库函数的区别是什么？
【区别】：标准库函数都需要import xxx才能取得。内建函数都在__builtins__里面，在global里直接就能用。【补充】：1.python中，我们可以通过对内建的比较函数进行自定义，来实现运算符重载。我们常用的比较运算符有大
如何使用JAVA实现对字符串的DES加密和解密
java加密字符串可以使用des加密算法，实例如下：package testimport java.io.FileInputStreamimport java.io.FileOutputStreamimport java.io.IOExce
java安装失败是怎么回事？
java 安装失败很多情况下，我们重装java都会遇到安装失败的情况。下面一起来看看如何解决吧。安装失败原因：上次安装的版本没有卸载干净，导致无法正确安装。操作系统和安装版本不匹配，导致无法安装。解决方法：1. win+r--输
如何使用JAVA实现对字符串的DES加密和解密
java加密字符串可以使用des加密算法，实例如下：package testimport java.io.FileInputStreamimport java.io.FileOutputStreamimport java.io.IOExce
lattice在r语言中表示什么意思
因为R对matrix的运算比data.frame更高效。回到data.table这个包的话题，data.table是做什么的？data.table可以说是提供data.frame的替代品，更高效，速度可以说是飞快。2016-08-23 05

推荐阅读

热门文章

最新发布

标签列表

使用Python解析nginx日志文件

给您推荐相同类型的内容：