博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python 正则分析nginx日志
阅读量:7239 次
发布时间:2019-06-29

本文共 2728 字,大约阅读时间需要 9 分钟。

  有个需求要分析nginx日志,也懒得去研究logstach之类的开源工具,干脆直接写一个脚本,自己根据需求来实现:

先看日志格式:我们跟别人的不太一样,所以没办法了:

12.195.166.35 [10/May/2015:14:38:09 +0800] "list.xxxx.com" "GET /new/10:00/9.html?cat=0,0&sort=price_asc HTTP/1.0" 200 42164 "http://list.zhonghuasuan.com/new/10:00/8.html?cat=0,0&sort=price_asc" "Mozilla/5.0 (Linux; U; Android 4.4.2; zh-CN; H60-L02 Build/HDH60-L02) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 UCBrowser/10.4.0.558 U3/0.8.0 Mobile Safari/534.30"

上面是我的日志格式:

脚本如下:

#!/usr/bin/env python#-*- coding:utf-8 –*-#Author:xiaoluo#QQ:942729042#date:2015:05:12import reimport syslog = sys.argv[1]ip = r"?P
[\d.]*"date = r"?P
\d+"month = r"?P
\w+"year = r"?P
\d+"log_time = r"?P

这里要指出的是。我当初是给正则匹配的时候单独封装一个函数的,这样就省去了下面每个函数要打开之前都要单独打开一遍文件,但是我return的时候只能用列表的形式返回,结果列表太大把我的内存耗光了,我的是32G的内存,15G的日志。

效果:

最后一个函数是统计每分钟,访问的数量

转载地址:http://xbrfm.baihongyu.com/

你可能感兴趣的文章
web前端开发分享-目录
查看>>
rootkit后门之安装流程
查看>>
grunt 一个目录下所有的js文件压缩 配置收藏
查看>>
我对android davilk 虚拟机的理解
查看>>
关于Hadoop结合RDBMS应用的一些思考
查看>>
UVA 439 Knight Moves
查看>>
高端PCB设计相关知识整理
查看>>
Emmet快速开发
查看>>
iOS中使用自定义字体
查看>>
页面UI注意事项,你在乎吗?
查看>>
很全面的WinRAR实用技巧系列 - imsoft.cnblogs
查看>>
[家里蹲大学数学杂志]第265期武汉大学2013年高等代数考研试题参考解答
查看>>
CL.exe
查看>>
Cognos如何开启CJAP认证程序日志
查看>>
php教程之Smarty模板用法实例
查看>>
Eclipse下如何导入jar包
查看>>
数学图形(2.4)网球上的曲线
查看>>
Gumshoe - Microsoft Code Coverage Test Toolset
查看>>
javasE学习笔记:关键字super的使用
查看>>
Spark分析之Job Scheduling Process
查看>>