本文研究的主要是python删除过期log文件的相关内容,具体介绍如下。
1. 用Python遍历目录
os.walk方法可以很方便的得到目录下的所有文件,会返回一个三元的tupple(dirpath, dirnames, filenames),其中,dirpath是代表目录的路径,dirnames是一个list,包含了dirpath下的所有子目录的名字,filenames是一个list,包含了非目录的文件,如果需要得到全路径,需要使用os.path.join(dirpath,name).例如test目录的结构为:
test------------file_c
|
-----------dir_a1/file_a1
| |
| -------dir_a2/file_a2
|
------------dir_b1/file_b1
那么使用如下代码:
1
2
3
4
|
import os for i in os.walk( 'test' ): print i |
结果为:
('test', ['dir_a1', 'dir_b1'], ['file_c1'])('test/dir_a1', ['dir_a2'], ['file_a1'])('test/dir_a1/dir_a2', [], ['file_a2'])('test/dir_b1', [], ['file_b1'])
要得到带路径的文件,则可以这样操作:
1
2
3
4
|
for i in os.walk( 'test' ): #print i for j in i[ 2 ]: os.path.join(i[ 0 ],j) |
结果为:
'test/file_c1'
'test/dir_a1/file_a1'
'test/dir_a1/dir_a2/file_a2'
'test/dir_b1/file_b1'
当然,也可以利用os.path.isdir判断来递归操作得到目录中的文件:
1
2
3
4
5
6
7
8
9
10
|
def walk( dir ): ret = [] dir = os.path.abspath( dir ) for file in [ file for file in os.listdir( dir ) if not file in [ "." , ".." ]]: nfile = os.path.join( dir , file ) if os.path.isdir(nfile): ret.extend( walk(nfile) ) else : ret.append( nfile ) return ret |
2. 排除需要保留文件
根据特定名称的文件以及文件更改时间来判断是否需要删除,os.path.getmtime(file)来得到文件最后改变的时间,当然除了诸如“XXX" in file的方法来判断文件名外,也可以采用正则表达式的方法。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
def shouldkeep( file ): if '.py' in file : return True elif '.conf' in file : return True elif 'current' in file : return True elif 'rtb' in file and datetime.datetime.fromtimestamp( os.path.getmtime( file ) ) > datetime.datetime.now() - datetime.timedelta( 3 ): return True # the log webdebug/popterr/webaccess/controller_slow/game/checking_social which are modified 6 day ago should be removed elif datetime.datetime.fromtimestamp( os.path.getmtime( file ) ) < \ datetime.datetime.now() - datetime.timedelta( 6 )\ and ( 'webdebug' in file \ or 'potperr' in file \ or 'webaccess' in file \ or 'controller_slow' in file \ or 'game.' in file \ or 'checkin_social' in file \ ): return False elif datetime.datetime.fromtimestamp( os.path.getmtime( file ) ) < \ datetime.datetime.now() - datetime.timedelta( 2 )\ and ( 'queue.master.info' in file ): return False elif datetime.datetime.fromtimestamp( os.path.getmtime( file ) ) > \ datetime.datetime.now() - datetime.timedelta( 6 ): return True else : return False |
1
2
3
4
5
|
files = walk( '/var/server/log' ) for i in files: if not shouldkeep(i): print i, datetime.datetime.fromtimestamp( os.path.getmtime(i) ) os.remove( i ) |
将该脚本用crontab定时每天执行一次,即可定期每天清理/var/server/log下的过期文件。
总结
以上就是本文关于python删除过期log文件操作实例解析的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!
原文链接:http://blog.csdn.net/y2701310012/article/details/41783045