1. __init__ 初始化文件路径,关键字1,关键字2;
2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式);
3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件)。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
|
#!/usr/bin/python3 # -*- coding: utf-8 -*- import re #文本所在路径,引号前加r指按路径处理 #关键字word1,word2,换关键字,需修改引号间的内容 class match2Words( object ): lines = 0 def __init__( self ,path,word1,word2): self .path = path self .word1 = word1 self .word2 = word2 def key_match( self ): with open ( self .path, 'rb' ) as f: buffer = f.read() pattern = re. compile ( self .word1 + b '(.*?)' + self .word2,re.S) result = pattern.findall( buffer ) if result ! = []: print (result) #self.lines +=1 #print("匹配到的行数:",self.lines) else : print ( "没有找到你输入的关键字" ) path = input ( "请输入要分析的log地址:" ) word1 = b "begin" word2 = b "end" matchWords = match2Words(path, word1, word2) matchWords.key_match() |
以上这篇python截取两个单词之间的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/qq_34500270/article/details/82899554