分组匹配的模式,可以通过groups()来全部访问匹配的元组,也可以通过group()函数来按分组方式来访问,但是这里只能通过数字索引来访问,如果某一天产品经理需要修改需求,让你在它们之中添加一个分组,这样一来,就会导致匹配的数组的索引的变化,作为开发人员的你,必须得一行一行代码地修改。因此聪明的开发人员又想到一个好方法,把这些分组进行命名,只需要对名称进行访问分组,不通过索引来访问了,就可以避免这个问题。那么怎么样来命名呢?可以采用(?P<name>pattern)的格式来命名。
例子如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
#python 3.6 #蔡军生 #http://blog.csdn.net/caimouse/article/details/51749579 # import re text = 'This is some text -- with punctuation.' print (text) print () patterns = [ r '^(?P<first_word>\w+)' , r '(?P<last_word>\w+)\S*$' , r '(?P<t_word>\bt\w+)\W+(?P<other_word>\w+)' , r '(?P<ends_with_t>\w+t)\b' , ] for pattern in patterns: regex = re. compile (pattern) match = regex.search(text) print ( "'{}'" . format (pattern)) print ( ' ' , match.groups()) print ( ' ' , match.groupdict()) print () |
结果输出如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
This is some text - - with punctuation. '^(?P<first_word>\w+)' ( 'This' ,) { 'first_word' : 'This' } '(?P<last_word>\w+)\S*$' ( 'punctuation' ,) { 'last_word' : 'punctuation' } '(?P<t_word>\bt\w+)\W+(?P<other_word>\w+)' ( 'text' , 'with' ) { 't_word' : 'text' , 'other_word' : 'with' } '(?P<ends_with_t>\w+t)\b' ( 'text' ,) { 'ends_with_t' : 'text' } |
如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
原文链接:http://blog.csdn.net/caimouse/article/details/78320823