最近呢,公司让写一个组件,要求用正则表达式构建一个中文的匹配组件,许多问题就来了,大多是用自动机来构建一个正则表达式的引擎,小编虽然大学的时候学过编译原理,可奈何现在已经忘得差不多了,只能通过现有的正则表达式来进行功能实现。
下面的代码呢实现了通过用正则表达式来对某一个句子的添加、替换、删除三种操作,不知道这个适不适合大家的口味,反正小编已经做好让公司头批评的准备了,因此小编是在是现学不来呀。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
# -*- conding:utf-8 -*- import re txt = '这个池子的体积大约是34立方米容积' '' 'role为匹配规则,re_out为替换部分格式为“\1(替换部分)”' '' def Replace(role,re_out): out = re.compile(role) String_out = out.sub(re_out,txt) print(String_out) Replace(r '(这个池子的体积大约是34)(.*)' ,r '\1平方米' ) '' ' role为匹配规则,num为将要删除的元素(从1开始) '' ' def Delete(role,num): out = re.search(role,txt).group(num) string = txt. split (out) String_out = '' . join (string) print(String_out) Delete( '(这个池子的体积大约是34)(.*)(容积)' ,2) def Add(role,re_out): out = re.compile(role) String_out = out.sub(re_out,txt) print(String_out) Add(r '(这个池子的体积大约是34)(.{0})' ,r '\1的' ) |
下面的图片是小编运行这三个函数得到的结果,大家可以看看,如果有需要的可以参考一下,另外,小编需要人告诉我这个正则表达式如何用自动机来实现,他的原理是什么,欢迎大家的留言哦。
总结
以上所述是小编给大家介绍的正则表达式实现添加、删除、替换三种功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/qq_32113189/article/details/80969179