Hello大家好,正则表达式在Python当中的应用非常广泛,比如我们最熟悉的网页爬虫,我们在爬虫当中用的最多的就是正则表达式的匹配。今天我想和大家分享一下在Python中使用正则表达式去进行文本内容匹配的方法。
比如现在给定了我们一个字符串’a b c d e (f g) h i j k (l m n)’,现在我们想删除每一对括号里面的内容,只保留括号外的内容。那么我们就可以通过使用正则表达式去进行文章内容的匹配:
我们在导入 re 库的时候,我们还需要编写re正则表达式的规则,因为在上面介绍中我们说想去匹配括号内的内容并且将他们进行替换,那么我们的规则就可以写成:
re.findall(r"\(.*?\)",test_string)
其中.
表示匹配除换行符 \n 之外的任何单字符,*
表示零次或多次。那么上面这个问题的解法如下,大家如果有什么不懂的可以随时给我留言!
import re
test_string = 'a b c d e (f g) h i j k (l m n)'
remove = re.findall(r" \(.*?\)",test_string)
for r in remove:
test_string = test_string.replace(r,'')
print(test_string)
另外再给大家推荐三个网站,第一个是菜鸟的正则表达式的教学文档,还有正则表达式的调试工具以及可视化网站。
菜鸟的正则表达式的教学文档:
正则表达式的调试工具:
可视化网站:
今天的文章Python正则表达式(附正则表达式教程、调试工具、可视化工具)分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/25160.html