本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下:
1
2
3
4
5
6
7
8
9
10
|
import re import urllib url = "https://www.zzvips.com" s = urllib.urlopen(url).read() ss = s.replace( " " ,"") urls = re.findall(r "<a.*?href=.*?<\/a>" ,ss,re.I) for i in urls: print i else : print 'this is over' |
希望本文所述对大家的Python程序设计有所帮助。