具体代码如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
#coding=utf8 from urllib import request import re import urllib,os url = 'http://tieba.baidu.com/p/3840085725' def get_image(url): #获取页面源码 page = urllib.request.urlopen(url) html = page.read() #解码,否则报错 html = html.decode( 'utf8' ) #正则匹配获取()的内容 reg = r 'src="(https.+?.[jpg,png])"' imge = re. compile (reg) # 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list imglist = imge.findall(html) return imglist def save_img(imglist): dir = os.path.join(os.path.dirname(__file__), 'img' ) i = 1 for img in imglist: #python3格式化字符串的另一种写法 imgpath = f '{dir}\\image{i}.jpg' try : #urlretrieve下载图片并保存到本地 urllib.request.urlretrieve(img,imgpath) i + = 1 print (u '图片开始下载' ) except Exception: print (f 'image:{img}下载失败' ) continue imglist = get_image(url) save_img(imglist) |
总结
以上所述是小编给大家介绍的python3 爬取图片的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/qq_35958094/article/details/83790686