selenium+python设置爬虫代理IP的方法_Python

1. 背景

在使用selenium浏览器渲染技术，爬取网站信息时，一般来说，速度是很慢的。而且一般需要用到这种技术爬取的网站，反爬技术都比较厉害，对IP的访问频率应该有相当的限制。所以，如果想提升selenium抓取数据的速度，可以从两个方面出发：

第一，提高抓取频率，出现验证信息时进行破解，一般是验证码或者用户登录。

第二，使用多线程 + 代理IP，这种方式，需要电脑有足够的内存和充足稳定的代理IP 。

2. 为chrome设置代理IP

				?

									from selenium import webdriver

									chromeOptions = webdriver.ChromeOptions()

									# 设置代理

									chromeOptions.add_argument("--proxy-server=http://202.20.16.82:10152")

									# 一定要注意，=两边不能有空格，不能是这样--proxy-server = http://202.20.16.82:10152

									browser = webdriver.Chrome(chrome_options = chromeOptions)

									# 查看本机ip，查看代理是否起作用

									browser.get("http://httpbin.org/ip")

									print(browser.page_source)

									# 退出，清除浏览器缓存

									browser.quit()