下面分享一个使用Python进行网站模拟登陆的小例子。
原理
使用Cookie技术,绕开网站登录验证。要使用到cookielib库。流程:
- 创建一个保存Cookie的容器,可选的有CookieJar,FileCookieJar,MozillaCookieJar,LWPCookieJar.其相互之间的关系是CookieJar —-派生—->FileCookieJar —-派生—–>MozillaCookieJar和LWPCookieJar.
- 然后创建一个处理Cookie的处理器handler.通过urllib2.HTTPCookieProcessor(cookie)即可
- 创建一个用于开启网站的opener。即可。这个opener相比于urllib2.urlopen方法更为普通一点而已。opener = urllib2.build_opener(handler)。
- 然后我们就可以正常的使用opener来访问网络了。
小案例
实现的功能是模拟登录到大连理工大学的教务网站。代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
# coding:UTF-8 import urllib,urllib2,cookielib filename = r 'F:\pachong\gaoqing\dlutcookie.txt' # show cookie and save to local cookie = cookielib.MozillaCookieJar() handler = urllib2.HTTPCookieProcessor(cookie) opener = urllib2.build_opener(handler) # 记得使用urllib模块进行参数的encode postdata = urllib.urlencode({ # 哈哈,本宫不给你们我的账号╭(╯^╰)╮ 'zjh' : 'xxxxxxxxx' , 'mm' : 'XXXXXX' }) # 登陆到教务系统的url url = 'http://zhjw.dlut.edu.cn/loginAction.do' # 开始进行模拟登陆,并把cookie保存到变量 response = opener. open (url,postdata) cookie.save(filename,ignore_discard = True ,ignore_expires = True ) # 打印一下获得的cookie信息吧 for item in cookie: item.name + ' = ' + item.value # 利用cookie访问另一个网址 登陆到个人成绩的URL course_url = 'http://zhjw.dlut.edu.cn/xkAction.do?actionType=6' course_header = { 'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586' , 'referer' : 'http://zhjw.dlut.edu.cn/menu/s_main.jsp' } result = opener. open (course_url) print result.read() |
运行结果
总结
其实对于模拟登陆而言,第一次的登陆就是为了获取那个cookie数据。然后通过我们创建的opener来完成接下来我们要进行的关键的进一步的操作。我们需要理解的就只是那个cookie的使用的流程就行了。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:http://blog.csdn.net/marksinoberg/article/details/51424150