下面一段代码给大家介绍python破解geetest 验证码功能,具体代码如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
|
from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.action_chains import ActionChains import PIL.Image as image import time,re, random import requests try : from StringIO import StringIO except ImportError: from io import StringIO #爬虫模拟的浏览器头部信息 agent = 'Mozilla/5.0 (Windows NT 5.1; rv:33.0) Gecko/20100101 Firefox/33.0' headers = { 'User-Agent' : agent } # 根据位置对图片进行合并还原 # filename:图片 # location_list:图片位置 #内部两个图片处理函数的介绍 #crop函数带的参数为(起始点的横坐标,起始点的纵坐标,宽度,高度) #paste函数的参数为(需要修改的图片,粘贴的起始点的横坐标,粘贴的起始点的纵坐标) def get_merge_image(filename,location_list): #打开图片文件 im = image. open (filename) #创建新的图片,大小为260*116 new_im = image.new( 'RGB' , ( 260 , 116 )) im_list_upper = [] im_list_down = [] # 拷贝图片 for location in location_list: #上面的图片 if location[ 'y' ] = = - 58 : im_list_upper.append(im.crop(( abs (location[ 'x' ]), 58 , abs (location[ 'x' ]) + 10 , 166 ))) #下面的图片 if location[ 'y' ] = = 0 : im_list_down.append(im.crop(( abs (location[ 'x' ]), 0 , abs (location[ 'x' ]) + 10 , 58 ))) new_im = image.new( 'RGB' , ( 260 , 116 )) x_offset = 0 #黏贴图片 for im in im_list_upper: new_im.paste(im, (x_offset, 0 )) x_offset + = im.size[ 0 ] x_offset = 0 for im in im_list_down: new_im.paste(im, (x_offset, 58 )) x_offset + = im.size[ 0 ] return new_im #下载并还原图片 # driver:webdriver # div:图片的div def get_image(driver,div): #找到图片所在的div background_images = driver.find_elements_by_xpath(div) location_list = [] imageurl = '' #图片是被CSS按照位移的方式打乱的,我们需要找出这些位移,为后续还原做好准备 for background_image in background_images: location = {} #在html里面解析出小图片的url地址,还有长高的数值 location[ 'x' ] = int (re.findall( "background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;" ,background_image.get_attribute( 'style' ))[ 0 ][ 1 ]) location[ 'y' ] = int (re.findall( "background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;" ,background_image.get_attribute( 'style' ))[ 0 ][ 2 ]) imageurl = re.findall( "background-image: url\(\"(.*)\"\); background-position: (.*)px (.*)px;" ,background_image.get_attribute( 'style' ))[ 0 ][ 0 ] location_list.append(location) #替换图片的后缀,获得图片的URL imageurl = imageurl.replace( "webp" , "jpg" ) #获得图片的名字 imageName = imageurl.split( '/' )[ - 1 ] #获得图片 session = requests.session() r = session.get(imageurl, headers = headers, verify = False ) #下载图片 with open (imageName, 'wb' ) as f: f.write(r.content) f.close() #重新合并还原图片 image = get_merge_image(imageName, location_list) return image #对比RGB值 def is_similar(image1,image2,x,y): pass #获取指定位置的RGB值 pixel1 = image1.getpixel((x,y)) pixel2 = image2.getpixel((x,y)) for i in range ( 0 , 3 ): # 如果相差超过50则就认为找到了缺口的位置 if abs (pixel1[i] - pixel2[i])> = 50 : return False return True #计算缺口的位置 def get_diff_location(image1,image2): i = 0 # 两张原始图的大小都是相同的260*116 # 那就通过两个for循环依次对比每个像素点的RGB值 # 如果相差超过50则就认为找到了缺口的位置 for i in range ( 0 , 260 ): for j in range ( 0 , 116 ): if is_similar(image1,image2,i,j) = = False : return i #根据缺口的位置模拟x轴移动的轨迹 def get_track(length): pass list = [] #间隔通过随机范围函数来获得,每次移动一步或者两步 x = random.randint( 1 , 3 ) #生成轨迹并保存到list内 while length - x> = 5 : list .append(x) length = length - x x = random.randint( 1 , 3 ) #最后五步都是一步步移动 for i in range (length): list .append( 1 ) return list #滑动验证码破解程序 def main(): #打开火狐浏览器 driver = webdriver.Firefox() #用火狐浏览器打开网页 driver.get( "http://www.geetest.com/exp_embed" ) #等待页面的上元素刷新出来 WebDriverWait(driver, 30 ).until( lambda the_driver: the_driver.find_element_by_xpath( "//div[@class='gt_slider_knob gt_show']" ).is_displayed()) WebDriverWait(driver, 30 ).until( lambda the_driver: the_driver.find_element_by_xpath( "//div[@class='gt_cut_bg gt_show']" ).is_displayed()) WebDriverWait(driver, 30 ).until( lambda the_driver: the_driver.find_element_by_xpath( "//div[@class='gt_cut_fullbg gt_show']" ).is_displayed()) #下载图片 image1 = get_image(driver, "//div[@class='gt_cut_bg gt_show']/div" ) image2 = get_image(driver, "//div[@class='gt_cut_fullbg gt_show']/div" ) #计算缺口位置 loc = get_diff_location(image1, image2) #生成x的移动轨迹点 track_list = get_track(loc) #找到滑动的圆球 element = driver.find_element_by_xpath( "//div[@class='gt_slider_knob gt_show']" ) location = element.location #获得滑动圆球的高度 y = location[ 'y' ] #鼠标点击元素并按住不放 print ( "第一步,点击元素" ) ActionChains(driver).click_and_hold(on_element = element).perform() time.sleep( 0.15 ) print ( "第二步,拖动元素" ) track_string = "" for track in track_list: #不能移动太快,否则会被认为是程序执行 track_string = track_string + "{%d,%d}," % (track, y - 445 ) #xoffset=track+22:这里的移动位置的值是相对于滑动圆球左上角的相对值,而轨迹变量里的是圆球的中心点,所以要加上圆球长度的一半。 #yoffset=y-445:这里也是一样的。不过要注意的是不同的浏览器渲染出来的结果是不一样的,要保证最终的计算后的值是22,也就是圆球高度的一半 ActionChains(driver).move_to_element_with_offset(to_element = element, xoffset = track + 22 , yoffset = y - 445 ).perform() #间隔时间也通过随机函数来获得,间隔不能太快,否则会被认为是程序执行 time.sleep(random.randint( 10 , 50 ) / 100 ) print (track_string) #xoffset=21,本质就是向后退一格。这里退了5格是因为圆球的位置和滑动条的左边缘有5格的距离 ActionChains(driver).move_to_element_with_offset(to_element = element, xoffset = 21 , yoffset = y - 445 ).perform() time.sleep( 0.1 ) ActionChains(driver).move_to_element_with_offset(to_element = element, xoffset = 21 , yoffset = y - 445 ).perform() time.sleep( 0.1 ) ActionChains(driver).move_to_element_with_offset(to_element = element, xoffset = 21 , yoffset = y - 445 ).perform() time.sleep( 0.1 ) ActionChains(driver).move_to_element_with_offset(to_element = element, xoffset = 21 , yoffset = y - 445 ).perform() time.sleep( 0.1 ) ActionChains(driver).move_to_element_with_offset(to_element = element, xoffset = 21 , yoffset = y - 445 ).perform() print ( "第三步,释放鼠标" ) #释放鼠标 ActionChains(driver).release(on_element = element).perform() time.sleep( 3 ) #点击验证 # submit = driver.find_element_by_xpath("//div[@class='gt_ajax_tip success']") # print(submit.location) # time.sleep(5) #关闭浏览器,为了演示方便,暂时注释掉. #driver.quit() #主函数入口 if __name__ = = '__main__' : pass main() |
总结
以上所述是小编给大家介绍的python3 破解 geetest(极验)的滑块验证码功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://www.cnblogs.com/kernel521/p/5870634.html