Python自动化爬取天眼查数据的实现_Python

首先要注册一个账号密码，通过账号密码登录，并且滑块验证，自动输入搜索关键词，进行跳转翻页爬取数据，并保存到Excel文件中。

代码运行时，滑块验证经常不通过，被吃掉，但是发现打包成exe运行没有这个问题，100%成功登录。如果大家知道这个问题麻烦请与我分享，谢谢！

Python自动化爬取天眼查数据的实现

废话不多说直接上代码

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

									# coding=utf-8

									from selenium import webdriver

									import time

									from PIL import Image, ImageGrab

									from io import BytesIO

									from selenium.webdriver.common.action_chains import ActionChains

									import os

									import sys

									import re

									import xlwt

									import urllib

									import datetime

									'''

									用于天眼查自动登录，解决滑块验证问题

									'''

									# 获取项目根目录

									def app_path():

									    if hasattr(sys, 'frozen'):

									        return os.path.dirname(os.path.dirname(os.path.dirname(sys.executable))) #使用pyinstaller打包后的exe目录

									    return os.path.dirname(__file__)

									app_path = app_path()

									ready_list = []

									#设置表格样式

									def set_style(name,height,bold=False):

									    style = xlwt.XFStyle()

									    font = xlwt.Font()

									    font.name = name

									    # font.bold = bold

									    font.color_index = 4

									    font.height = height

									    style.font = font

									    return style

									# 写excel

									f = xlwt.Workbook()

									sheet1 = f.add_sheet('企查查数据',cell_overwrite_ok=True)

									row0 = ["企业名称","法定代表人","注册资本","成立日期","电话","邮箱","地址"]

									for i in range(0, len(row0)):

									    sheet1.write(0, i, row0[i], set_style('Times New Roman', 220, True))

									# 写列

									def write_col(data, row, col):

									    for i in range(0,len(data)):

									        sheet1.write(row,col,data[i],set_style('Times New Roman',220,True))

									        row = row + 1

									def parse_save_data(all_list):

									    row = 1

									    for data in all_list:

									        # 公司名称

									        name_list = re.findall(r'<div class="info">(.*?)</div>',data)

									        print(name_list)

									        # 标签

									        tag_list = re.findall(r'<div class="tag-list">(.*)</div><div class="info row text-ellipsis">', data)

									        tags = []

									        for list in tag_list:

									            tag = re.findall(r'<div class="tag-common -primary -new">(.*?)</div>', list)

									            tags.append(tag)

									        # print(tags)

									        # 法定代表人

									        legal_list = re.findall(r'<a id="codetool">



	打包成exe（注意site-packages要换成自己python包的目录）

	
		
			
				?
			
				
					
						
							
								1
						
						
							
								
									pyinstaller main.py -p D:\Anaconda3\Lib\site-packages
							
						
					
				
			
		
	
	
		
			
	


	最终运行dist目录下的exe

	

	注意事项

	由于天眼查没有开会员只能查看到4页内容，所以需要开会员，这个想要绕过就需要另外去研究，毕竟是要充钱付费，破解也没那么简单

	到此这篇关于Python自动化爬取天眼查数据的文章就介绍到这了,更多相关Python自动化爬取天眼查数据内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

	原文链接：https://blog.csdn.net/qq_36767214/article/details/117843296
标签：自动化 Python 天眼查 爬取 
相关文章
六个实用的 Python 自动化脚本，你学会了吗？2021-11-30
浅谈Python响应式类库RxPy2021-11-30
Python scrapy爬取起点中文网小说榜单2021-11-30
教你用Python爬取英雄联盟皮肤原画2021-11-30
python基础入门之普通操作与函数（三）2021-11-30
python基础入门之字典和集合2021-11-30
热门资讯
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
背刺什么意思 网络词语背刺是什么梗 2020-05-22
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全 2019-12-26
2021年耽改剧名单 2021要播出的59部耽改剧列表 2021-03-05
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13
返回顶部
首页 l 电脑版 l 网站标签 l 网站地图