服务器之家 > 正文

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

时间：2021-06-18 00:42 来源/作者：北京-宏哥

简介

有些 post 的请求参数是 json 格式的，这个前面发送post 请求里面提到过，需要导入 json模块处理。现在企业公司一般常见的接口因为json数据容易处理，所以绝大多数返回数据也是 json 格式的，我们在做判断时候，往往只需要提取其中

几个关键的参数就行，这时候我们就需要 json 来解析返回的数据了。首先来说一下笔者为何要单独写这么一篇，原因是：python 里面 bool 值是 true 和 false,json 里面 bool 值是 true和 false,并且区分大小写，这就尴尬了，明明都是 bool 值。

在python里面写的代码，传到json里，不用说肯定识别不了，所以需要把python的代码经过encode后成为 json 可识别的数据类型，反之json数据就需要decode后成为python代码可识别的数据类型。这个也是需要初学者注意，也算是个细微差和

一个坑人的地方吧，如果不注意很容易掉坑里啊。笔者就掉进去过，还好自救能力强，爬出来了，所以为了警醒后来者，就有了这篇随笔。

json 模块简介

1、json 简介：json，全名 javascript object notation,json(javascript object notation(记号、标记))是一种轻量级的数据交换格式。它基于javascript（standard ecma-262 3rd edition - december 1999）的一个子集。json采用完全独立

于语言的文本格式，但是也使用了类似于c语言家族的习惯（包括c, c++, c#, java, javascript, perl, python等）。这些特性使json成为理想的数据交换语言。json易于人阅读和编写，同时也易于机器解析和生成。常用于 http 请求中，接口

返回的数据中。

2、可以用 help(json),查看对应的源码注释内容

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

编码encode（python->json）

1、为什么要 encode，笔者在开头就给各位小伙伴开门见山的说出来了，让各位带着问题来探索、来学习、来思考

2、举个简单例子，下图的实例中 dict 类型经过 json.dumps（）后变成 str，true 变成了 true,false变成了 fasle

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

3、从json模块的对应源码中可以查看到，python 数据转化成 json可识别的数据，对应的表关系如下

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

解码 decode(json->python)

1、以博客园的登录成功结果：{"success":true}为例，我们其实最想知道的是 success 这个字段返回的是 true 还是 false，以便于我们对接口进行断言，以下是fiddler抓包博客园登录成功的结果

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

2、如果以 content 字节输出，返回的是一个字符串：{"success":true}，这样获取后面那个结果就不方便了，导致断言也不方便

3、如果经过 json 解码后，返回的就是一个字典：{u'success': true}，这样获取后面那个结果，就用字典的方式去取值：result2["success"]，这样不言而喻断言也就简单方便了

4、由于博客园的登录机制的改变，我们这里接着上一篇的删除随笔的返回结果，给小伙伴们实战演练一下

5、用fiddler抓包，抓到删除新建随笔的请求，从抓包结果可以看出，返回结果是一个字符串：{"issuccess":true}，按照上边的步骤用代码实现

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

6、代码及结果（看到了吧，就是这么轻松被我们取到其value了，接下来就可以进行断言了）

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

7、从json模块的对应源码中可以查看到， json 数据转化成 python 可识别的数据，对应的表关系如下

python接口自动化（十七）--Json 数据处理---一次爬坑记（详解）

8、参考代码

				?

									# coding:utf-8

									import requests

									# 先打开登录首页，获取部分cookie

									url = "https://passport.cnblogs.com/user/signin"

									headers = {

									      "user-agent": "mozilla/5.0 (windows nt 10.0; wow64; rv:44.0) gecko/20100101 firefox/44.0"

									      } # get方法其它加个ser-agent就可以了

									s = requests.session()

									r = s.get(url, headers=headers,verify=false)

									print (s.cookies)

									# 添加登录需要的两个cookie

									c = requests.cookies.requestscookiejar()

									c.set('.cnblogscookie', 'xxx') # 填上面抓包内容

									c.set('.cnblogs.aspnetcore.cookies','xxx') # 填上面抓包内容

									c.set('alwayscreateitemsasactive',"true")

									c.set('admincookiealwaysexpandadvanced',"true")

									s.cookies.update(c)

									print (s.cookies)

									result = r.content

									print(result.decode('utf-8'))

									# 登录成功后保存编辑内容

									url2= "https://i.cnblogs.com/editposts.aspx?opt=1"

									body = {"__viewstate": "",

									    "__viewstategenerator":"fe27d343",

									    "editor$edit$txbtitle":"这是绕过登录的标题：北京-宏哥",

									    "editor$edit$editorbody":"<p>这里是中文内容：http://www.cnblogs.com/duhong/</p>",

									    "editor$edit$advanced$ckbpublished":"on",

									    "editor$edit$advanced$chkdisplayhomepage":"on",

									    "editor$edit$advanced$chkcomments":"on",

									    "editor$edit$advanced$chkmainsyndication":"on",

									    "editor$edit$lkbdraft":"存为草稿",

									     }

									r2 = s.post(url2, data=body, verify=false)

									print (r.content.decode('utf-8'))

									# 第三步：正则提取需要的参数值

									import re

									postid = re.findall(r"postid=(.+?)&", r2.url)

									print(type(postid))

									print (postid) # 这里是 list

									# 提取为字符串

									print (postid[0])

									# 第四步：删除草稿箱

									url3 = "https://i.cnblogs.com/post/delete"

									json3 = {"postid": postid[0]}

									r3 = s.post(url3, json=json3, verify=false)

									result = r3.content #content数据是字节输出

									print(type(result))

									print(result)

									#json是经过加码encode成对应python的数据类型

									result1 = r3.json()

									print (type(result1))

									print(result1['issuccess'])

小结

在实际工作中遇到问题要学会查资料，看其对应的官方文档以及源码，不仅可以起到事半功倍的作用，也可以锻炼自己解决问题的能力。这一点笔者深有体会！！！

以上所述是小编给大家介绍的python json 数据处理详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持！

原文链接：https://www.cnblogs.com/du-hong/p/10688197.html

标签：

Python JSON 数据处理

相关文章

热门资讯

: 2020微信伤感网名听哭了让对方看到心疼的伤感网名大全 2019-12-26

: yue是什么意思网络流行语yue了是什么梗 2020-10-11

: 背刺什么意思网络词语背刺是什么梗 2020-05-22

: 苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13

: 2021德云社封箱演出完整版 2021年德云社封箱演出在线看 2021-03-15