在python2中字节类型同字符类型区分不大,但是在python3中最重要的特性是对文本和二进制数据做了更加清晰的区分,文本总是Unicode,由字符类型表示,而二进制数据则由byte类型表示,python3不会以任意隐式方式混用字节型和字符型,也因此在python3中不能拼接字符串和字节包(python2中可以,会自动进行转换),也不能在字节包中搜索字符串,也不能将字符串传入参数为字节包的函数。
需要注意的是,在网络数据传输过程中,python2可以通过字符串(string)方式传输,但是python3只能通过二进制(bytes)方式来传输,因此要对传输文本进行转换。
例如下面的例子:
1
2
3
4
5
6
7
8
9
10
|
>>> '你好' .encode( 'utf-8' ) b '\xe4\xbd\xa0\xe5\xa5\xbd' >>> b '\xe4\xbd\xa0\xe5\xa5\xbd' .decode( 'utf-8' ) '你好' >>> '你好' .encode( 'utf-8' ).decode( 'utf-8' ) '你好' |
其中
1.encode()和decode()方法中默认了编码为utf-8,但是为了避免错误,最好将编码加上。
2.encode()出来的结果的“b”代表二进制(binary)
以上这篇对python3新增的byte类型详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/Emma__Wang/article/details/79183679