本文实例讲述了Python hashlib模块用法。分享给大家供大家参考,具体如下:
一、hashlib基本使用
python中的hashlib模块用来进行hash或者md5加密,而且这种加密是不可逆的,所以这种算法又被称为摘要算法。其支持Openssl库提供的所有算法,包括md5、sha1、sha224、sha256、sha512等。
常用的属性和方法:
algorithms:列出所有加密算法('md5','sha1','sha224','sha256','sha384','sha512')
digesti_size:产生的散列的字节大小
md5()/sha1():创建一个md5或者sha1加密模式的hash对象
update(arg):用字符串参数来更新hash对象,如果同一个has对象重复调用该方法,如下:m.update(a); m.update(b),则等于m.update(a+b)
digest():返回摘要,作为二进制数据字符串值
hexdigest():返回摘要,作为十六进制数据字符串值
copy():复制
下面是一个简单的加密示例:
1
2
3
4
5
|
import hashlib m = hashlib.md5() m.update( 'how to use md5' .encode( 'utf-8' )) m.update( 'in python hashlib' .encode( 'utf-8' )) print m.hexdigest() |
返回值如下:
9f97604918a2e86bfcc4aea5c35a4c8b
下面一个示例用于计算文件md5值:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
#!/usr/bin/env python #coding: utf-8 import hashlib import sys def main(): if len (sys.argv) ! = 2 : sys.exit( 'Usage: %s file' % sys.argv[ 0 ]) filename = sys.argv[ 1 ] m = hashlib.md5() with open (filename, 'rb' ) as fp: while True : blk = fp.read( 4096 ) # 每次读取4kb if not blk: break m.update(blk) print m.hexdigest(), filename if __name__ = = '__main__' : main() |
二、hashlib的应用场景
摘要算法通常应用于网站存储用户的帐号密码相关信息。默认情况下,我们插入到数据库的帐号密码都是以明文保存。这样的话,一旦数据库泄露,所有用户的口令都会直接泄露,而且明文保存,网站管理员也可以直接查看到用户口令,这样及不安全。所以我们可以在获取到用户输入的密码以后,直接对其进行加密处理。然后将加密的字符串存入数据库。这样当下次用户登录时,再对用户输入的密码进行加密处理,然后与数据库中存储的加密字串进行比对,如果匹配,则说明密码正确。
当然上述方法比明文存储密码确实要安全不少。但在有些场景中,用户通常会将密码设置的尤为简单。这样如果数据库泄露,黑客可以通过简单的密码尝试来完成对加密字串的匹配。为了解决这种方法,我们通常需要对密码做“加盐”处理。如下:
1
2
3
4
5
6
7
8
9
10
|
def get_md5(password): m = hashlib.md5() m.update(password) return m.hexdigest() def calc_md5(password): return get_md5(password + 'the-Salt' ) db = {} def register(username,password): db[username] = username db[password] = calc_md5(password) |
这样,只要'the-Salt'部分不被泄露,就没办法反推用户的简单密码。
但是这样仍然有个问题,那就是多个用户的密码可能重复,这样,在数据库里就会出现相同的加密字串。我们知道通常而言,用户的用户名肯定不会相同。我们再假设用户的用户名不会改变。我们可以使用用户的用户名来做加盐处理,如下:
1
2
|
def clc_md5(username,password): return get_md5(passwd + username + 'the-Salt' ) |
希望本文所述对大家Python程序设计有所帮助。
原文链接:https://www.cnblogs.com/breezey/p/6664733.html