python 里面一个常见的陷阱就是函数的默认参数问题。如下:
1
2
3
|
def func(mylist = []): mylist.append( 1 ) return mylist |
以下的执行结果如下:
1
2
3
4
5
|
print func() print func() print func() print func([ 'a' ]) print func() |
结果如下:
1
2
3
4
5
|
[ 1 ] [ 1 , 1 ] [ 1 , 1 , 1 ] [ 'a' , 1 ] [ 1 , 1 , 1 , 1 ] |
如此结果, 前面三个可以看出 如果没有指定参数的话, 每次调用函数时候, 调用的mylist 是同一个对象。这是因为函数的默认参数,是在代码编译成PyCodeObject的时候, 就已经创建了对象指针,并且存在该函数的func_default内。 以后在代码运行,调用函数的时候,如果没有指定参数的话, 每次调用的话, 该参数变量都是代码编译阶段的变量指针所指定的对象。
1
|
print func.func_default |
此时结果就是:
([1, 1, 1, 1], )
默认参数分为两种情况:
默认参数值是不可变对象
此时函数的 func_default 一直指向该不变对象, 如果函数内部修改了该变量, 那么该默认参数会指向一个新的不可变对象.
不过func_default 不变。 而每次调用函数都是读取func_default, 因此每次执行都一样。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
In [ 30 ]: def func2(var = 1 ): ....: var + = 1 ....: return var ....: In [ 31 ]: func2() Out[ 31 ]: 2 In [ 32 ]: func2() Out[ 32 ]: 2 In [ 34 ]: func2.func_defaults Out[ 34 ]: ( 1 ,) |
默认参数是可变对象,比如 list, dict, class等
这种情况下,如果在函数内修改了指针所指的对象(并未创建新的对象), 那么 func_default 就会改变。这正是开始的mylist发生变化的原因。看下面的例子,:
1
2
3
4
5
6
7
8
9
10
|
In [ 35 ]: def func(mylist = []): ....: mylist = [] #这里 创建了新的对象, mylist.append( 1 ) return mylist In [ 44 ]: func() Out[ 44 ]: [ 1 ] In [ 45 ]: func.func_defaults Out[ 45 ]: ([],) |
由于创建了对象, mylist 只是作为一个 新建对象的别名存在, 后面在修改已经与 func_default 无关了。
默认参数的一个应用
先看下面的一个经典的例子:
1
2
3
4
5
6
7
8
9
|
def outer(): res = [] for i in range ( 4 ): def inner(j): return j * i res.append(inner) return res print [m( 2 ) for m in outer()] |
#简略版本:
1
2
3
|
def multipliers(): return [ lambda x : i * x for i in range ( 4 )] print [m( 2 ) for m in multipliers()] |
结果是 [6, 6, 6, 6] , 而不是 [0, 2, 4, 6], 原因就是闭包的延迟绑定。另外函数绑定的是变量而不是绑定数值。当循环结束了,i的值已经是3, 此时结果都是6. 一个解决方法便是,使用默认参数绑定数值。如下改动:
1
2
3
4
5
6
7
8
9
|
def outer(): res = [] for i in range ( 4 ): def inner(j, i = i): return j * i res.append(inner) return res print [m( 2 ) for m in outer()] |
#简略版本:
1
2
3
|
def multipliers(): return [ lambda x, i = i : i * x for i in range ( 4 )] print [m( 2 ) for m in multipliers()] |
这样的话, 利用默认参数在代码编译的时候,便把参数写到函数的func_default中, 就可以绑定0,1,2,3了。结果自然就是
[0, 2, 4, 6]
这就是默认参数的一个应用。
上述还有一个生成器修改的方式
1
2
3
|
def multipliers(): return ( lambda x, i = i : i * x for i in range ( 4 )) #修改成生成器 print [m( 2 ) for m in multipliers()] |