长篇大论Python生成器_Python

长篇大论Python生成器

ython生成器是什么

一句话解释：包含了yield关键字的函数就是生成器，它的返回值是一个生成器对象。我简单画了个示意图：

长篇大论Python生成器

yield相当于return。

函数遇到yield就暂停，保存当前信息，返回yield的值。

在下次执行next()时，从当前位置继续执行。

比较有意思的事情是，曾经有人建议生成器函数不应该使用def，而应该发明一个新的关键字比如gen，但是Python之父Guido并没有同意这样做。

生成器函数的工作原理

先通过一个简单示例来说明生成器的行为：

# 定义一个生成器
>>> def gen_123():
... yield 1
... yield 2
... yield 3
...
# 生成器本身是个函数
>>> gen_123
<function gen_123 at 0x0000019F60710790>
# 返回值是生成器对象
>>> gen_123()
at 0x0000019F606AC040>
# 生成器也是迭代器
>>> for i in gen_123():
... print(i)
...
1
2
3
# 验证生成器也是迭代器，定义迭代器g
>>> g = gen_123()
# 可以通过next()获取yield生成的下一个元素
>>> next(g)
1
>>> next(g)
2
>>> next(g)
3
>>> next(g)
Traceback (most recent call last):
File "", line 1, in
StopIteration

生成器的原理就是：

生成器函数会创建一个生成器对象。
把生成器传给next()函数时，生成器函数会执行函数定义体中的下一个yield语句，返回产出的值，并在当前位置暂停。
函数的定义体返回时，外层的生成器对象会抛出StopIteration异常

yield关键字一般是和for循环搭配使用的，在for循环中会隐式调用next()函数。

生成器的作用其实是解决内存的问题，比如我们都知道Python的正则表达式有一个re.findall()函数，它会把所有匹配到的元素都一次性写入内存中，假如匹配到的数据很多，就会占用大量的内存。为了解决这个问题，Python3有一个re.finditer()函数，返回的就是一个生成器，取值时才生成数据放入内存中，能节省大量内存。