生成器和迭代器的区别
生成器(Generator)和迭代器(Iterator)是Python 中用于处理序列数据的两种机制。
迭代器
- 定义:迭代器是一个实现了
__iter__
和__next__
方法的对象。__iter__
返回迭代器对象本身,而__next__
则返回容器中的下一个值。 - 创建方式:通过实现上述两个方法来创建一个迭代器对象。
- 使用场景:适用于需要对数据集合进行遍历的情况,如列表、元组等。
- 内存占用:迭代器在访问元素时逐个生成,因此可以节省内存,特别是对于大的数据集。
示例:手动实现一个数字递增的迭代器
#! /usr/bin/env/python3
# -*- coding=utf-8 -*-
# @Author: jack
# @Date : 2025/06/13/15:25class MyIterator:def __init__(self, start=0, step=1):self.start = startself.step = stepdef __iter__(self):# 返回迭代器本身return selfdef __next__(self):if self.start >= 100: # 设置终止条件raise StopIterationvalue = self.startself.start += self.stepreturn valuemy_iter = MyIterator(start=10, step=5)
for num in my_iter:print(num)
生成器
- 定义:生成器是一种特殊的迭代器,它通过函数来创建,并且这个函数含有
yield
语句而不是return
。每次调用生成器的__next__()
方法时,它会从上次离开的地方继续执行,知道遇到下一个yield
语句。 - 创建方式:使用函数以及
yield
关键字来创建生成器。当函数执行到yield
时,会暂停并保存当前所有的运行信息,返回yield
的值,并在下一次调用时从该位置继续执行。 - 使用场景:特别适合用来简化创建复杂的迭代器的过程,尤其当你需要在遍历过程中动态产生数据的时候。
- 内存占用:与迭代器类似,生成器也是惰性求值,即只有在需要时才会计算值。
def my_generator():yield 1yield 2yield 3gen = my_generator()
for x in gen:print(x)
总结
- 迭代器适用于当你想要遍历现有集合而不必一次加载整个集合到内存中时。
- 生成器则更适用于你需要动态生成数据,特别是当这些数据集过大以至于无法全部放入内存中时。生成器通过惰性计算提供了一种更为高效的方式来处理大规模数据集,从而进一步降低了内存消耗。