Python迭代器
渴望力量的哈士奇 人气:0什么是迭代器
迭代是 python 中访问集合元素的一种非常强大的一种方式。迭代器是一个可以记住遍历位置的对象,因此不会像列表那样一次性全部生成,而是可以等到用的时候才生成,因此节省了大量的内存资源。迭代器对象从集合中的第一个元素开始访问,直到所有的元素被访问完。迭代器有两个方法:iter()和 next()方法。
这么解释可能不太直观,我们以生活的一个小栗子来解释一下,方便大家能够更深刻的理解。比如说我们去超市买水果,而正巧超市的服务人员正在摆放苹果。服务人员告诉我们需要等苹果都摆放完毕我们才可以拿苹果,这样就很耽误我们的时间。(这个场景中,柜台上其实已经有苹果了,只不过销售不让拿罢了。)
然后我们再去卖橘子的柜台,服务人员也在摆放橘子。但是服务人员告诉我们可以不用等他摆放完毕,我们可以直接拿橘子,这样就会很好的节省我们的时间。如果我们拿橘子的速度超过了服务人员摆放的速度 ,我们只需要等待服务人员摆放之后就可以直接拿橘子,大大的提升了我们买橘子的效率。
而迭代器就类似于我们买橘子的场景,我们平时的程序都是一次性写入到内存中。比如我们的列表中存在成百上千的数据,都是一次性写入到内存里的,通过这样让我们来使用。但是迭代器却是按需加载,有一点内容就会放在内容里面,我们就可以立刻使用内存中的数据进行我们的逻辑处理。这样就不要所有的数据都写入到内存中就可以使用,大大的提升了使用效率。
如何生成迭代器
迭代器函数 - iter() 函数 与 next() 函数
iter(iterable)从可迭代对象中返回一个迭代器,iterable必须是能提供一个迭代器的对象
next(iterator) 从迭代器iterator中获取下一了记录,如果无法获取下一条记录,则触发stoptrerator异常
说明:
1.迭代器只能往前取值,不会后退
2.用iter函数可以返回一个可迭代对象的迭代器
示例:
iter()函数介绍:生成一个迭代器对象
iter()函数用法:iter(iterable)
参数介绍:iterable —> 可迭代的数据类型(比如列表、字典、元组以及集合类型等)
示例:
iter([1, 2, 3])
返回值:
<list_iterator at 0x4f3bff0>
next()函数介绍:返回迭代器中的数据
next()函数用法:next(iterable)
参数介绍:iterable —> 迭代器对象
示例:
iter_obj = iter([1,2,3]) next(iter_obj)
返回值:
# >>> 1,2,3
# >>> StopIteration
综上,我们得出结论:
iter(iterable)从可迭代对象中返回一个迭代器,iterable必须是能提供一个迭代器的对象
next(iterable) 从迭代器iterator中获取下一了记录,如果无法获取下一条记录,则触发stoptrerator异常
演示案例如下:
# coding:utf-8 test_list = [1, 3, 5, 7] test_iter = iter(test_list) # 让test_list提供一个能访问自己的迭代器 print(next(test_iter)) # 1 从迭代器中取值,让迭代器去获取l中的一个元素 print(next(test_iter)) # 3 print(next(test_iter)) # 5 print(next(test_iter)) # 7 print(next(test_iter)) # StopIterable 异常
test_list 实际上是一个列表,但是被迭代器迭代之后。并不是一次性将列表放入内存中,而是每次放一个元素进入内存,然后被读取。(这就是我们说的按需加载)
可迭代的对象
类似于list、tuple、str 等类型的数据可以使用for… in… 的循环遍历语法可以从其中依次拿到数据并进行使用,我们把这个过程称为遍历,也称迭代。python中可迭代的对象有list(列表)、tuple(元组)、dirt(字典)、str(字符串)set(集合)等。
示例如下:
test_list = [1,2,3,4,5] test_dirt = { "name":"张三", "sex":"男", "age":33 } test_tuple = (1,2,3,4,5) test_set = {1,2,3,3,4} for i in test_list: print(i) for i in test_dirt: print(i) for i in test_tuple: print(i) for i,j in test_set.items(): print("%s:%s" % (i,j)) # >>> 执行结果如下: # >>> test_list的元素为: 1 # >>> test_list的元素为: 2 # >>> test_list的元素为: 3 # >>> test_list的元素为: 4 # >>> test_list的元素为: 5 # >>> test_dirt的元素为: name # >>> test_dirt的元素为: sex # >>> test_dirt的元素为: age # >>> test_tuple的元素为: 1 # >>> test_tuple的元素为: 2 # >>> test_tuple的元素为: 3 # >>> test_tuple的元素为: 4 # >>> test_tuple的元素为: 5 # >>> test_set的元素为:1 # >>> test_set的元素为:2 # >>> test_set的元素为:3 # >>> test_set的元素为:4
生成迭代器
除了刚刚我们使用的 iter() 函数之外 ,我们还有其他方法生成迭代器:
第一种:for循环生成方法 —> 我们可以在函数中使用 for 循环, 并对每一个 for 循环的成员使用 yield() 函数 [它的意思就是将每一个 for 循环成员放到一个迭代器对象中,不过只有被调用才会被放入。]
示例如下:
def test(): for i in range(10): yield i result = test() print('for 循环,第一次 \'i\'的值为:', next(result)) print('for 循环,第二次 \'i\'的值为:', next(result)) print('for 循环,第三次 \'i\'的值为:', next(result)) print('for 循环,第四次 \'i\'的值为:', next(result)) # >>> 执行结果如下: # >>> for 循环,第一次 'i'的值为: 0 # >>> for 循环,第二次 'i'的值为: 1 # >>> for 循环,第三次 'i'的值为: 2 # >>> for 循环,第四次 'i'的值为: 3
注意:超过10次异常会抛 StopIteration 的异常。
第二种:for 循环一行生成迭代器对象。
示例如下:
result = (i for i in [1, 2, 3]) # 将 for 循环在非函数中 赋值 给一个变量, 这也是生成一个迭代器变量的方法 print('for 循环,第一次 \'i\'的值为:', next(result)) # 使用 next 调用迭代器 print('for 循环,第二次 \'i\'的值为:', next(result)) print('for 循环,第三次 \'i\'的值为:', next(result)) # >>> for 循环,第一次 'i'的值为: 1 # >>> for 循环,第二次 'i'的值为: 2 # >>> for 循环,第三次 'i'的值为: 3
注意: next(result) 超过4次会抛 StopIteration 的异常。
划重点:
使用 for 循环生成的迭代器,可以不使用 next() 函数 也可以执行,(依然可以通过 for 循环 获取迭代器的数据)不仅如此,当我们调取完迭代器中的数据之后,程序不会抛出异常,相比较与 next() 函数要友好的多。
示例如下:
result = (i for i in [1, 2, 3]) for item in result: print(item) # >>> 执行结果如下: # >>> 1 # >>> 2 # >>> 3 # 循环结束,程序正常退出,不会抛出 StopIteration 的异常
迭代器的用法 - 演示案例
案例一:
def make_iter(): for i in range(5): yield i iter_obj = make_iter() for i in iter_obj: print(i) print('----') for i in iter_obj: print(i) # >>> 执行结果如下: # >>> 0 # >>> 1 # >>> 2 # >>> 3 # >>> 4 # >>> ---- # >>> 从运行结果得出结论,当我们从内存中读取完迭代器所有的值后,内存就会被释放,不再循环输出。
案例二:
iter_obj = (i for i in range(4)) for i in iter_obj: print(i) print('=====') for i in iter_obj: print(i) # >>> 执行结果如下: # >>> 0 # >>> 1 # >>> 2 # >>> 3 # >>> ===== # >>> 从运行结果得出结论,当我们从内存中读取完迭代器所有的值后,内存就会被释放,不再循环输出。
迭代器 除了前文我们提到的 按需加载 ,可以提升我们的执行速度以外。
还有另外一个原因,试想一下:如果我们的列表只有10个数据,那么读取的速度会很快。可能对资源(也就是我们的内存)占用的消耗不是很大;如果我们有一个成千上万甚至十万数据的列表,那么这些数据都要一次性的写入内存里,这么多的数据所消耗占用的资源必然会很大,甚至会撑爆我们的内存造成内存溢出,程序就会报错了。
所以如果通过迭代器的方式,我们只需要用到一个数据就将一个数据扔到内存里并且被使用。这样既可以提高我们内存使用的效率,又可以减少我们内存的消耗。这也是我们平时使用迭代器的目的。
加载全部内容