数学建模社区-数学中国

标题: Python 迭代器、生成器 [打印本页]

作者: zhangtt123    时间: 2020-6-16 10:18
标题: Python 迭代器、生成器
一、可迭代对象
6 {. d5 d- ~/ {( c4 S5 d1 a字面意思:; q8 N6 u7 u+ [& j0 I
对象:Python 中一切皆为对象(巧了 Java 也是(手动滑稽))" W' `6 e  |. g% h( B
可迭代:可更新迭代,重复、循环的一个过程,每次更新迭代都会获得新的内容
. f6 s8 i2 W1 ~0 k7 m' e专业角度:内部含有 '__iter__‘ 方法的对象
) {$ m8 p9 n. \' p" @( D# E目前学过的可迭代对象:str、list、tuple、dict、set、range、文件句柄等
4 M  J6 S- O/ g3 e4 o判断一个对象是否是可迭代对象:看是否有 '__iter__' 方法,dir() 可以获取一个对象的所有方法;或者使用 isinstance(object, collections.iterable) 来判断对象是否是可迭代对象的一个实例# D0 x0 d& G: Q$ g

' W3 h9 @- i4 v. ~% Y
1 s' {5 i; R! L5 f/ n优点:5 _0 z. `0 {; s3 d
存储的数据直接能显示,比较直观:比如直接 print 一个可迭代对象,就会调用 __str__ 方法(相当于 Java 中的 toString),把可迭代对象的值打印出来* y8 ^$ ^+ v: e
拥有较多的方法,操作方便:增删查改等
: M' Y- P3 I& T1 b; C. j: o* |, [缺点:
- A/ e3 m, A- W8 H6 L) [0 {占用内存:一旦创建了一个可迭代对象,就会将该对象的内容全部加载到内存中
$ K& B+ W! d3 h不能直接通过 for 循环,不能直接取值(通过索引、key等)。诸如通过 for i in iterable 这种形式获取元素实际上也是调用了 __iter__ 方法先将可迭代对象转换成迭代器再进行获取
" a! m9 s6 y2 S9 S, {二、迭代器& ?4 w# B, f# @% P% R
字面意思:器,工具,迭代器也就是可以一直更新迭代取值的工具
3 a# G5 I5 y4 [/ B5 H6 n2 m! V专业角度:内部含有 __iter__ 方法且含有 __next__ 方法的对象就是迭代器;或者使用 isinstance(object, collections.iterator) 来判断对象是否是可迭代对象的一个实例6 k- S8 c/ h5 `* P* S
把一个可迭代对象转换成迭代器:使用 iter() 方法或使用对象的 __iter__ 方法
0 F) a0 T* H! [- n2 C0 _. W9 ?% Z+ P
迭代器取值:使用 next() 方法或对象的 __next__ 方法;当迭代器的值去玩了继续取,就会报StopIteration异常,所以一般使用迭代器需要做异常处理3 i. C$ E2 q5 D8 w* `  [; y3 b

4 o; ?9 t8 O% ^2 U, ?- J优点& `/ [* {+ a/ c0 n% i
节省内存:迭代器并不会一次性将对象的值全部加载到内存中,而是需要时才加载(类似 sed)
8 O- Q/ Q7 g6 U) m" D( Z1 |# v惰性机制:next 一次只取一个值,绝对不多取' R' Y2 h: q8 P& K
缺点:2 M' t: d* b& _& Q4 M5 B) e( e. Q
速度慢:需要一直 next
0 Y; L$ g# h2 Q8 X2 Z6 j不能回头:只能一直往下取值,取过的值没保存就没了`
: L  _: M4 D: N0 j  V不能直观的看到里面的数据
2 X' O8 d( {; o/ ~/ S8 F8 q三、可迭代对象与迭代器对比: V# K8 C9 X) z, P
可迭代对象:& [/ n) z& A8 q, S0 ]8 Z# p
私有方法多,操作灵活(比如列表,字典的增删改查,字符串的常用操作方法等). X6 z6 H. C1 G2 F
直观,可以直接看到里面的数据
4 t( E* F. |6 i0 _占用内存, i5 s6 c  |# b- H5 z+ M+ ^% m- ~. K  v; N
不能直接通过循环迭代取值
# n" n7 @, G+ Y- H应用:当你侧重于对于数据可以灵活处理,并且内存空间足够,将数据集设置为可迭代对象是明确的选择7 f2 W6 u! U% \. @1 ^- |* j
迭代器:" M/ p+ c) Z) E  k( |3 b0 I
节省内存,按需取值
% V/ B/ T/ a; i% I可以直接通过循环迭代取值
$ e( J8 Z0 W( ^2 i+ [+ @. W- m数据不直观,操作方法单一
1 w' ~( ?. ~0 B" p) ~7 {3 O应用:当你的数据量过大,大到足以撑爆你的内存或者你以节省内存为首选因素时,将数据集设置为迭代器是一个不错的选择
/ @, A* z3 c# n2 ]$ I四、生成器
" _: P# M+ _8 k% @生成器的本质就是迭代器,唯一的区别是生成器是我们自己用代码构建的数据结构,迭代器是 Python 提供的,或者通过可迭代对象转化得来的$ \" f1 g5 E9 n8 [5 F

0 u7 Y- B) A. s. C  [7 Z定义生成器的方式:2 H  S/ h4 a' P3 x4 a! c* n3 U
通过生成器函数构建生成器
& J- p5 U! c% [: f3 E 111.png
$ h1 Y9 K, U( g& ]9 F
: H- ]1 o9 m4 T4 w$ z/ B! e8 ^! x4 z" K/ c
这就是最简单的生成器函数。实际上这个 yield 就替代了 return,不仅将函数变成了生成器函数,还会将后面的值在调用 __next__ 的时候返回出来
7 r6 C( k. F( o) ?
/ s4 Q6 }. d7 K9 U! N( ^也可以在一个函数里定义多个 yield, F. J' C0 e3 b1 b/ `; K1 W

4 Q( U) C, F0 E9 D之前说过,生成器本质上还是迭代器,一个 yield 对应一个 next,当 next 的数量超过了 yield,就会报 StopIteration$ V5 m  w9 |2 W& C+ S: K

8 _  K4 A9 z$ J# l& K6 e5 Kyield 与 return 的区别, ^: ?" J& U9 o1 P  z; p

' ]: Y$ ^) A4 M+ j2 S8 |  Y+ [return一般在函数中只设置一个,他的作用是终止函数,并且给函数的执行者返回值
1 Q+ T% J" a4 w8 ]0 y+ `$ n3 yyield在生成器函数中可设置多个,他并不会终止函数,next会获取对应yield生成的元素' D$ K0 K- x/ p8 M
应用举例:
( X: l1 ]% G  c2 `. f% S% T
2 H* P6 }: m  y2 D买 5000 个包子,假设这个老板很厉害,一下子就把 5000 个包子做出来卖给我们,可是我们只有 5 个人,一下子吃不完,那包子就会冷掉、臭掉、被丢掉浪费了
! V4 s1 p) y* i 222.png
7 {1 P. E; S6 J" ]) {  S/ Q
7 j6 \/ a7 O# S7 [  J4 r  X如果这个老板可以在我们需要多少个包子就做出来多少个包子的话,这样做出来的包子就不会被浪费了(比如我们每个人一口气能吃 40 个包子,那每次就做 200 个包子):. s; V, q) I' F8 H- |7 l3 r
3333.png % B5 D4 K' \* q* v# a
2 R/ y( W8 a7 F/ X/ ]: y0 J
除了 使用 next() 触发 yield 之外,生成器还有一种方法 send(),这个方法可以在调用 yield 的同时传值给生成器内部5 Y5 s1 ~, V$ `8 h1 U& u
+ ~* w# e: b. A3 H! g- a# A( U
可以看到在使用 next() 的时候,只能获取到 yield 的值,但不能传递值
% r% Q/ k8 o7 A6 z* v3 k* V! x* ?- P/ `& @" o# F
在使用 send() 的时候,可以将参数传入生成器中使用
$ ?" v  M# W7 L- f! b: f  u7 @& }" a2 n: n3 _! {8 Q8 R
需要注意的是第一次不能直接调用 send() 传参,因为每次调用生成器的时候,实际上只会返回 yield 后面的内容,然后生成器就停止了(睡眠了?),而 send() 传入的参数要通过 yield 传入生成器中(每次调用生成器在 yield 停止,然后在 yield 恢复继续允许),第一次调用并没有 yield 给我们传入参数,可以使用 send(None),可以打断点自己分析一下
1 @4 e) L: ~! }, O; w: p  H+ F# o1 j
yield 会将它后面跟着的对象直接返回,如果它后面跟着的是可迭代对象,也可以使用 yield from 将这个可迭代对象变成迭代器返回
& ~. J6 `! L3 X
4 b9 J, w. G  K% Y5 Q1 N* g3 I/ l1 q' i; y/ {; g% v
yield from 是将列表中的每一个元素返回,所以写两个 yield from 并不会有交替执行的效果2 d; R4 c4 e5 u  r( D1 G
) F0 |3 b; |0 k" U2 ]6 q2 M; h+ R8 G
" b* f6 A& j# Q* ~# a2 B4 W1 w
8 H* d8 M* D$ `/ b% U# j4 Q
通过推导式构建生成器4 I" C' c% E3 ~
列表推导式:
2 C/ @8 X7 B+ M1 q, q7 p2 ~! A0 p
. c4 B/ M$ s. _生成器表达式:和列表推导式差不多,把 [] 改成 () 即可. \4 @- V" ~  p5 J. w% g

9 v+ S8 e! g0 N- Y# x$ R& Z# D7 U; j; s
- L. i) n9 w6 B) U) m9 u, W$ c列表推导式和生成器推导式的区别:/ q6 e5 e) S# c
* ~% _' F1 j  }( M8 @
列表推导式比较耗内存,所有数据一次性加载到内存;而生成器表达式遵循迭代器协议,逐个产生元素" w4 f' Z6 G9 K  M  q
得到的值不一样:列表推导式得到的是一个列表;生成器表达式获取的是一个生成器
" _) Y+ f- N1 K' r% z列表推导式一目了然,生成器表达式只是一个内存地址
. P( b% v- z; p6 \/ ?4 o+ i# r————————————————
0 s' Y3 X( B* ]1 E8 n  o版权声明:本文为CSDN博主「阿玮d博客」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。' s; E' ^3 W- W  V
原文链接:https://blog.csdn.net/weixin_42511320/article/details/105676143
4 Y# h% c3 n. \, z, y$ b. x* A  C- Y  I: E" M0 a. e
' P! m+ f) {+ a0 {; g

作者: dwadasd    时间: 2020-6-24 20:40
多谢大神分享. m: i* V4 b* P# F7 k& ~

作者: dwadasd    时间: 2020-6-24 20:41
太好了太好了+ R, t. [7 ?1 N- x6 h





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5