QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2912|回复: 2
打印 上一主题 下一主题

[国赛经验] Python 迭代器、生成器

[复制链接]
字体大小: 正常 放大

326

主题

32

听众

1万

积分

  • TA的每日心情
    慵懒
    2020-7-12 09:52
  • 签到天数: 116 天

    [LV.6]常住居民II

    管理员

    群组2018教师培训(呼和浩

    群组2017-05-04 量化投资实

    群组2017“草原杯”夏令营

    群组2018美赛冲刺培训

    群组2017 田老师国赛冲刺课

    跳转到指定楼层
    1#
    发表于 2020-6-16 10:18 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
    一、可迭代对象
    ' {* j6 I6 A  s2 {" }- F! U2 U; ~字面意思:; `. b+ q7 z! c- y9 Z, J0 @4 D
    对象:Python 中一切皆为对象(巧了 Java 也是(手动滑稽))& `. t  ~! Z: g7 }
    可迭代:可更新迭代,重复、循环的一个过程,每次更新迭代都会获得新的内容
    # F* X. X% z! @5 }专业角度:内部含有 '__iter__‘ 方法的对象
    2 F" J0 N4 c8 |. I  ]- p$ N目前学过的可迭代对象:str、list、tuple、dict、set、range、文件句柄等* z1 m' O% C0 J2 [) N
    判断一个对象是否是可迭代对象:看是否有 '__iter__' 方法,dir() 可以获取一个对象的所有方法;或者使用 isinstance(object, collections.iterable) 来判断对象是否是可迭代对象的一个实例
    : `* T3 x- p5 D+ ^& F
    # }7 B; U/ B8 d/ t# d" ]
    * Q/ A5 X9 ^# p8 ~3 D7 o- \优点:$ N( {8 K" w& l0 I( f" T* r/ ^: D
    存储的数据直接能显示,比较直观:比如直接 print 一个可迭代对象,就会调用 __str__ 方法(相当于 Java 中的 toString),把可迭代对象的值打印出来3 r, b3 @6 S' R5 \
    拥有较多的方法,操作方便:增删查改等
    , v/ a& H9 j# W" X* \; [5 {缺点:8 R/ ^2 I  y) L" \% ^5 l5 c
    占用内存:一旦创建了一个可迭代对象,就会将该对象的内容全部加载到内存中
    & g9 W5 U* ~6 m4 ?' d# j5 n不能直接通过 for 循环,不能直接取值(通过索引、key等)。诸如通过 for i in iterable 这种形式获取元素实际上也是调用了 __iter__ 方法先将可迭代对象转换成迭代器再进行获取
    5 a! ?5 K9 s0 F二、迭代器  l2 x6 ~5 \$ n+ @! B3 \7 P
    字面意思:器,工具,迭代器也就是可以一直更新迭代取值的工具
    . H1 ~9 x" `7 i) I; e6 ~专业角度:内部含有 __iter__ 方法且含有 __next__ 方法的对象就是迭代器;或者使用 isinstance(object, collections.iterator) 来判断对象是否是可迭代对象的一个实例
    - ]2 q1 n9 r) L0 y6 J8 |: ]) T把一个可迭代对象转换成迭代器:使用 iter() 方法或使用对象的 __iter__ 方法; ?( J6 Y% q% e; q

    * d  O9 T# j/ e! F, V- Z迭代器取值:使用 next() 方法或对象的 __next__ 方法;当迭代器的值去玩了继续取,就会报StopIteration异常,所以一般使用迭代器需要做异常处理" x/ \: v- [+ S4 j2 Q9 ^& C2 c
    $ H2 }4 S# L$ [6 P* i
    优点/ [2 o7 b: E# m4 _
    节省内存:迭代器并不会一次性将对象的值全部加载到内存中,而是需要时才加载(类似 sed)5 y! y6 y" n5 W) a! `$ o. ?
    惰性机制:next 一次只取一个值,绝对不多取) p1 e3 d, r! F. |
    缺点:
      W( d5 C# G) [, s: a7 |7 ~速度慢:需要一直 next
    " A" Y$ W# h3 g不能回头:只能一直往下取值,取过的值没保存就没了`4 y4 [, `, O. W( h' d
    不能直观的看到里面的数据5 t' ^% l& j1 ^7 N
    三、可迭代对象与迭代器对比2 k) e% \! r7 Q1 _7 a5 Z
    可迭代对象:4 W. N2 O' N4 T/ ^' T
    私有方法多,操作灵活(比如列表,字典的增删改查,字符串的常用操作方法等)( v9 i- L6 C! d0 w& ~  a; |- A
    直观,可以直接看到里面的数据" S" ?' b1 \* ^9 `) i
    占用内存
      W1 G9 l3 d* p/ H. x不能直接通过循环迭代取值$ `  d1 q: [; _" Q) n4 q  `* `' h
    应用:当你侧重于对于数据可以灵活处理,并且内存空间足够,将数据集设置为可迭代对象是明确的选择
    ; Y+ h: Y  A8 |. T. x4 R迭代器:
    . X! n. }# T+ Z5 k2 ?节省内存,按需取值
    2 b% u( ^: ^5 t, u% v: w8 ]7 T# t可以直接通过循环迭代取值
    8 D6 U' e2 l5 k! x数据不直观,操作方法单一
    - \5 Z3 T7 @) {应用:当你的数据量过大,大到足以撑爆你的内存或者你以节省内存为首选因素时,将数据集设置为迭代器是一个不错的选择
    / C! u) w6 L0 ^" ?# j; H四、生成器
    0 n2 q$ J4 V" T, {生成器的本质就是迭代器,唯一的区别是生成器是我们自己用代码构建的数据结构,迭代器是 Python 提供的,或者通过可迭代对象转化得来的
    ( f% A1 J  h8 |  J
    " C$ {$ _- _5 P& v9 n  Y0 u; o定义生成器的方式:
    " R+ G7 j( {; A- L通过生成器函数构建生成器
    % [: X, S: y6 p! Y# G6 d 111.png 1 Q/ f5 s- p7 N
    ; _1 W- |9 f% ^; y4 g

    ( l; c3 w* g+ `, J" J" G这就是最简单的生成器函数。实际上这个 yield 就替代了 return,不仅将函数变成了生成器函数,还会将后面的值在调用 __next__ 的时候返回出来
    1 \, i" x/ o8 x/ t9 b, k' n0 x! X2 h$ n' D" Q' P
    也可以在一个函数里定义多个 yield
    # f9 @- m+ W; e9 t
    7 a# B: s* X, B. N% t  O之前说过,生成器本质上还是迭代器,一个 yield 对应一个 next,当 next 的数量超过了 yield,就会报 StopIteration
    + X3 G6 V( e. @5 l, j5 t1 S3 Q' n8 J% Q1 e9 t. g% O% k& \
    yield 与 return 的区别
    2 l6 R; K: E2 N
    ' a6 C# s8 e; x! c/ W# s7 areturn一般在函数中只设置一个,他的作用是终止函数,并且给函数的执行者返回值$ D( @% r9 D7 U
    yield在生成器函数中可设置多个,他并不会终止函数,next会获取对应yield生成的元素$ w2 ?: C4 ]# C* ?* q8 Z
    应用举例:
    ! g8 e% Y/ S% h$ P# ~: {' D# ~4 }0 i. Y
    买 5000 个包子,假设这个老板很厉害,一下子就把 5000 个包子做出来卖给我们,可是我们只有 5 个人,一下子吃不完,那包子就会冷掉、臭掉、被丢掉浪费了
    . O* Q/ s* _# l. ` 222.png
    , a. ]3 w! Y% X1 P3 u8 ~/ I4 W0 `- `* @+ u
    如果这个老板可以在我们需要多少个包子就做出来多少个包子的话,这样做出来的包子就不会被浪费了(比如我们每个人一口气能吃 40 个包子,那每次就做 200 个包子):  U+ S, ]7 S/ L1 e
    3333.png
    5 K9 {/ B- ]7 v, N8 y7 c; s% w% F! Z  b8 o/ n# q& l- ]2 w
    除了 使用 next() 触发 yield 之外,生成器还有一种方法 send(),这个方法可以在调用 yield 的同时传值给生成器内部
    % r7 h( n. ?2 r8 m# L& R
    6 a$ A/ v' m# a  W% f可以看到在使用 next() 的时候,只能获取到 yield 的值,但不能传递值
    ( }% J1 @6 }  v- W: p
    , |2 B& }8 k3 W% v; j, K; v, `在使用 send() 的时候,可以将参数传入生成器中使用
    + K$ e" F: H9 g! M- ~6 i9 B& {5 u! D) @5 q  u& M& x7 K
    需要注意的是第一次不能直接调用 send() 传参,因为每次调用生成器的时候,实际上只会返回 yield 后面的内容,然后生成器就停止了(睡眠了?),而 send() 传入的参数要通过 yield 传入生成器中(每次调用生成器在 yield 停止,然后在 yield 恢复继续允许),第一次调用并没有 yield 给我们传入参数,可以使用 send(None),可以打断点自己分析一下
    ( ?. K! t' s) w2 x- w% u8 [# v7 K* k% l8 [( V
    yield 会将它后面跟着的对象直接返回,如果它后面跟着的是可迭代对象,也可以使用 yield from 将这个可迭代对象变成迭代器返回! ?# z& h/ @" m9 g

    : B7 F; F2 P* l7 a# z* b0 q: o8 N8 J" e3 y6 m
    yield from 是将列表中的每一个元素返回,所以写两个 yield from 并不会有交替执行的效果
    $ ~7 Z, H( |, y) g! `
    7 k/ m; a8 w7 y( d
    * h7 I5 u9 j/ A4 v6 R9 T. L" E' ^8 x$ Q: n
    通过推导式构建生成器( }2 v% O7 {( ^% _  Q# [
    列表推导式:" ]8 U5 k# e# b4 N
    2 @% i" {! {6 L& ~0 i
    生成器表达式:和列表推导式差不多,把 [] 改成 () 即可& }2 n9 u0 E% D3 ~( y  J

    2 s% s2 n- }% K
    4 g" E6 N# \, J) F列表推导式和生成器推导式的区别:
    * s& Z* M7 u/ {5 @% I$ u7 M+ ?- E5 d' n- @
    列表推导式比较耗内存,所有数据一次性加载到内存;而生成器表达式遵循迭代器协议,逐个产生元素
    8 Q6 Z; Q3 p. t6 i5 x* d- ?3 ?得到的值不一样:列表推导式得到的是一个列表;生成器表达式获取的是一个生成器# D" T4 I2 }6 H9 `9 W9 a1 Q
    列表推导式一目了然,生成器表达式只是一个内存地址
    / [/ k+ A4 l" V8 {$ u8 w————————————————/ N% X- e$ S+ X6 t( x
    版权声明:本文为CSDN博主「阿玮d博客」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    / B7 v6 T4 H( Q0 D/ w- j原文链接:https://blog.csdn.net/weixin_42511320/article/details/105676143+ s: I' o/ v! E
    - U7 B4 c& _4 h

    ( ?8 A) _9 Y( x2 @# r
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    dwadasd        

    0

    主题

    1

    听众

    54

    积分

    升级  51.58%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    dasd asdasd
    回复

    使用道具 举报

    dwadasd        

    0

    主题

    1

    听众

    54

    积分

    升级  51.58%

    该用户从未签到

    网络挑战赛参赛者

    自我介绍
    dasd asdasd
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-14 09:05 , Processed in 0.538903 second(s), 64 queries .

    回顶部