- 在线时间
- 637 小时
- 最后登录
- 2025-4-13
- 注册时间
- 2023-4-14
- 听众数
- 8
- 收听数
- 0
- 能力
- 0 分
- 体力
- 10418 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 3903
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1555
- 主题
- 1401
- 精华
- 0
- 分享
- 0
- 好友
- 0
TA的每日心情 | 开心 2024-6-5 18:09 |
---|
签到天数: 160 天 [LV.7]常住居民III
- 自我介绍
- 数学中国工作人员
 |
资源一;讲解了如何使用 Python 编写网络爬虫,涵盖爬虫的概念、Web 基础、Chrome、Charles 和 PacketCapture 抓包、urllib、Requests 请求库、lxml、Beautifl Soup、正则表达式解析数据、CSV、Excel、MySQL、Redis、MongoDB 保存数据、反爬虫策略应对、爬虫框架 Scrapy 的使用与部署,以及应用案例。结构清晰、内容精练,代码示例典型实用,附带实践过程中遇到问题的解决方案,非常适合 Python初学者和进阶读者阅读。
" `: W/ W$ Y& g- B资源二;讲解了如何使用 Python 来编写网络爬虫程序,内容包括网络爬虫简介,从页面中抓取数据的三种方法,提取缓存中的数据,使用多个线程和进程来进行并发抓取,如何抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用 Scarpy 和 Portia 来进行数据抓取,并在最后使用本书介绍的数据抓取技术对几个真实的网站进行了抓取,旨在帮助读者活学活用书中介绍的技术。
& e' g8 j* j: |6 v' ]/ U- l9 S# A8 D' Q
|
zan
|