- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563288 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174209
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
新浪微博爬虫,用python爬取新浪微博数据
! X: `5 m5 y/ O1 ]& i& z6 ]0 I
6 i* j: j! v5 o- ^( K本程序可以连续爬取一个或多个新浪微博用户(如胡歌、迪丽热巴、郭碧婷)的数据,并将结果信息写入文件或数据库。写入信息几乎包括用户微博的所有数据,包括用户信息和微博信息两大类。因为内容太多,这里不再赘述,详细内容见获取到的字段。如果只需要用户信息,可以通过设置实现只爬取微博用户信息的功能。本程序需设置cookie来获取微博访问权限,后面会讲解如何获取cookie。如果不想设置cookie,可以使用免cookie版,二者功能类似。爬取结果可写入文件和数据库,具体的写入文件类型如下:txt文件(默认)csv文件(默认)json文件(可选)MySQL数据库(可选)MongoDB数据库(可选)SQLite数据库(可选)同时支持下载微博中的图片和视频,具体的可下载文件如下:原创微博中的原始图片(可选)转发微博中的原始图片(可选)原创微博中的视频(可选)转发微博中的视频(可选)原创微博Live Photo中的视频(免cookie版特有)转发微博Live Photo中的视频(免cookie版特有)% }3 {# ~( f' Z( T2 n4 |& a
9 b8 h. @2 r! u8 y' k+ w# J3 d7 Z' _3 _; n8 [( |/ I$ |( c
2 E! G; u+ k- S; X) Y
, M l& F& l0 o1 | |
zan
|