* V) v& ]* C+ X4 A! i. A1 `- B& L5 Z/ I) C1 `5 }
官方网址: - a; K! c: t" y0 i+ K% S% E, M @: s! E T) I
1 r6 e% W1 B" z& a+ G9 A, [
Requests: 让 HTTP 服务人类4 @$ ~4 Q9 a$ A
Beautiful Soup 4.4.0 文档1 v( j1 P1 P1 N: Q
Selenium官网& k3 k U2 R9 W. E" k
lxml - XML and HTML with Python # w. S0 j& U, R- p# M% b( \+ s$ ]requests1 o* v) K% E, K: n
requests官方文档 https://docs.python-requests.org/zh_CN/latest/ 8 I) F" j* a) \ @1 l3 q 3 P+ q% [' p9 v 3 ?% g7 [: r# H1 S5 g a7 V& t , a. g0 D: d& z5 ^1 o7 L ) q3 d: l+ T) w; Y3 ~1 @( @0 `5 L5 q0 e( ]
2 c) t+ H- {( ]2 u2 y进行爬虫,首先要对网址进行请求,这个时候就要用刀我们的requests模块了。requests是python的一个HTTP客户端库,跟urllib,urllib2类似。与urllib,urllib2相比,requests模块语法更加简单。正如他的官网所说:7 N7 B' ^4 n+ J1 e" I. ~
) d& N2 w* j9 n8 u, ~* v. l 5 |8 A/ e1 C) d- a) r, W. ?5 R. \ |* [+ @( I
. m: ~& A! o S3 irequests模块介绍 & [ x+ G" S* I& T- k) J% l! H. @+ l0 w; q) N& l1 l" I
2 x( W; W+ u8 s/ ~* |& A7 s$ H+ O& y
发送http请求,获取响应数据4 _8 k2 v/ I6 L/ b* ~+ B0 ]3 A
) v$ ~' `# s# X* K" ~* e) {, A
* F3 R0 |; x$ [* T+ c
requests模块是一个第三方模块,需要在你的python(虚拟)环境中额外安装& W* \& }3 c7 s7 u8 _0 F1 \9 s3 \% T+ n
) R0 e" K: T; c1 m
5 ^$ g( k3 V! U# B/ _7 N6 t
pip/pip3 install requests% P8 ?: Y! U/ w