<FONT size=3>1,前言 我是在2000年上半年知道GOOGLE的。在这之前,我搜索英文信息通常用AltaVista,而搜索中文信息则常用Sina。但自使用了GOOGLE之后,它便成为我的Favorite Search engine了。这也得感谢新浪网友曹溪,因为当初正是因为他的大力推介,才使我识得了GOOGLE。 , k; j# W t7 d+ ~" f
; l% E' U, o7 W/ a8 r7 _记得1996年夏季的时候,当我第一次接触Internet,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真是妙不可言。在经历了疯狂的WWW冲浪和如痴如醉的BBS沉迷之后,我意识到Internet对我影响至深的还是在于学习方式的变迁。 , p, s" V" E! t3 X$ B" R1 V9 X
' |! K% F' `- }; T
如何来描述这种变迁呢?以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信息中提取所需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信息领域大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了。比方说,我们到了大型的图书城,往往有一种不知所措的感觉。旧有的学习方式需要变更以适应这个信息爆炸的年代。目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。我不妨把这称为“即学式”,相应的,旧有的称为“预学式”。 # G7 J0 I7 X0 o, c) P' y
! n# w' K6 j2 j- ^$ C2 I u不过,“即学式”的实施是有前提的。首先,要求学习者拥有一个包罗万象的信息库,以供随时抽取各种目的信息;其次,是需要一个强劲的信息检索工具,以便高效率的从信息库中提取信息。很明显,Internet可以充当那个海量的信息库,而搜索引擎,则正是寻找光明之火的绝好工具。 x2 l) `$ T) F5 H# g
: l3 j3 a$ [. K: J' S“公欲善其事,必先利其器”。Internet只有一个,而搜索引擎则有N多个。有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大。用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望。不同的时期,涌现出不同的强者。就目前而言,我们非常幸运的有了: *****GOOGLE***** 2,摘要 本文简要的介绍了GOOGLE的历史和特点,GOOGLE的基本搜索语法和高级搜索语法,GOOGLE的特色功能,包括图片搜索、新闻组搜索和集成工具条等,还简单的介绍了一些常用搜索技巧和实用个案。尽管本文名为“GOOGLE搜索从入门到精通”,但事实上,笔者对运用GOOGLE进行搜索也尚处于“入门”阶段。 / y X8 n' J6 g0 _: j* X0 ], q 9 e* e) |' q5 ?( w3,如何使用本文 阅读本文最好具备一些最基本的布尔代数基础,如“与”、“或”、“非”等。不过,即便你没有这方面的知识,也不必在意。对那些实例进行练习,你的疑惑就会迎刃而解。对于刚刚接触网络搜索的读者而言,也许你应该从头到尾的阅读本文;但对于那些有一定搜索基础的读者而言,只需要跳跃着寻找自己所需要的信息就可以了。当然,如果你有一定的英文基础,也可以把本文与GOOGLE大全(http://www.google.com/about.html)参照阅读,那样效果会更好。 % f1 v8 R) n& A4 M8 r
3 E' f5 o1 \9 _4 ?( X7 e9 T3 ~1 i4,GOOGLE简介 Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。 2 i9 P2 R, h& f& ]/ U6 N' w) H' e % C$ c8 b* z6 C4 a7 IGOOGLE的成功得益于其强大的功能和独到的特点: GOOGLE支持多达132种语言,包括简体中文和繁体中文; GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘; GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带; GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果; GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介; GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站; GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。 2 J4 q) s, z; ~$ S5 {: A* p& [# c' v! i8 w0 A( e4 s- X
5,搜索入门 要用GOOGLE做搜索,当然首先要进GOOGLE网站--www.google.com;不过,163.com和yahoo.com.cn使用的实际上也是GOOGLE搜索引擎,只是对搜索结果进行了编排,但无法提供一些特色功能,如图片搜索等。 , I& n5 E- X4 w* I7 N* h6 P+ I o$ f& d9 \5 Q& V
第一次进入GOOGLE,它会根据你的操作系统,确定语言界面。需要提醒的是,GOOGLE是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对GOOGLE界面进行个人设定了。 & j# I, F: h8 e0 d- Q' Z 8 m$ c. q- f( u6 l# B4 N% P' D* }GOOGLE的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,要查找所有关于“易筋经”的中文网站和网页。在搜索框内输入一个关键字“易筋经”,然后点击下面的“google搜索”按钮(或者直接回车),结果就出来了。 ( B) ~6 d3 ^8 ]. e. r. h# ] , E- c2 ]9 q2 s8 x搜索:“易筋经” 9 W$ e+ q9 v; G+ ?; ~/ m9 r
1 l0 C5 ^% t) a x! r8 l3 Q- Y! e4 U示例:搜索包含“金庸”和“古龙”的中文新浪网站页面, 搜索:“金庸 古龙 site:sina.com.cn” 6 q# C; o* h- x* \, i! O# ~: j; h! L! K( W
结果:已在sina.com.cn搜索有关金庸 古龙 的中文(简体)网页。 共约有734项查询结果,这是第1-10项 。 搜索用时0.12秒。 1 g3 R. u0 \9 g8 i6 S 4 a' J, N H' T+ B. c8 h9 `/ H- t4 d示例:搜索新浪文教频道中关于鲁迅的信息。 ' \8 R. g0 V8 B0 q2 T6 X. [: T2 Q+ v
6 B, G/ g- ]" F$ Z: D
搜索:“鲁迅 site:edu.sina.com.cn” / I( W- Y) I y9 `" J7 x- Y $ B G$ }. c& W0 O结果:已在edu.sina.com.cn搜索有关 鲁迅的中文(简体)网页。 共约有672项查询结果,这是第1-10项 。 搜索用时0.24秒。 . s/ c& W$ ?' e . \5 A; l8 B) A- J% ?8 @注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。 % a# y6 v0 n8 e( H( M8 B5 |0 K5 |' \) k4 d) v3 U2 D
8.2,查询某一类文件(往往带有同一扩展名) “filetype:”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。 ( p* G9 |8 |( y1 \2 o6 u* z6 {5 w5 B1 Q$ g0 J
最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档大约有2500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。 " b) w5 \! Y, R6 a* v% ?5 H
! T" k/ \7 s* V2 N5 P( d
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。 8 a3 I. O* i; G9 t% w) K4 F. E
( e( U8 Y2 D4 G$ e* T3 p, e搜索:“ecommerce filetypedf” % E: M8 Z# ?+ \0 X
E% s1 W" z& F: Y. R g1 S# F结果:已向英特网搜索ecommerce filetypedf. 共约有25,500项查询结果,这是第91-100项 。 搜索用时0.44秒。 ) K! ]) @/ _1 k+ e, G
! R1 i$ i, ^# }3 k3 W, B" X下面是某项搜索结果: www.ecommerce.gov/apec 文档类型: PDF/Adobe Acrobat - 一般文字档 Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCE READINESS ASSESSMENT GUIDE www.ecommerce.gov/apec Page 2. ... 9 ?1 z6 }2 l: i8 X6 P% [7 r: }& x+ a
~0 x% }, S9 x3 ]% {: L2 V
www.ecommerce.gov/apec/docs/readiness_guide_files/readiness_guide_5.pdf - 类似网页 可以看到,GOOGLE在PDF档前加上了的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。 $ _: J; w3 n9 p3 z
! T, m3 ]& J& J9 J* j) C搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurldf ecommerce”。搜索结果数量大致相同,不过查询结果顺序则略有很大差别。 2 ?: }/ {+ E% I+ B5 k( K/ l9 E- M0 s ; r% x0 K6 A8 f- w4 a2 _8 h注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的。 + V+ u1 p* A* N0 z$ G* X4 ^* b , H5 D- K' y8 F' i1 Z“filetype”的另一个强大用处则在图片搜索。下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。进入“http://images.google.com/”,查找关于本拉登的JPG图片。 - X5 e, {7 u' l& R- s+ J9 z+ j( Z* X
8 E2 O$ ?7 U! S- s( o$ o
搜索:“Bin Laden filetype:jpg” ! m" h3 F, t) D* @4 y: _% y0 L j' Q2 b" C* \, j
结果:搜索有关 Bin Laden filetype:jpg 的图片()。(试验版) 共约有1,630项查询结果,这是第1-20项 。 搜索用时0.14秒。 4 J4 Y$ x5 c" O# i! p4 H, v/ Y1 i0 X U, W
除此之外,我尚未发现其他的filetype用法。如果有谁知道,请给我发邮件。预先感谢。 0 v4 M! T% d7 R( ]) G! e
8 @ x6 ]; j( S1 T( T
8.3,搜索的关键字包含在URL链接中 “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。 ; |$ x1 o, Y+ G5 d" @ 8 R: q' r1 j' v f. l) ?+ y6 c示例:查找MIDI曲“沧海一声笑”。 ' g% E- k/ }) H' `8 ~1 f. y" n( b
搜索:“inurl:midi 沧海一声笑” * m$ \# F6 ~* C6 v$ l: c2 x- i2 S5 Z: g, b6 _! q2 M O/ {( ~6 a
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。 共约有16项查询结果,这是第1-10项 。 搜索用时0.16秒。 9 y! N; o! ^5 W6 F" u
" u1 ^4 r' p6 d' h* `# t
示例:查找[M$>网站上关于windows2000的安全课题资料。 - r9 e" Y: x) {% X, c
w4 ^$ f! @4 h5 B" w
搜索:“inurl:security windows2000 site:[M$>.com” 9 K* y4 P5 I; D1 p/ J0 ^
; d' d/ k4 T' E& g+ ~
结果:已在[M$>.com内搜索有关inurl:security windows2000 的网页。 共约有188项查询结果,这是第1-10项 。 搜索用时0.27秒。 1 M( k# p. U5 F7 z
4 S f8 e D) h" e4 h% K9 Q注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。 , N, j! i3 P4 W* L' \& M: i. Q: a; _4 P( Z. {3 ?
“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。 7 }" x6 q q# x3 @8 F/ {( d+ z0 V6 Z
! B8 u, g$ q* I8 G
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。 N$ {1 p+ _" ]8 F" T& ^) ^
2 p+ E. k6 `6 J0 r
语法:“allinurl:"cgi-bin" phf +com” 5 S2 I- }$ \* t: i8 u9 }/ z I # h- g4 e$ f+ I: g9 D% T搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有37项查询结果,这是第1-10项 。 搜索用时0.36秒。 ( [8 ]# D) g9 v, A- d
0 d' {' Z! J% Y* [. _8.4,搜索的关键字包含在网页标题中 “intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。 5 W1 B6 e. q' {9 b! ?- b2 K) b2 K3 @2 H! m' H0 V
示例:查找日本明星藤原纪香的照片集。 3 B. E2 Q5 v6 u! e! G. Y, G2 t 1 ?6 ~3 ^9 Y4 T$ S搜索:“intitle:藤原纪香 写真” 4 W: ~, t( n6 P0 d
" b( t- j% o! |
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。 共约有465项查询结果,这是第1-10项 。 搜索用时0.16秒。 3 n8 r% W$ H& B# D0 \6 l4 ?
0 h4 F$ @$ x# t9,其他罕用语法 9.1,搜索所有链接到某个URL地址的网页 如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。 * G6 ]* r' }! I4 n5 L& o7 E: e - t5 y8 l1 ?# F, u$ Q1 J" _4 ]示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。 0 x4 f9 @( t& r. ]- {! v [% q
% a1 {5 M9 H+ ?$ P' n
搜索:“link:www.newhua.com” 9 R/ ]) ?9 e6 M3 s' p 8 A! h7 q2 d8 N% h结果:搜索有链接到www.newhua.com的网页 。 共约有856项查询结果,这是第1-10项 。 搜索用时0.17秒。 ! Y4 S# h% z* \: l: c
: n" T% Y, v* S+ x2 t& V$ g# O
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。 * b& I+ y2 C$ L4 G, K
/ y% h2 F" {" }; d& a9.2,查找与某个页面结构内容相似的页面 “related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:wwwsina.com.cn/index.shtml”。 8 `/ [8 G F9 Y! b8 |& B
8 I- a7 \5 A" r& Q& v* s: E9.3,从GOOGLE服务器上缓存页面中查询信息 “cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。 - t7 o& J% o, }2 [8 j6 m. ^2 [* \: U: ]7 Y) H5 m* {) a
示例:查找GOOGLE缓存的中文yahoo首页 搜索:“cache:www.yahoo.com.cn” , {1 J# B# ~" Z0 Z7 a, ^* v
# @; N s3 `) W- ^: |( m2 K9 x( `/ m结果:这是 G o o g l e 内 http://cn.yahoo.com/ 的页库快照。 . h5 t, t, v! Q9 w. n
) {9 g) m- L! U# S$ T# ~
G o o g l e 已先预览各网站,拍下网页的快照存档。 * W" P. g$ J+ c- I+ g. C3 z2 G- g, c5 V
这网页可能有更新的版本,请按此查看新版。 / T9 L8 r% P A3 e0 E4 `; U1 d% R# L4 ]# s
Google 和网页作者无关,不对网页的内容负责。 ) v* [; E% K: d1 ?