9 D( E ]5 |5 f! t, R) j随着速度越来越快,计算机的功能越来越多,计算统计功能反而已经成为了计算机的一个次要部分。不过,对于我们这些从事社会学学习和研究的人来说,快速的计算和统计仍旧是我们使用计算机的主要功能,所以我们平日的工作总是离不开SPSS(Statistical Package for the Social Science社会科学统计软件)。SPSS虽然好用,但是学起来并不容易,特别是在目前高校的教育体制下,教材的过时以及课程设置的不合理,使得SPSS的学习成为了社会学、统计学以及其他社会科学学科学生极为头痛的一件事情。更为棘手的是:往往在学生还没有学会SPSS之前,一些调查研究任务却又强迫他们使用SPSS进行分析工作,使得他们十分 苦恼。 ' A% @$ K$ k! X* g+ s3 M / U& C" x' i! S L5 J. X 本教程就是为那些已经学习过统计学,并且粗通计算机,但尚未学习过SPSS的社会科学学科的学生准备的,运用面向问题的教学方法,通过一个调查问卷的具体分析过程使学生们对SPSS有一个感性认识,并能够再没有完全掌握SPSS的前提下利用SPSS完成一些分析任务。因此,本文不强调面面俱到只强调读者能够完成调查分析的任务,所以会故意忽略SPSS一些十分重要但未必会用到的功能,还请读者见谅。如果读者确实需要使用这些功能,建议参考一本好一点的辅导书。% v' ^7 f' l) o- S
/ L. U3 M! ~9 I3 s. P9 j( q$ x
相信大家知道:依次完整的利用计算机辅助的问卷调查包括问卷设计、问卷访问、数据输入、数据分析、数据输出、调查报告的撰写六大部分。SPSS软件参与的主要是数据输入、数据分析和数据输出这三个部分。接着,本文就将分成这三块,分别介绍SPSS的使用以及一些技巧、经验。) J3 Y" G4 ]. e/ a/ a
& r2 F6 F" Z- F, a- u
数据输入 . `0 G V! s: e. A3 N9 _; Y" E7 c* }9 n" [) q
在完成了问卷访问这个部分之后,我们手中便拥有了数百至上万份调查问卷,这些问卷计算机是无法直接识别处理的,我们必须将它们进行适当的编码。由于采用计算机分析,问卷在设计阶段就应该考虑到今后的编码问题,所以应该将问卷设计地以客观题为主,被访问者填写的应该只是注入数字、选项这些计算机能够处理的信息。我们首先要为问卷的每一个填写项都起一个代号,并决定它的数据属性(主要是区分为字符串、逻辑串还是数字)。笔者的习惯是首先用英文字母表示填写项的大题号,接着用阿拉伯数字表示填写项的小题号,然后再用英文字母表示填写项是本小题的第几项,最后再加上表示数据属性的后缀,比如说第二大题第三小题的第四个字符串填写项的代号便为B3D_S。在以后的所有分析过程中便利用这个代号来表示数据的具体内容。! `7 k& ~0 {) b; |# k' B$ t
, m) j$ I% n: Z! w# g( n. ?! w
接下来,便是具体的输入过程了。首先,我们要对SPSS的数据文件有一个大致的了解,这对以后的学习十分关键。打开SPSS之后,我们便会看到一个类似EXCEL电子表格的东西,但如果你因此便把SPSS的数据文件理解为是类似于EXCEL的东西那么就错了,虽然SPSS数据的表现形式酷似EXCEL,但就实质而言它更接近于一个数据库文件,每一个数据列都有它的列名称(也就是我们刚刚起的代号)、列属性(也就是刚刚我们决定的数据属性),这些都类似于数据库中的字段名称、字段属性,如果读者以前学习过数据库的相关知识,那里理解起来就十分简单了。 l: j: @3 W5 l
; w) ^; t/ P; [- Z; L 由于数据繁多,所以我们的输入过程往往不是由本人进行,而是请专业的数据录入人员代劳,而那些人员往往是不会使用SPSS的,所以我们在实际使用过程中数据往往不是在SPSS中输入的,而是在其它软件输入完毕之后利用SPSS导入的。 + e% c9 R8 ?! f& i' v# ?) ` u# o" w: C
在这里,导入用的文件格式是十分重要的。也许大家会习惯性的去选择使用EXCEL来录入数据,因为EXCEL与SPSS比较像。但是在笔者的实际使用过程中发现,最好的文件格式不是EXCEL的XLS文件,而是XBASE系列的DBF文件。之所以作这样的选择理由有两个:第一、DBF文件的字段名、字段属性这些在SPSS导入过程中都会被直接利用,可以略去了SPSS之后的列名称、列属性设定工作。第二、EXCEL的XLS文件的具体格式并没有向公众公开,所以在实际使用中XLS文件中的中文信息时常会发生丢失的现象。 # t1 W9 u1 g9 i6 x ; J% G+ o0 W( s- G 在利用XBASE输入完文件之后,我们只需要调用SPSS的菜单FILE下的OPEN功能,选择DBASE数据格式打开文件,然后再另存为SPSS的SAV格式便完成了数据输入过程。接下来我们便要进入最为重要的数据分析这个阶段了。 3 _- k# @1 n! l/ N/ G8 x8 Q, |; B. y$ j* N/ q) e
数据分析- F" R9 H b9 U( p! v7 v
6 ~+ t! w# Q7 R$ _3 N
对于外行人来说。SPSS最为难学的部分便是它Analyze菜单下十多项子菜单以及这之下四五十项孙菜单的统计功能,每一项统计功能的用法和功能对于外行人来说就像是天书一般。但是对于学习过统计学的读者来说,这应该不是问题。再加上SPSS在操作的简易性上还是十分优秀的,每一项统计功能一般只需要在窗口下选择统计用的变量,然后设置一下必要的选项,最后按下OK便可以了。所以在这里,具体的操作就不再介绍了。在这里,笔者觉得有必要先介绍一下SPSS的Viewer。在下面的数据分析和数据输出过程中,我们调用SPSS的数据分析和制图模块所得到的结果都会由SPSS自动输出到一个名为Viewer的程序中,并且可以以SPO为后缀名保存成为专门的文件。这样做的好处是如果你的分析和制图工作一次没有完成,那么利用保存的SPO文件,就不必下一次重新作过了。同时,将所有的分析和制图的结果都保存在一个SPO文件中,并随调查报告作为电子附件一起陈送给客户,一来有利于客户检验分析的可靠性,二来也适合于今后电子化、网络化的趋势。2 L k; ]3 q! n' X; G5 h0 W
根据笔者的经验,SPSS的学习者在这一阶段最主要的问题在于以往学习的统计指标总是中文的,而SPSS中的统计指标是英文的,指标的中文和英文往往无法一一对应,因此,在这一部分中,笔者主要是附上一张统计指标的中英文对照表,如下: 0 F' q% \9 w8 R+ T( p: b$ r+ s0 o( n8 z/ k
Summarize菜单项 1 N6 G& K+ |; [. _* j# J9 t( r9 A# Z" W" M' h0 A$ m
数值分析过程" C& U- `# w* s; `
6 y: s$ w; I: i5 o! y$ L% H& E
……Frequencies子菜单项 - i; F* C6 B9 n: F: v7 K5 V8 x 3 R/ b! q) K; ?1 Q单变量的频数分布统计" z( k9 L+ i; L9 c
* A2 J9 |/ t, o; l% n+ \, T
……Descriptives子菜单项 $ d4 r' ~+ w4 v! q" m$ n% y) T- u$ P) g4 O5 G" U% r
单变量的描述统计3 S2 ^2 Q& }) L/ e( v
q0 q! u( n0 T3 u3 ]- l8 O% v……Explore子菜单项 * d* y: v/ Q% x" i/ }2 c3 B" j2 u* G1 t5 @1 Q
指定变量的综合描述统计 + C& Z5 |4 G, g5 i' z/ p 3 c, \9 \4 e7 Z……Crosstabs子菜单项 m9 V9 J0 Y7 g+ N% G, h( Y1 p; N
双变量或多变量的各水平组合的频数分布统计 5 e' w8 ~+ ^1 |: r P7 w* d# { 1 {) k3 W; B* l1 `+ R8 ]/ H4 @/ wCompare Mean菜单项 ; S3 ~8 _% b, m: E. {% d / g8 l3 L) |! J, w3 B6 V( A均值比较分析过程1 F- W8 }) M6 m% Y" X9 K' O+ e
5 q' C* s, m0 k7 L. M8 v
……Means子菜单项 I) P+ g) l' ~ i/ j( r7 G j9 U9 d! o
单变量的综合描述统计8 U' |, P; S K; ^& |/ B: i2 w
P( z: U+ e U) i1 qPearson积矩相关矩阵和Kendall、Spearman非参数相关分析 5 f( l! y2 |6 C8 [9 b ( C9 E4 Q3 W; o$ O3 L. g4 x……Partial子菜单项 9 g5 S$ c. F0 R# @4 ]: F* q 3 T3 Y; j( M9 w, F' a* J- M双变量相关分析 . ~8 s0 T! [6 E2 M0 l 7 i; @5 M g( u* q, @……Distance子菜单项 # v0 P/ ^) b, w5 ~
8 X$ x: d1 z" e5 M- z6 H7 u
相似性、非相似性分析 $ {. c7 B) V1 U6 `" d" I $ x1 T, `8 a/ S9 s6 Q" x. S k( bRegression菜单项 : B7 Y/ f- i" c1 K+ f9 ^
( p+ @ ~0 R+ a( s, y9 @4 d$ W回归分析2 q1 R; Q; d9 f( X+ n* M2 {1 A) m
0 r0 Y- y. v* A- w" M
……Liner子菜单项 " ~& [8 ~4 {" \- N
3 }# v: Y/ k& y( o8 q" q- w线性回归分析/ v% l' L* V2 q+ O$ K5 L8 \1 h% d
; n& k S. K4 N' @
……Logistic子菜单项 - w0 N+ ~3 {0 Y( ?0 y/ d/ b4 ~
9 ~( I/ q% f+ z2 K二分变量回归分析(逻辑回归分析)# S( V; D8 F7 _% D3 u2 h
$ u% }( J* z. [" T) `+ c) K
……Probit子菜单项 5 V4 {" A* b8 h0 O6 X" d 9 Z8 R# A+ v+ y+ x7 |7 l( w概率分析/ U+ D$ a' i. Q; K
0 n1 l) D/ n2 y. e7 x
……Nonlinear子菜单项 : h. p! o) g* K
. X3 H& e3 ~1 c* y& x r4 h
非线性回归分析) u9 p3 w6 a1 s' }- W5 u
4 O. M! n* E" H. v……Weight Estimation子菜单项 % r& \. i$ v; B: D. w3 X