随着速度越来越快,计算机的功能越来越多,计算统计功能反而已经成为了计算机的一个次要部分。不过,对于我们这些从事社会学学习和研究的人来说,快速的计算和统计仍旧是我们使用计算机的主要功能,所以我们平日的工作总是离不开SPSS(Statistical Package for the Social Science社会科学统计软件)。SPSS虽然好用,但是学起来并不容易,特别是在目前高校的教育体制下,教材的过时以及课程设置的不合理,使得SPSS的学习成为了社会学、统计学以及其他社会科学学科学生极为头痛的一件事情。更为棘手的是:往往在学生还没有学会SPSS之前,一些调查研究任务却又强迫他们使用SPSS进行分析工作,使得他们十分 苦恼。4 ]; F" n: y' _1 {4 ? ) Q/ f+ l/ Z! C- X6 L& Q5 [; R" | d7 M 本教程就是为那些已经学习过统计学,并且粗通计算机,但尚未学习过SPSS的社会科学学科的学生准备的,运用面向问题的教学方法,通过一个调查问卷的具体分析过程使学生们对SPSS有一个感性认识,并能够再没有完全掌握SPSS的前提下利用SPSS完成一些分析任务。因此,本文不强调面面俱到只强调读者能够完成调查分析的任务,所以会故意忽略SPSS一些十分重要但未必会用到的功能,还请读者见谅。如果读者确实需要使用这些功能,建议参考一本好一点的辅导书。9 \/ ^# l2 r6 P' S7 Z) u* I8 N: N 相信大家知道:依次完整的利用计算机辅助的问卷调查包括问卷设计、问卷访问、数据输入、数据分析、数据输出、调查报告的撰写六大部分。SPSS软件参与的主要是数据输入、数据分析和数据输出这三个部分。接着,本文就将分成这三块,分别介绍SPSS的使用以及一些技巧、经验。5 ^ U O; @. t + j2 Z2 B& |1 d1 \0 F" r 数据输入% {( Z, x3 `9 @: w: Q" y' `" o 在完成了问卷访问这个部分之后,我们手中便拥有了数百至上万份调查问卷,这些问卷计算机是无法直接识别处理的,我们必须将它们进行适当的编码。由于采用计算机分析,问卷在设计阶段就应该考虑到今后的编码问题,所以应该将问卷设计地以客观题为主,被访问者填写的应该只是注入数字、选项这些计算机能够处理的信息。我们首先要为问卷的每一个填写项都起一个代号,并决定它的数据属性(主要是区分为字符串、逻辑串还是数字)。笔者的习惯是首先用英文字母表示填写项的大题号,接着用阿拉伯数字表示填写项的小题号,然后再用英文字母表示填写项是本小题的第几项,最后再加上表示数据属性的后缀,比如说第二大题第三小题的第四个字符串填写项的代号便为B3D_S。在以后的所有分析过程中便利用这个代号来表示数据的具体内容。2 Q0 B+ g; W K1 g 接下来,便是具体的输入过程了。首先,我们要对SPSS的数据文件有一个大致的了解,这对以后的学习十分关键。打开SPSS之后,我们便会看到一个类似EXCEL电子表格的东西,但如果你因此便把SPSS的数据文件理解为是类似于EXCEL的东西那么就错了,虽然SPSS数据的表现形式酷似EXCEL,但就实质而言它更接近于一个数据库文件,每一个数据列都有它的列名称(也就是我们刚刚起的代号)、列属性(也就是刚刚我们决定的数据属性),这些都类似于数据库中的字段名称、字段属性,如果读者以前学习过数据库的相关知识,那里理解起来就十分简单了。9 _+ n5 F4 c2 M* T1 I# r, m( J 4 C# U) e8 |5 e1 {4 t 由于数据繁多,所以我们的输入过程往往不是由本人进行,而是请专业的数据录入人员代劳,而那些人员往往是不会使用SPSS的,所以我们在实际使用过程中数据往往不是在SPSS中输入的,而是在其它软件输入完毕之后利用SPSS导入的。' t* _+ i5 K8 K5 _. E& Y# { 在这里,导入用的文件格式是十分重要的。也许大家会习惯性的去选择使用EXCEL来录入数据,因为EXCEL与SPSS比较像。但是在笔者的实际使用过程中发现,最好的文件格式不是EXCEL的XLS文件,而是XBASE系列的DBF文件。之所以作这样的选择理由有两个:第一、DBF文件的字段名、字段属性这些在SPSS导入过程中都会被直接利用,可以略去了SPSS之后的列名称、列属性设定工作。第二、EXCEL的XLS文件的具体格式并没有向公众公开,所以在实际使用中XLS文件中的中文信息时常会发生丢失的现象。 ! v3 M9 L7 e% D! z! O4 P 在利用XBASE输入完文件之后,我们只需要调用SPSS的菜单FILE下的OPEN功能,选择DBASE数据格式打开文件,然后再另存为SPSS的SAV格式便完成了数据输入过程。接下来我们便要进入最为重要的数据分析这个阶段了。# d( X0 }' L5 P 数据分析5 j4 p7 Z: p5 @* c9 _. n5 X3 m 对于外行人来说。SPSS最为难学的部分便是它Analyze菜单下十多项子菜单以及这之下四五十项孙菜单的统计功能,每一项统计功能的用法和功能对于外行人来说就像是天书一般。但是对于学习过统计学的读者来说,这应该不是问题。再加上SPSS在操作的简易性上还是十分优秀的,每一项统计功能一般只需要在窗口下选择统计用的变量,然后设置一下必要的选项,最后按下OK便可以了。所以在这里,具体的操作就不再介绍了。在这里,笔者觉得有必要先介绍一下SPSS的Viewer。在下面的数据分析和数据输出过程中,我们调用SPSS的数据分析和制图模块所得到的结果都会由SPSS自动输出到一个名为Viewer的程序中,并且可以以SPO为后缀名保存成为专门的文件。这样做的好处是如果你的分析和制图工作一次没有完成,那么利用保存的SPO文件,就不必下一次重新作过了。同时,将所有的分析和制图的结果都保存在一个SPO文件中,并随调查报告作为电子附件一起陈送给客户,一来有利于客户检验分析的可靠性,二来也适合于今后电子化、网络化的趋势。0 F* f) f5 i$ u# }* M: P 根据笔者的经验,SPSS的学习者在这一阶段最主要的问题在于以往学习的统计指标总是中文的,而SPSS中的统计指标是英文的,指标的中文和英文往往无法一一对应,因此,在这一部分中,笔者主要是附上一张统计指标的中英文对照表,如下:! h6 c9 E5 r& ]4 i1 t/ w ' _5 B! j- i0 }# j6 g Summarize菜单项 * z$ U3 n- k; a5 i7 O+ `, g9 R 数值分析过程$ f; t! Y8 {5 @ ……Frequencies子菜单项 $ Z& N+ t1 N5 W 单变量的频数分布统计 ……Descriptives子菜单项 1 ` Z8 |4 g0 l" E 单变量的描述统计6 g r& d5 F; l- O2 W 5 T" f# ]% e0 {5 K3 ]* w ……Explore子菜单项 7 T" C$ C' K& J+ w/ L0 k. q) y % y. M) }1 c% I4 ? 指定变量的综合描述统计' M( @7 y7 F! Q9 E6 `4 n/ i ……Crosstabs子菜单项 5 D3 Q! J r. W5 R2 F0 S2 C# Q3 D 双变量或多变量的各水平组合的频数分布统计$ S+ R- F; l7 x( I* h4 G. Z Compare Mean菜单项 . K; [$ X3 z9 F t1 x7 X+ ^: y2 U 均值比较分析过程) W' D) q5 H' H; { ' |( M5 `3 I# _* o: y0 }2 [5 \ ……Means子菜单项 7 {! p2 {* B$ w( I5 W # k) Z/ S! t% e; R7 V7 ^2 y* ~( Z! ? 单变量的综合描述统计' n L. a3 W" K, j8 j' ] W( } " l" \% O' c& l8 ^2 B* g ……Independent Sample T test子菜单项 ! G( }2 n, \+ e5 a, e* _& z 独立样本的T检验1 Z: a9 e/ u% u) m% w" a* i 3 a& o- x! E; O0 ` ……Paired Sample T test子菜单项 2 f1 v, L0 v9 ] 0 @; r6 q* h8 j 配对样本的T检验' `8 e" \! M/ K5 |5 [ 7 Y" Z2 n; w0 X2 b0 R# c/ J ……One-Way ANOVA子菜单项 4 r. ]6 o: A5 S; o5 r$ M 一维方差分析(单变量方差分析)' `& c/ L* P) L6 G ; A W" u; N, l9 o2 P- @ ANOVA Models菜单项 # [. x. N, L) U" u% u0 I5 H. L 多元方差分析过程 ; ]9 H. @+ ^1 F9 f; k9 @7 L ……Simple Factorial子菜单项 因子设计的方差分析 ……General Factorial子菜单项 - z! k6 `' S, j ' W7 H+ k" d" K# r4 {/ h& k 一般方差分析) V" a" V# G! x9 a1 Z ……Multivariate子菜单项 : F7 S& L# L' {4 f- s/ O 双因变量或多因变量的方差分析! T" d/ v. c/ @* i9 M d6 S7 j" F# L$ J ……Repeated Factorial子菜单项 因变量均值校验; F# A- [* l# t) n , I. N, F+ i. ?' U5 m) T% a* T Correlate菜单项 相关分析& ` e6 ^+ q+ q! G( J2 } 2 k3 ~8 E4 R8 r ……Bivariate子菜单项 ' G V: g9 d" U7 @' a " S; Q1 q2 R) { Pearson积矩相关矩阵和Kendall、Spearman非参数相关分析4 K( F+ i6 c& ?& a' V0 P1 M ……Partial子菜单项 8 V8 d% |" \8 U 双变量相关分析7 H+ p' a* g8 j; A2 k ……Distance子菜单项 0 w; C* K7 L3 s: m" _1 } ' ]5 \, F5 Z/ i1 F& U 相似性、非相似性分析# G$ Y+ w0 `0 f. m$ u0 U; S3 X Regression菜单项 9 N i5 f$ W: @, H+ {4 a$ \ 回归分析3 E+ Q9 C; Z1 E0 \4 B/ K, e # t: o. Y' Y- S, v% k6 p: U ……Liner子菜单项 . h7 z: b @0 S3 R% s+ d4 P ! s& ]& t2 i1 O 线性回归分析 ) _: E: Q: g; E2 S% g% f ……Logistic子菜单项 3 }# `0 k% T( X# E ( K& {4 G+ f" e+ [2 [% Y. u 二分变量回归分析(逻辑回归分析)" @1 P$ |3 u5 l e5 }" N9 C9 R w. ` ……Probit子菜单项 0 M& E3 H. @8 _. ~4 Q7 a 6 U% P; V6 i4 x 概率分析 9 m7 b/ x6 d7 |0 @3 H" s2 @ ……Nonlinear子菜单项 / T; W& z) S0 _, A' M- Q5 K 非线性回归分析 & p- F/ T) o6 G' K9 B3 H ……Weight Estimation子菜单项 不同权数的线性回归分析 ! }/ z4 Z: P# Q$ @/ A0 q% x7 m% j ……2-stage Least Squares子菜单项 4 g- \% B1 e+ { 二阶最小平方回归分析- o& p: T# s/ N0 C% o4 n / ^6 l5 j" `. r$ M6 w Loglinear菜单项 , [; Z( `) Y3 e$ r+ C8 w 对数线性回归分析: V9 Y0 b) ^+ Z, Q# ~- N( q% T% Y + L7 k' r9 k5 {- L( H: v ……General子菜单项 : W+ |+ R2 f+ K6 k* A! G 一般对数线性回归分析 ]! T& s F& @! O! r8 F! E 2 U9 H4 L5 H- {$ q ……Hierarchical子菜单项 ( G, e+ p- ^4 m( E& b7 p 多维交叉变量对数回归分析6 j# I. t. d8 ?% v1 V/ Y* X / u/ u. T0 I) g' C- L* m" y1 W ……Logit子菜单项 单因变量多自变量回归分析 6 s$ r6 o- j7 b/ Z Classify菜单项 聚类和判别分析 : s) m, C ]- H1 F! c6 [! [( t ……K-means Cluster子菜单项 2 l! U7 p. H! c& r/ v+ D 指定分类数聚类分析 - f' ~6 ^0 {( R; V ……Hierarchical Cluster子菜单项 未知分类数聚类分析6 W" J( X+ L5 b c 4 E0 d( O" M" c' {/ t ……Discriminent子菜单项 8 d* y6 Q7 S0 s- q- e 聚类判别函数分析! n `# @$ F7 j6 K( c% I9 O Data Reduction菜单项 & K( c, s9 D. q+ N5 ?- ` 降维、简化数据过程 5 w6 W' z) P1 C8 b# k* B( _ ……Factor子菜单项 因子分析4 ], ]- N7 e, _ p! I J, @& C9 S ……Correspondence Analysis子菜单项 3 ~4 b( F4 G: J K; [) v 对应表(交叉表)分析 $ ]& T0 v P- E3 T$ I! f- j ……Homogeneity Analysis子菜单项 / g' r" `( j3 f! P* n# i7 V8 o& T# C 多重对应分析 ……Nonlinear Components子菜单项 9 f) P8 c( t. v * A v. M; E/ j# {; h4 u: v2 t 非线性成分分析( c5 e+ x: I8 U% v! F' e7 q2 s * |' b( R! u5 r* H ……OVERALS子菜单项 ! G9 C; Z* g; y: M 非线性典则相关分析- X) |, M3 n- K3 U" G* v9 } Scale菜单项 3 O5 g! R9 c. z3 Y) z+ k1 T , k( o9 F, j/ E; r& l o5 ^3 R4 v% E( K8 A( S# o! D ……Reliability Ananlysis子菜单项 ) B& s' h9 r5 }$ ^9 a; V6 e) m 加性等级的项目分析' q1 h( @9 g7 {/ R w3 B' j8 U ……Multidimensional Scaling子菜单项 8 [5 ` i! |/ o, E# M 多维等级分析3 M8 V3 `, }% ^9 x T% W- b Nonparametric Tests菜单项 # ]7 g j4 f$ ~$ o 2 d! P3 C, ^6 X* y ……Chi-Square子菜单项 ) A4 ], z4 v: H9 y( @- F z* Z. H 5 v& ^, t% z$ x* s) z7 S8 l 相对比例假设检验$ X3 h" W% g; f5 t# q 9 o) G/ k% K/ c5 _ ……Binomial子菜单项 & j/ T; K$ \8 F( ^. ^4 K 特定时间发生概率检验 # P' n. F4 p. w& E/ J+ b+ T+ O ……Run子菜单项 ; X" U& J2 e" R6 \1 u 随即序列检验 ……1-Sample Kolmogorov Smirnov子菜单项 样本分布检验 ……2-Independent Samples子菜单项 6 h/ o% Z4 N! ?; H7 T0 W9 v1 h# Y# d , w+ P) U1 w/ w0 d, ^ 双不相关组分布分析 ……K Independent Samples子菜单项 多不相关组分布分析 2 r; L& R4 C& T( P: p. [' V" O ……2 Related Samples子菜单项, F/ ]7 @- G7 `5 l" s6 k' O ' K: {. k' m5 E# l 双相关变量分布分析2 m( i* B# I' p, ?0 R ……McNemar’ test子菜单项 相关样本比例变化分析1 x4 r) F/ b( v ……K Related Samples子菜单项 ; y& C! n: I: y$ q1 I& S 相关变量分布分析- w. m. h! ]# p1 v' u: H* d ……Cocharn’s Q test子菜单项 二分变量均数检验 # {" y2 A3 j5 C I1 M" U' U ……Kendall’s W子菜单项 一致性判定 Time Series菜单项 " m% `$ L- Y( Y: D p 9 S& L6 h7 \& L! t8 E2 g7 ]: U M, [3 a/ S, t/ ]; J$ A3 u ……Exponential Smoothing子菜单项 / |5 W9 U6 @, X$ g' u( o 平衡序列的随机分量 ' F9 T2 o1 h1 l Y* E% l K& @ ……Curve Estimation子菜单项* O K. H4 O% D+ I2 @2 j/ [ 数据拟合6 b4 }3 H5 j+ t& L 6 S: V2 U) \* V' _: j& r ……Autoregression子菜单项' B b7 h8 _0 D/ h% Q) H 7 _9 G$ L% p- \2 H! X9 ?: v 一阶自回归误差线性方差检验+ F$ N' H" h% m/ x1 s5 J 3 k& y7 c7 N3 p5 U ……ARIMA子菜单项 6 V. |' K- j8 W 综合自回归移动平均分析 ( v; r! |# q& {) z! `& O ……XII ARIMA子菜单项 ( ] ^7 Y% {1 j1 a. w$ j 增倍和加性季节因子分析- x5 [) u! E1 ?0 g ……Seasonal Decomposition子菜单项 `( ?/ P% U O: Q0 i 对时间序列增倍和加性季节因子分析 Survival菜单项 1 a1 ^# L# _2 [ - C/ T& Y, @4 C& P' j u( ]" k ……Life Tables5 k$ D) j! L- V: n8 G9 G K ; T# X" z% ~- Q* w% R j3 y 生命表分析3 s: m8 n; U; A5 y0 w " y+ ~; u& Y! j6 G5 T- G% A ……Kaplan-Meier# J: L& k8 R6 J K# ]" Y# T3 ~1 m 双事件分布检验 ……Cox Regression* Q/ |+ S5 k) J/ @# U# X2 h 事件与时间变量相互分析 ……Cox w/Time Deep COV+ O' R; p% g0 @' L5 n6 G) [: r 时间函数Cox分析 : S4 {4 a( ?8 L0 H9 j. m 有了这一张表,相信读者便可以很容易的利用SPSS进行各类分析了。实际上,数据分析这一阶段,就使用SPSS上没有什么难度,关键是在于究竟你能够怎样最好的利用SPSS提供的分析模块从数据中挖掘出更多的东西来,这可就要依靠你的不断摸索了。最后,还要介绍一个小技巧:" `8 J$ u3 v1 v( u ?0 a 如果读者所在学校今后学习的SPSS软件为DOS版本的话,那么今后你就必须利用命令行来驾驭SPSS,所以你在利用SPSS的Windows版本进行数据分析的过程中,可以利用每一项统计功能窗口OK按钮下的Paster按钮将本统计功能的命令行复制到剪贴板,然后再仔细研究。, O/ U& W T9 a+ z 数据输出 " S4 _. \7 m* G0 M 经过数据分析,我们已经得到了很多有用的结果了。但是单单是这样是不够的,只有我们将结果撰写成调查报考,才能为人所接受。所以,就很有必要由SPSS输出必要的结果来。 首先便是制图,数字很简洁很精确,但是不够直观,不利于读者更好更迅速的理解调查报考,所以我们应该将数据转化成直观的图形。SPSS的制图能力是极其强大的,能够输出的图形包括条形图、面积图、圆图、高-低-收盘图、极差图、距限图、排列图、帕累托图、工序控制图、误差条图、散点图、直方图、时间序列图、相关图等几十种。 + H+ N/ U, d/ K8 R) I2 g 虽然SPSS能够绘制的图形很多,但并没有增加我们的学习难度。事实上,大多数图形绘制需要设置的东西是大同小异的,这里就以最简单的条形图为例进行介绍。 6 [+ m0 i W3 |$ { 点击菜单中的Graph,然后选择Bar,便会弹出一个窗口让你选择条形图的图式,由简单条形图、分组条形图、分段条形图,根据你的需要,选择一个。然后按下“Define”,接着我们选择需要制图的字段,在条形图中只能选择一个字段,其他的图形根据图形本身的特性会有所不同。选择完字段,我们需要设置坐标轴,是按照百分比还是数字或其他方式绘制坐标轴。最后可以利用“Title”按钮设置图形的标题,最后按下“OK”,在SPSS的Viewer中便会得到我们需要的图形了。 按照以上介绍的方法,将所有需要的图形全部制作完毕,我们便要开始将图形和分析结果正式输出到调查报考中去了。 6 S7 B$ f1 D6 H/ }; _ 一般来说,我们会使用诸如WORD、WPS2000这类字处理软件来撰写调查报告,由于WINDOWS的剪贴板帮忙,我们只需要简单的利用“复制”、“粘贴”便可以完成输出了。2 `: b6 R# M$ g& R6 P0 S, e- v 1 m( E: M, d+ b4 x" ` 值的一提的是,SPSS在输出上为我们考虑的十分周到,可以选择以图片或RTF格式输出。如果你希望将分析结果和图形以图片格式输出,那么选择你需要输出的结果或图形,然后按下鼠标右键,在弹出的菜单中选择“Copy Objects”。如果你希望将分析结果和图形以RTF格式输出以便于在字处理软件中进行进一步的编辑,那么在刚才弹出的菜单中选择“Copy”便可以了。. g7 ^9 g7 f" x" s. `5 a- `8 A& c0 I 至于这两种方法孰优孰劣,就必须是具体情况而定了。以图片输出的方式虽然牺牲了进一步处理的便利性,但是由于SPSS软件本身便已经具有了一定的标准性,所以它输出的分析结果和图形自然具有一定的权威性;而以RTF格式输出的方式,我们可以将分析结果以及图形中的英文信息替换为中文,并进行必要的增删以增加可读性。如果调查报告的委托人并不熟悉英语或并不是社会学、统计学的专业人士,那么这样的操作就极其有必要了。2 O( P, `, T0 u 好了,洋洋洒洒五千余字,终于将SPSS在社会调查中最最基本的使用方法介绍完了,看完本文,相信读者已经能够利用SPSS进行最最简单的调查分析了。但是千万别得意,千万不要忘了,SPSS终究只是一种工具,它只能够加快你在社会调查过程的的进程,如果要想写出一份优秀的调查报告来,还是要依靠你自身的不断努力哦! |
| 欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) | Powered by Discuz! X2.5 |