- 在线时间
- 1302 小时
- 最后登录
- 2026-4-11
- 注册时间
- 2022-2-27
- 听众数
- 34
- 收听数
- 0
- 能力
- 90 分
- 体力
- 175729 点
- 威望
- 9 点
- 阅读权限
- 255
- 积分
- 55571
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1837
- 主题
- 1208
- 精华
- 4
- 分享
- 0
- 好友
- 35
TA的每日心情 | 奋斗 2025-12-21 09:15 |
|---|
签到天数: 626 天 [LV.9]以坛为家II 网络挑战赛参赛者 - 自我介绍
- 我是普大帝,拼搏奋进,一往无前。
 |
你好!我是陪你一起进阶人生的普大帝!愿你成才!祝你成长!+ N7 \5 t4 @6 ?, ~
为大家更新一些算法类的辅助资料,大家在想学习时,或者比赛急需时就可以按照对应的名字找到对应的算法,加以应用了。大家按照下图所示箭头处点击主题,就可以查看到其他算法类内容了,或者搜索框内输入算法大全,也可以搜索到对应的贴子,本篇为第37篇。本课有案例有代码,主讲 SPSS在统计分析中的应用。0 z8 X# l% r2 I, o
![]()
5 q( z: D: U/ u' hSPSS 在统计分析中的应用 # S6 z/ U- A5 j4 k1 m, f8 r. {, a
§1 SPSS 软件基础+ L6 S( r6 s `5 `: G- h
1.1 SPSS 概论$ \+ h d" b0 Y8 J2 L- e: f: E. T
+ O; O# Q" l v
进行统计分析时,设计到的变量和样本数据很多,计算量很大。靠手工方法进行统计计算是不现实的,不借助于计算机难以实现,只有计算机才能快速得到精确的结果。在微机上使用的统计软件有许多种,在实际工作中应用比较普遍的主要有 SPSS、SAS、TSP、EViews、BMDP、TPL、CENTS、DET、SP、SARP、Excel、Lotus 1-2-3、Matlab、S-plus、Minitab 等。
! n) ~9 v% A+ A6 gSPSS 是英文 Statistical Package for the Social Science(社会科学统计软件包)的缩写。20 世纪 60 年代,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件 SPSS,同时成立了 SPSS 公司,并于 1975 年在芝加哥组建了 SPSS 总部。20 世纪
2 P" u1 _9 w: L) j7 w/ l; F) o80 年代以前,SPSS 统计软件主要应用于企事业单位。1984 年 SPSS 总部首先推出了世界第一个统计分析软件微机版本SPSS/PC+,开创了 SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。SPSS 名为社会科学统计软件包,这是为了强调其在社会科学应用的一面(因为社会科学研究中的许多现象都是随机的,要使用统计学来进行研究),而实际上广泛应用于经济学、社会学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域。' N# J0 t& C" w( | Y- j; c) O' ^
SPSS 现已推广到各种操作系统的计算机上,它和 SAS、BMDP 并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS 软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之
! o) w& R1 K$ q6 Y9 \ ?2 d+ Y- s高。
' S9 e& J& ]% K7 Q: D/ WSPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、二阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。
) p8 g/ L6 g1 |9 ]; a) ?( ~4 J
, k# o: X- w8 ^SPSS 运行方式灵活,主要有四种方式:
3 @8 `% I4 y; |& B% l(1)批处理方式) b& U. w* [( r8 m
(2)完全窗口菜单运行方式( n% a& c8 t- W+ u9 o x1 n1 b
这种方式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。& z: @) V) Y7 [1 |% ^1 g' r; c0 i
(3)程序运行方式" s, ^9 t7 `: G0 D( v a
这种方式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(Script)窗口中运行程序的一种运行方式。这种方式要求掌握 SPSS 的语句或脚本语言。
& P: c2 c5 |0 {3 t(4)混合运行方式
4 U) [' z; Z: s$ ]) y9 ^混合运行方式指以上各种方法的结合方式。
; M. S( n# J6 `8 |. f1.2 SPSS 基本操作 x: N& c7 [5 m$ c! B2 y7 ]5 s
使用 SPSS 进行统计分析时,首先要录入数据或者打开一个已经存在的数据文件,根据需要进行数据转换;然后选择合适的统计分析过程,选择统计分析所采用的方法和参数;最后分析 SPSS 输出的结果,并保存结果。3 Z- s# M/ j I4 w
1.2.1.数据管理(Data Management)
v2 L; F4 A' p; Y( f1 g8 D0 R启动 SPSS 后,出现的界面是数据编辑器窗口,它的底部有两个标签:Data View(数据视图)和 Variable View(变量视图),它们提供了一种类似于电子表格的方法,用以产生和编辑 SPSS 数据文件。Data View 用于查看、录入和修改数据,Variable View定义和修改变量的定义。如果使用过电子表格如 Microsoft Excel 等,那么数据编辑窗口的许多功能应该已经熟悉。但是,还有一些明显区别:(1)列是变量,即每一列代表一个变量(Variable)或一个被观测量的特征。(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在 SPSS 中称为事件(Case)。(3)单元包含值,即每个单元包括一个观测中的单个变量值。单元(Cell)是观测和变量的交叉。与电子表格不同,单元只包括数据值而不能含公式。(4)数据文件是一张长方形的二维表。数据文件的范围是由观测和变量的数目决定的。可以在任一单元中输入数据。如果在定义好的数据文件边界以外键入数据,SPSS 将数据长方形延长到包括那个单元和文件边界之间的任何行和列。如果要分析的数据还没有录入,可用数据编辑器来键入数据并保存为一个 SPSS 数据文件(其默认扩展名为 sav)。0 r+ K5 J5 [) D" J+ R& W
1.定义变量
6 B% ^2 m% {& m: I1 g) [输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式,步骤如下:单击数据编辑窗口中的Variable View 标签或双击列的题头(Var),显示变量定义视图,在出现的变量视图中7 M! ^) V5 u2 N4 G: b8 [) n8 r" t& a
定义变量。每一行存放一个变量的定义信息,包括 Name、Type、Width、Decimal、Label、Value、Missing、Columns、Align、Measure 等。
# l, j8 W# p$ T7 X( h9 X/ ~& h$ X) C(1)Name:定义变量名4 B' N; M5 b4 _, A% f4 Z5 P
变量名必须以字母或字符@开头,其它字符可以是任何字母、数字或_、@、#、$等符号。变量名总长度不能超过 8 个字符(即 4 个汉字)。
' P1 k4 x2 d$ t* [# T2 A( l(2)Type:定义变量类型3 e) `8 l: E7 |( }! b
SPSS 的主要变量类型有:Numeric(标准数值型)、Comma(带逗号的数值型)、Dot(圆点作小数点的数值型)、Scientific Notation (科学记数法)、Date (日期型)、Dollar(带美元符号的数值型)、Custom Currency(自定义型)、String(字符型)。单击 Type相应单元中的按钮,选择合适的变量类型并单击 OK。
, h2 d6 n) R3 Q m! `(3)Width:变量长度: X3 n- `5 A3 s4 i+ `# L* I3 I
设置数值变量的长度,当变量为日期型时无效。
2 a+ P4 {1 B0 m* R# Y% p( [(4)Decimal:变量小数点位数
. K6 E* L" z: S* Z5 h2 h( G设置数值变量的小数点位数,当变量为日期型时无效。
) Z. u' Y" v4 ~& s" e( k(5)Label:变量标签5 d0 p. P+ B( U0 z
变量标签是对变量名的进一步描述,变量只能由不超过 8 个字符组成,8 个字符经常不足以表示变量的含义。而变量标签可长达 120 个字符,变量标签对大小写敏感,显示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。) _' L+ A/ m8 Z2 r
(6)Value:变量值标签
e( p' a7 z0 Q/ l9 ^值标签是对变量的每一个可能取值的进一步描述。% Y: z' q6 Z- [; w% u& z) u- v$ R
(7)Missing:缺失值的定义方式. R$ F* r) w& S# [
SPSS 有两类缺失值:系统缺失值和用户缺失值。在数据长方形中任何空的数字单元都被认为系统缺失值,用点号( • )表示。SPSS 可以指定那些由于特殊原因造成的信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测: c. e& `" o; b' Y f; e; Z
被特殊处理。默认值为 None。单击 Value 相应单元中的按钮,可改变缺失值定义方式。8 G5 w3 J3 L* a; I; f& n2 S
% v$ [0 X g; `! E! l/ [
|
zan
|