- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563302 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174213
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
第10章 数据的统计描述和分析
& [9 ]- p, g$ W) W详细资源请下载附件$ }9 a( j2 i" ? f4 |4 v
5 J2 d# L2 m3 F+ Y' g! ~数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计0 {, V6 }0 z+ i/ z v
以概率论为基础的一门应用学科。
4 U0 b2 X# F/ g数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息
% o5 E8 `+ g' Y$ a& Y5 `1 k数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,9 o b0 i' U8 Y% J2 e
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的: z! S7 T( j1 _) s- J
础,实用性较强,在统计工作中经常使用。
/ s6 R# A% _) n9 D面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计
0 j. R0 F. s7 ~1 l+ e1 w4 B的最基本方法。' E; w% D. v4 g I% ?
我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析
' J* E" z! c2 X# a8 Q# Q0 A§1 统计的基本概念: w% S7 ?5 c, F1 |5 ~
1.1 总体和样本
. s, B% \, t) Z. P* z2 M5 S总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及
9 B/ T: C! c7 [废品分类),学校全体学生的身高。
" C, d6 R" f2 v! {总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如( @( ^8 }, t" B/ w) ]" H+ y8 d
件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 170/ [, n* ?1 |( y0 X5 L
从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学7 z) ?. [0 \- T5 r9 p
生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,1 ~5 h5 \) e; }- j) j O
不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。
K, k/ W5 w1 H简单地说,统计的任务是由样本推断总体。
5 K8 e: g' W. t, ]1.2 频数表和直方图1 v. r5 i: _$ W) f* ?
一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这* m9 o( s" _/ T4 b/ }# b: U& o
组数据的一个初步整理和直观描述。
0 d6 t: a% s# b2 C% y* O7 O* z# d# Z将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次, C7 }: @0 x9 z4 ]
数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一0 U# S% u1 V4 ^7 o) _
个阶梯形的图,称为直方图,或频数分布图。
1 @' G* C/ @: c" u若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助
! U. {3 w& V8 E+ RMatlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。2 D& Y2 B$ d7 w8 D4 c
例 1 学生的身高和体重
' H; C0 w( |8 L3 |学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表
; M* k6 v, G4 W, r表 1 身高体重数据
) }4 {* B% i4 B; B8 K; E身高 体重 身高 体重 身高 体重 身高 体重 身高 体重
, Q" p! G1 q* k- q" g5 U2 {9 ^172 75 169 55 169 64 171 65 167 47% ?* t: t* o q- }, H: @6 @
171 62 168 67 165 52 169 62 168 65
6 Q0 Z5 }: \6 [- F+ n6 h166 62 168 65 164 59 170 58 165 64( T* a: E* I1 p
160 55 175 67 173 74 172 64 168 57& n" K5 X* e, {7 H* G* m8 i' x; B
155 57 176 64 172 69 169 58 176 57 @& M) d1 Z- y
173 58 168 50 169 52 167 72 170 57
6 I+ H+ ~. t P166 55 161 49 173 57 175 76 158 51% V, }6 @9 O: l5 P# x7 a
170 63 169 63 173 61 164 59 165 62% N; T* w* c! m; S5 O* C' ~! T
167 53 171 61 166 70 166 63 172 53
: E0 T! U$ ~8 O7 J3 a. ~2 ]8 k173 60 178 64 163 57 169 54 169 66
0 s B. E' u' y: \178 60 177 66 170 56 167 54 169 58
. w s! c7 y' C5 I; A173 73 170 58 160 65 179 62 172 50' P. B: @3 z0 j- K" K* R1 w
163 47 173 67 165 58 176 63 162
! ~7 @7 l- t" P m2 ?5 q# F L" [! X6 A/ o- R: \7 v6 {
& _* @; Q+ Q3 R8 e |
zan
|