- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563311 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174216
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
第10章 数据的统计描述和分析 ( S2 ~5 g- R8 m4 W& i
详细资源请下载附件% | m9 x, y7 g p# w7 `! g
. f( m: a- f. W/ G. U1 {& ^# ]
数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计
, z2 E6 c3 J( ^# G以概率论为基础的一门应用学科。
; q+ D7 k: S! N# i; t: r; h k: m数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息' f6 K. v% V+ e5 W) |' D, F8 ]
数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,% Y" v# E! i. A) x6 _
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的5 z" I7 l! v# X" M1 L
础,实用性较强,在统计工作中经常使用。
( m& R1 N7 C! h3 i9 C面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计) D9 d& r$ l+ C2 ?* g) y8 K
的最基本方法。
, ^' ?' ?( S/ x4 N7 N我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析
~: m) G7 X s9 f1 `" E§1 统计的基本概念* Q6 ?& d3 z- J* I
1.1 总体和样本
' Y9 \) ~8 D9 W: A6 K1 ?2 J总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及
6 s) G, R+ w) e. `1 k$ H废品分类),学校全体学生的身高。
$ g/ ?2 Z Z1 p总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如
4 s- P+ D- i$ T. J8 R9 q# ^件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 170
5 D! i7 R- H4 _ u6 ~从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学
3 B& h0 L: C& ]1 b4 i6 e生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,
0 s5 l4 B' s! t5 m不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。
5 C9 H, c9 G6 }9 k6 l简单地说,统计的任务是由样本推断总体。" X) m5 F7 V! \6 c, G' y. j1 s
1.2 频数表和直方图7 |/ }+ O4 Y* z1 s
一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这
; g! v0 |+ ]0 J3 x$ R& G2 i6 q组数据的一个初步整理和直观描述。
3 l5 D/ [& {$ P: X9 `将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次9 E0 I9 M0 A7 q1 ]. d$ P
数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一# Y; l) B/ i9 }- {/ \' k
个阶梯形的图,称为直方图,或频数分布图。
& F( Z! _, z+ A ]6 k/ V" x6 c若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助' B: O& q% q0 \! |( h* E1 E
Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。' b3 F8 `8 W/ d+ Y, }
例 1 学生的身高和体重
4 L# k/ ]! c- X学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表1 V, M) r, R( Y9 Y) x
表 1 身高体重数据
0 ?( g' Z( h" f ^身高 体重 身高 体重 身高 体重 身高 体重 身高 体重
. r; W' Q5 s# q* s' S172 75 169 55 169 64 171 65 167 47) @" V) u1 }$ z' R% k
171 62 168 67 165 52 169 62 168 65! ?0 X' X" j" q2 q6 J; N8 m$ o
166 62 168 65 164 59 170 58 165 64/ y+ F; k' E: r" G8 }
160 55 175 67 173 74 172 64 168 575 J9 S1 I4 b, R( r4 r
155 57 176 64 172 69 169 58 176 57
( ^+ E9 [: F( |* }173 58 168 50 169 52 167 72 170 571 x( Q; ~- T4 x$ q
166 55 161 49 173 57 175 76 158 519 K, _0 D8 y4 \9 P) o- c: U/ r' X
170 63 169 63 173 61 164 59 165 629 S/ N" t* \1 ^; W* c" _
167 53 171 61 166 70 166 63 172 53
( c% a4 q3 H& v X173 60 178 64 163 57 169 54 169 665 j1 E& o+ s7 O( N/ k
178 60 177 66 170 56 167 54 169 58
u# U" {9 Y, d- w; f173 73 170 58 160 65 179 62 172 50 C. _2 H3 u3 P$ d) q
163 47 173 67 165 58 176 63 162
2 _8 W+ Y) @0 N( C8 A5 i& Z6 L9 G# h" n( p
" H2 k. c" q* x8 r |
zan
|