- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563310 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174216
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
第10章 数据的统计描述和分析
) R4 O) x8 P! h* c; M* l4 X详细资源请下载附件4 W( V- i% s. p$ q3 i6 U
" i4 w* G" P( B数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计7 @- C c; V! n9 Z$ q8 n
以概率论为基础的一门应用学科。
. [3 Q# ^$ P$ z V# F数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息# M7 q$ G/ Z% Z* m! U/ L0 J3 p
数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,0 Z4 ^- d) \* T& |; w: y0 S+ h
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的7 A. N& b1 \/ W0 v& n" b( ~
础,实用性较强,在统计工作中经常使用。) H( z5 p2 A! p2 x+ D
面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计8 U% @! p1 _0 h, O3 f' x
的最基本方法。
* ^" n: g* u5 e7 E我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析! L. e) t, H3 A6 P4 Y
§1 统计的基本概念7 k2 G# R9 S8 J
1.1 总体和样本* S# t+ @% {+ N% s* A
总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及5 v6 @0 v& x! k' F
废品分类),学校全体学生的身高。 {) R F2 p+ m2 x5 _% a
总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如
- E7 V7 |5 M9 ~5 F# |. o. Z件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 170
; l! E* E# k# |8 O( |9 Q8 k3 \" M$ {从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学
) x8 U$ [' F( B2 I+ J2 B+ u) M生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,9 t$ A& D9 N' U/ F( B- i
不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。
4 v' U; {2 a9 V+ i4 T6 k9 k简单地说,统计的任务是由样本推断总体。' F, R+ Q3 i0 h- ?" ]
1.2 频数表和直方图
: t/ R" G+ F( D( W) b) f一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这
! j8 B: F8 a( I& N0 _. a; y组数据的一个初步整理和直观描述。/ j# c* G5 p* U
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次
! E! p X& p {8 J" i数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一
6 r& |/ V: x u U个阶梯形的图,称为直方图,或频数分布图。
9 p2 @ {' B7 W, |. g# k2 V若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助: v8 b$ e# G k$ p
Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。1 t0 z& @* l: ~$ s; L: p! L
例 1 学生的身高和体重
! M. [7 @4 C3 e$ H" b$ g% f/ x学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表
4 f6 R' h" a* U$ F- l7 ^表 1 身高体重数据, G, i6 X0 c, U9 r/ ?, q
身高 体重 身高 体重 身高 体重 身高 体重 身高 体重/ n7 p+ ^& T; r0 {9 n
172 75 169 55 169 64 171 65 167 47' F. L' j! t! P
171 62 168 67 165 52 169 62 168 65
1 d ?7 J3 e8 O3 b166 62 168 65 164 59 170 58 165 649 m( B: E" a, p
160 55 175 67 173 74 172 64 168 573 S4 _: v! H3 n) p ^* r2 f
155 57 176 64 172 69 169 58 176 57
% q. x( {1 F: `) @173 58 168 50 169 52 167 72 170 57 Y: v0 Q. m9 W" Y
166 55 161 49 173 57 175 76 158 519 U$ E9 e- \* I
170 63 169 63 173 61 164 59 165 62
, E' M# [- j7 k167 53 171 61 166 70 166 63 172 53- E" i1 _1 ?1 K$ k' K8 L, l
173 60 178 64 163 57 169 54 169 66
8 ^6 P0 r9 t# }- x( G178 60 177 66 170 56 167 54 169 58* w0 O* f& G @( K2 o/ b, m; m
173 73 170 58 160 65 179 62 172 50
" d6 c" W" L! V0 `163 47 173 67 165 58 176 63 162 0 ]/ L3 R, _1 O
]7 P% V9 E3 d) E4 [
$ B& u I; u4 V8 S: P! m3 a
|
zan
|