- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 555703 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172084
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
第10章 数据的统计描述和分析
" b- k" @0 N* e, B. N7 G/ U详细资源请下载附件& q7 `( @& F* K3 c2 u* L
) s, O' T9 J+ H; `! h& w' {数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计; t2 N7 z/ S( [$ q
以概率论为基础的一门应用学科。
/ a' u3 G' V6 i9 {数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息% d8 \/ }1 b5 L K4 H& y% n- G
数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,
/ ]; {& f* ? U, r& g使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的
8 m7 i9 F) @$ ^/ D) J) T% }础,实用性较强,在统计工作中经常使用。
, O+ Z3 u* G2 P: g7 J$ p面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计+ U' I- W9 f$ R Z
的最基本方法。( F) L }1 E7 k% ~+ t, U' y" D
我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析" ^$ Q/ v4 n6 A5 O8 ]* C
§1 统计的基本概念
) R; q- D* h1 `1.1 总体和样本
& Q& U; t/ }3 d+ b总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及( _) {. O- N" g
废品分类),学校全体学生的身高。
`' | k8 d& o$ o) S+ j总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如6 `" V$ _+ f, D8 V! q' p* K
件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 170
, `8 o) L7 X8 w3 T, F* w从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学" `/ M9 _6 D& k
生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,
1 C4 w1 g2 r' N) t3 U N不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。5 |! A7 b4 p+ A' o- z
简单地说,统计的任务是由样本推断总体。* U. z7 ~* K D5 M& k
1.2 频数表和直方图
" |0 G. \; J: U$ E% w( H一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这
4 J+ k5 _- O0 L1 e b- [- n- P! r组数据的一个初步整理和直观描述。
; U+ J+ G# \' z I( H将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次# u; j# j- f& r7 _5 w. p
数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一" q. B( `6 Y+ D8 x* l9 m! V
个阶梯形的图,称为直方图,或频数分布图。
) o% D" d, |$ F若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助
; @7 h/ e7 Y2 o! a0 e2 s/ @Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。6 p- t! Z, z( D/ V* A; u
例 1 学生的身高和体重* c& }8 ]. ~9 j3 r! D
学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表$ x& g; q& q$ u/ g
表 1 身高体重数据
+ k. [7 E6 v4 z' w! l1 p身高 体重 身高 体重 身高 体重 身高 体重 身高 体重
?/ Q& k3 R) x' o9 Q172 75 169 55 169 64 171 65 167 47
9 ]1 \0 c& U# T1 s- P& |6 m171 62 168 67 165 52 169 62 168 65+ P5 T/ L2 g" w* H- y7 P: y
166 62 168 65 164 59 170 58 165 640 d4 U2 [4 v* c' |$ t+ w
160 55 175 67 173 74 172 64 168 57# I( C" o* w' }% p1 h- B
155 57 176 64 172 69 169 58 176 57
! A# O( i9 }7 K) O: V$ E3 h2 A173 58 168 50 169 52 167 72 170 57
% J+ O$ v4 m8 a$ |. [ H166 55 161 49 173 57 175 76 158 51
7 U" A6 m5 y9 c6 b0 H170 63 169 63 173 61 164 59 165 62! x! @8 g$ }8 Q6 i
167 53 171 61 166 70 166 63 172 53: V5 j" u2 ]( @
173 60 178 64 163 57 169 54 169 66
& i' j: t% ~6 n( s$ E178 60 177 66 170 56 167 54 169 58
$ ]* B1 M4 u/ K' s173 73 170 58 160 65 179 62 172 50% `+ ]8 Q/ `4 ]
163 47 173 67 165 58 176 63 162
& Q* Q& w7 ]9 X G8 i4 p2 P* M- [
" l* `: O- j2 w E9 W: y4 ]0 }# [! {' l# m- {
|
zan
|