- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563356 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174230
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
第10章 数据的统计描述和分析 * [* L; ]1 b& w# S) y+ F! j
详细资源请下载附件
% G7 Q) @; ~( [" P# Z5 t
% B/ d' E& N% y# w/ \0 V, e数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计% @* p/ I7 S- O
以概率论为基础的一门应用学科。, Z( v/ V- @4 @+ b) m
数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息
1 d& o* s/ A$ R- \6 \/ U' l! v数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,/ ~" B% T% p! K, Z* E; l
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的
8 H6 ~' \( `; Y2 Z, f5 C础,实用性较强,在统计工作中经常使用。' ^/ I( m3 n$ i, @
面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计3 e) O8 t9 m7 ]1 I. S7 p& M4 C
的最基本方法。
+ G x$ b2 `) c0 `& _* |( W我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析! F3 K; V( Z0 D6 `7 t
§1 统计的基本概念
P: y) M- `7 B# K1.1 总体和样本
4 N' S2 B! {. [总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及
t5 W& T, B; Z废品分类),学校全体学生的身高。' c; E) A- o, O) c! V0 N2 B
总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如
( G. B" ]" y( p8 Q1 T. q6 j7 A件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 1705 s+ w- K$ ?: {; n; j# `
从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学% P8 G0 v' f4 \$ q1 k7 m, d% e5 F
生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,; x1 M$ t9 g% x$ Y% V
不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。
* I& Q+ x. v( T5 S2 l! \9 |简单地说,统计的任务是由样本推断总体。. ?9 Q0 z( r4 D+ n# A" x7 o
1.2 频数表和直方图
O& Y- o- k8 |9 d2 M一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这. q# L5 e! c* x
组数据的一个初步整理和直观描述。, w- T# p: \0 y. k/ G; v: t5 z2 x! s* Y
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次
6 {* o2 G( J; U数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一2 G/ Z: l1 \' _: r; f3 I5 C
个阶梯形的图,称为直方图,或频数分布图。
) Q. M3 |! }6 _# @" c若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助/ _4 f' \9 g4 O# y! u9 t
Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。! k. f. O! i" q, N4 F) M. l
例 1 学生的身高和体重
2 f2 @+ \. G' A学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表/ I6 ~# G$ q7 a' M
表 1 身高体重数据
5 @; z" c P5 \身高 体重 身高 体重 身高 体重 身高 体重 身高 体重7 P0 a2 {0 f$ T
172 75 169 55 169 64 171 65 167 47# B: T; b- [+ i2 f9 f2 F' h
171 62 168 67 165 52 169 62 168 65" c1 y9 }( b0 i' f4 h
166 62 168 65 164 59 170 58 165 64
9 d& O# t4 B2 z6 }& ]; D$ H160 55 175 67 173 74 172 64 168 57
2 l' y2 @' o2 H& j* ~, B9 }) M5 Z155 57 176 64 172 69 169 58 176 57
1 X( q5 G9 X A173 58 168 50 169 52 167 72 170 574 J+ _1 `& ?: M7 f( j. i% }
166 55 161 49 173 57 175 76 158 51
! m2 X* {% Z- L9 {170 63 169 63 173 61 164 59 165 62) a( q5 Q; x7 j" }
167 53 171 61 166 70 166 63 172 53
9 R! \7 |1 N4 R. c% C6 R% Y/ j173 60 178 64 163 57 169 54 169 665 e5 c$ L% Y5 L2 K4 F) R" G
178 60 177 66 170 56 167 54 169 58
+ S: @8 M8 p& ~: P1 x173 73 170 58 160 65 179 62 172 509 X i3 I, I4 x, k' c$ E
163 47 173 67 165 58 176 63 162 ! q1 q& a9 E6 j/ C& T5 i9 E* k& ?
2 Q& _; ]- j( l7 q: w
; A3 t; e2 c6 c& r |
zan
|