- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563437 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174254
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
第10章 数据的统计描述和分析 / e9 @' A1 w l3 k' h
详细资源请下载附件, C( g' U, T% y* A1 m
$ s5 U) @* G* T; b) K2 J, z数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计
; ^: V* \" s( r以概率论为基础的一门应用学科。
9 d. G2 ^3 X( l3 p# W4 U数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息
8 e; X! i; w4 J+ w数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,
% j' r5 Q. c" w1 j; K# I使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的
! ^1 L9 N9 w2 }7 P% C6 y础,实用性较强,在统计工作中经常使用。
; V0 N# \- Q1 L0 Q面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计: o- ^' ^- h9 Q) K
的最基本方法。
5 O8 i8 H6 {- k2 C) Y U: O# \我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析
1 k6 W3 s$ J: A9 X" Z9 t§1 统计的基本概念
0 x9 l- v" L1 J1.1 总体和样本
0 a* R9 X+ k& g+ T% s总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及
5 {. ~2 r+ o" P- \废品分类),学校全体学生的身高。
2 d' [3 w4 d, K* {+ W总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如
# L3 K( c7 @# o$ E _8 E$ R件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 1706 j' K6 f+ [1 i6 i k
从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学! q, f2 D `, p8 @% p, f9 E3 D' m6 {
生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,
( k; w% `. d, t! \9 P9 t不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。
; C% c, |9 O1 \# a, u B: G简单地说,统计的任务是由样本推断总体。
l4 M) |, _) |7 l- H- o1.2 频数表和直方图
) f% f1 l, n6 m4 a0 v7 H一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这& {! g0 v X- q
组数据的一个初步整理和直观描述。8 O7 ]; X4 d- h. p# \
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次7 P$ B/ Q0 e6 J# d' Y
数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一; e& i m! r& q
个阶梯形的图,称为直方图,或频数分布图。' ]/ a8 R! ^0 [# H1 u
若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助/ V: o/ n: A% J! j$ a, \+ u
Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。
3 P. Z' i Z: G6 T9 m& ^7 o, {5 p例 1 学生的身高和体重) I7 r! U y$ u' i* h% S7 e
学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表) I3 d: h8 |, E i# Z
表 1 身高体重数据
6 t3 [4 Y3 d8 B R身高 体重 身高 体重 身高 体重 身高 体重 身高 体重' v9 ?/ C1 @8 ?7 p) {: A
172 75 169 55 169 64 171 65 167 47! l% J" ~; N3 g. ?% R) S6 Q
171 62 168 67 165 52 169 62 168 65' F, t+ Q4 m* S0 k" U/ `
166 62 168 65 164 59 170 58 165 64
p w; Y' A' c. u160 55 175 67 173 74 172 64 168 57
% H/ f& Y( f0 [- Z+ w, A155 57 176 64 172 69 169 58 176 57; c7 I0 g4 p. c1 o+ N# _+ ]
173 58 168 50 169 52 167 72 170 57
; M, I# M5 p7 l+ v- h166 55 161 49 173 57 175 76 158 51
5 a( U: v4 k4 _$ ]4 C6 |) b2 K170 63 169 63 173 61 164 59 165 62 J# m/ }: B8 l M2 F( }6 R
167 53 171 61 166 70 166 63 172 53
' r+ I) ?/ D! r$ S- H$ @ {# k173 60 178 64 163 57 169 54 169 66# n+ N0 m' ?# Z
178 60 177 66 170 56 167 54 169 588 X! @2 G7 X7 t7 P8 f" |
173 73 170 58 160 65 179 62 172 50/ ]& X3 ~% O+ H0 b* {7 h6 Q
163 47 173 67 165 58 176 63 162
3 F7 W+ K7 R/ L
- b$ J& T6 n8 Y# n* ?
! y- [; u _! x) I: K |
zan
|