- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563304 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174214
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
|
第10章 数据的统计描述和分析 - V( F, B0 D3 a& X' O" E% D4 ?
详细资源请下载附件 Q$ D( I- ?0 }1 G- S1 a) g
T8 F% d) V7 y/ q- v
数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计
3 l& ^, i# K9 I& M* x以概率论为基础的一门应用学科。2 t$ e, f- T+ Z, [1 P, q8 V% w
数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息
# d f6 G, i& f) ^& G数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,3 D& _- V$ ^+ g8 E! a/ B( s2 R
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的2 g4 @# s+ [1 S
础,实用性较强,在统计工作中经常使用。
3 Q @+ v3 ]2 }2 _* D" h2 T面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计- W( S/ J5 y! @, P5 g, i; p
的最基本方法。
: U7 r- ^! ~' }+ Z我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析7 S8 n: a$ u; C! V7 t/ _4 o; T) J% X
§1 统计的基本概念' N7 Z9 O% ]; o: Y( Z z
1.1 总体和样本
; C* E0 t2 N3 @7 i* Y1 N6 _! N& _总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及# Z0 N# U( [) g/ T4 P0 g, R9 \8 ]
废品分类),学校全体学生的身高。
2 r' g- J2 h3 s总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如7 t3 f7 x1 t- N. V0 U& G
件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 170
& [" Q+ @: s% T8 m0 ~从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学
- B0 C/ ]% Z8 D) b6 C7 b: a: }# T生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,
, `! f# a/ h6 M" ^- j: ]不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。' R" D- X5 d8 p8 k' Z# r( v
简单地说,统计的任务是由样本推断总体。$ e4 Q! L$ {/ s0 k" u& X
1.2 频数表和直方图
' s1 b6 B( ^/ B$ [一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这
: g( ?+ e8 Q& D5 O5 @组数据的一个初步整理和直观描述。+ v" v! r$ P6 S3 H8 m; l
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次
: v$ I- }+ s9 ]% ~# Y& K数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一% E$ D4 t/ {" m9 t: i
个阶梯形的图,称为直方图,或频数分布图。9 k& g! K0 i/ D3 A) S: R# I; z8 H
若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助: r+ U0 i$ e9 ~% t# c0 z
Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。, ~( c8 X3 h I
例 1 学生的身高和体重
/ ?) U2 U/ b! Z* M7 ^; z学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表
2 V, K8 s: Z1 F" g/ |/ G' U表 1 身高体重数据2 h& G, K: L& E4 ^4 Q: l% p
身高 体重 身高 体重 身高 体重 身高 体重 身高 体重2 h, T7 s% c3 y; m- I
172 75 169 55 169 64 171 65 167 47
; |1 @+ M1 {& x6 |) R171 62 168 67 165 52 169 62 168 65% u+ n% h, i' Y
166 62 168 65 164 59 170 58 165 640 B5 q! J( y6 g, O" D4 ]& m0 w
160 55 175 67 173 74 172 64 168 57% u! q4 u( g, e3 t0 m
155 57 176 64 172 69 169 58 176 57+ a9 v1 r/ c9 d$ H, [) a1 K
173 58 168 50 169 52 167 72 170 57( k3 W8 y( ?2 Y$ V
166 55 161 49 173 57 175 76 158 51
" i5 }9 @+ V. D0 b% F) l& N# ?170 63 169 63 173 61 164 59 165 627 u5 u0 D+ w c+ g7 S, c
167 53 171 61 166 70 166 63 172 533 N, |* W& Z3 K
173 60 178 64 163 57 169 54 169 66
3 \) [* d# I" X# ?178 60 177 66 170 56 167 54 169 58
; I8 _* V( n% z- J5 Z z173 73 170 58 160 65 179 62 172 50& [% i. s2 ]. D6 t9 U
163 47 173 67 165 58 176 63 162
" d" Y' c3 P8 A0 X! e3 w
/ ~( b- W: |+ L8 c! a0 r8 O4 V
6 b+ J6 ^/ @; _' a |
zan
|