- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 554968 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 171863
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
第10章 数据的统计描述和分析 Y: Y: q# v" z7 Q
详细资源请下载附件 W! U& ^6 R. A0 `' }2 P' a& t% n
* }) X) P1 u6 u5 q/ I1 J6 T" @数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计
* v5 a, L ~2 z; { |9 ]5 c以概率论为基础的一门应用学科。
0 E8 [7 S+ W0 ~# i, W; O数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息. n) R6 K5 T0 L# G3 n
数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,# H3 Y/ I1 C2 u$ G1 W; U" }' v/ n
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的6 k4 I) ]9 f. i! J* ]1 k* T
础,实用性较强,在统计工作中经常使用。: c+ q: ^1 ~2 @
面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计% ?+ ~) u) t" w
的最基本方法。! _8 y/ f2 Z- X! v; C
我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析( J+ {/ ~( g( B; B: A6 I$ k
§1 统计的基本概念8 S( Z. H# T/ i; M1 f( e
1.1 总体和样本- Z: G- R5 x3 q8 C, C/ i% G5 L
总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及
5 X" m7 C7 _; j0 z0 Q) Y废品分类),学校全体学生的身高。: h8 w5 G# N. N
总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如
5 M; x- l' f! K3 u. X6 u4 x件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 170( P, G1 V f& i( k) A3 g
从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学
, ]+ Z! I; d/ T O' `0 {4 w生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,/ H. ?5 c2 C6 m7 ]0 O+ G# \6 n
不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。3 e3 v/ t2 d, c: p4 I/ j
简单地说,统计的任务是由样本推断总体。
/ g6 I% \. y Z1.2 频数表和直方图8 L) N* F- `, I; z* s" C& Q: ^
一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这$ J. u% }* z6 k5 f. c! l# ^$ V
组数据的一个初步整理和直观描述。6 G y2 ^4 j0 a3 h; r4 O
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次# f* j# {0 A d( v* J) ?( M" Y
数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一' ^3 e$ Q j# [! l" j# K) X4 P
个阶梯形的图,称为直方图,或频数分布图。) S- Z+ U) H- H ?1 y
若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助
! r# ]6 D L5 H9 {' M! ~Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。
) w2 _* T# c7 p例 1 学生的身高和体重
+ x0 n& @) t5 u# s. w& D学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表& T* _$ s5 E1 m5 `
表 1 身高体重数据
! a8 B) t: F2 B( G, j$ K2 H身高 体重 身高 体重 身高 体重 身高 体重 身高 体重5 {2 k4 Q$ X& C3 c0 u+ t
172 75 169 55 169 64 171 65 167 47$ ?, X" p& c: z) Z" ?
171 62 168 67 165 52 169 62 168 654 [% O. ~ D# K9 I# E
166 62 168 65 164 59 170 58 165 64
1 {4 p0 ^# @, A8 [& t160 55 175 67 173 74 172 64 168 57& {7 M* a a6 p* ?
155 57 176 64 172 69 169 58 176 571 g3 x) B: r3 o4 G* u6 h" r/ @/ T
173 58 168 50 169 52 167 72 170 57; w* ?" T5 k; I5 }
166 55 161 49 173 57 175 76 158 51( u5 S. ~% L! p% j' y' `
170 63 169 63 173 61 164 59 165 62
; Y4 l+ H, c8 i% _! M5 U# q: G167 53 171 61 166 70 166 63 172 53) p8 `: _+ v; H" {8 |+ C
173 60 178 64 163 57 169 54 169 66/ S9 T6 \/ ?+ G4 S3 D4 P& |
178 60 177 66 170 56 167 54 169 58. p9 Z9 a& k8 ^# j. U, z: O( w
173 73 170 58 160 65 179 62 172 508 h! r4 i. n: |* a
163 47 173 67 165 58 176 63 162 ! J' X' x8 w% V/ o8 r a; _4 d
M/ y& k; X% ~0 W$ K" H
% @ R1 y3 n f2 v# d [
|
zan
|