数学建模社区-数学中国

标题: 第10章 数据的统计描述和分析 [打印本页]

作者: 杨利霞    时间: 2019-3-22 16:09
标题: 第10章 数据的统计描述和分析
第10章 数据的统计描述和分析
' Z- _2 S  h! K7 Y7 d
详细资源请下载附件  W1 r5 R! c) W( a$ `

# V# q# O7 P: P* K( F数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计+ ~1 O6 D0 D" Y/ [
以概率论为基础的一门应用学科。
( y0 B$ d) o/ o# j! m6 u数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息
3 P; z& `8 A8 u- D$ N% r( S( O+ b0 g8 [数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,7 f! }, y$ H; ]& q
使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的: A) A5 a& m5 P$ Z( c  I
础,实用性较强,在统计工作中经常使用。# |/ I5 v' {3 S2 K0 Z8 h; S, D
面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计
: K5 X" l+ H9 I5 M; G$ ^; f8 q的最基本方法。
4 E1 o" }- Z- \1 p我们将用 Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析
2 L% L. ?4 F4 n" i§1 统计的基本概念/ v- g0 N8 c8 Z
1.1 总体和样本4 _& _# @' }5 r/ k0 S
总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及
0 F8 Z  O4 K/ ~( N废品分类),学校全体学生的身高。4 A: Z/ J/ n* v# T
总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如
* S- o% g: H# w9 }+ D! v; W件产品是合格品记 x = 0 ,是废品记 x = 1;一个身高 170(cm)的学生记 x = 1707 C) r0 V' q9 l' C! x* [$ N2 x4 t" U. t
从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100 名学
' h) J+ V7 `+ o% v7 P生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,/ H, F( f4 j7 ?5 T
不妨记作 n x , x , , x 1 2 L ,n 称为样本容量。+ b' N/ R- T1 X  d6 j9 Q- B6 d. Z
简单地说,统计的任务是由样本推断总体。
9 r2 L3 k1 [' I* a1.2 频数表和直方图
- `" B3 m  r0 l% A/ C8 W一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这
$ y: J3 X! S# s+ j. _) m% b1 l组数据的一个初步整理和直观描述。( Z% u4 P4 a2 N7 x9 b8 D# h- F
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次
2 Z, ?5 H- ]+ k* H' X数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一
! Q( T8 b6 M3 u0 U# g2 d8 o% e个阶梯形的图,称为直方图,或频数分布图。$ x. S" b- U8 ^8 y& n! D
若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助
. D( L4 \8 M) D* p, c9 iMatlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。- F5 a4 W# f) g# T, T. Q1 ]
例 1 学生的身高和体重0 V8 X# f3 {, g* \; G' I
学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表0 d, n0 w! _3 N0 j4 ~" m- c
表 1 身高体重数据( z9 g4 u6 J; d' B% K
身高 体重 身高 体重 身高 体重 身高 体重 身高 体重1 w6 i2 w( ^5 Z8 P
172 75 169 55 169 64 171 65 167 47& q  t( G* Z  _
171 62 168 67 165 52 169 62 168 650 o3 ~$ s" c. T5 e/ E
166 62 168 65 164 59 170 58 165 64, C* [5 U; `3 c" B9 o( z0 \; S
160 55 175 67 173 74 172 64 168 57
: N# g2 d+ {6 B155 57 176 64 172 69 169 58 176 57
9 o0 n3 A1 [+ H3 }173 58 168 50 169 52 167 72 170 57
, r9 K5 N6 J9 z* [; ^% f166 55 161 49 173 57 175 76 158 51/ M7 r+ s) ~3 M" W9 z5 S
170 63 169 63 173 61 164 59 165 62$ |: ]1 a- b2 ^3 I) i/ U/ b. @
167 53 171 61 166 70 166 63 172 53
( u' d8 x- D9 d0 l: \; g173 60 178 64 163 57 169 54 169 66; i, ?+ L) Q* k  L- P5 b  M
178 60 177 66 170 56 167 54 169 58
, U+ s( z/ r& ]0 y3 ~173 73 170 58 160 65 179 62 172 50- P0 `# W& i  _5 H, t" l9 v' j
163 47 173 67 165 58 176 63 162
1 R, r$ f& U9 N, R2 J" h5 P
. e6 ]; h( q; n3 R
& d5 }8 q, o/ ~

数据的统计描述和分析1.png (301.87 KB, 下载次数: 587)

数据的统计描述和分析1.png






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5