$ R$ s, U0 C- C/ ?$ h" o假设检验的基本思想 5 k- y V; c; D K& U) b L对总体数据,定义一个待验证的假设记为H1,对其样本数据,定义与H1相反的假设记为H0。先假定H0成立,则可以在该样本数据上计算其发生的概率,若概率特别小,则说明H0假设不成立。那么相对的,H1假设成立,验证了H1为真。+ z% Q6 w/ M) |
其本质为:小概率反证法0 \" U( B/ H8 a0 [! r, f+ S
' G o# J0 n9 m! B' Y
——“We can not reject the null hypothesis.”% Y- g7 v: r$ `- A n# G A2 P+ h
- O" \$ C; Z+ i) y7 g
如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0。这是基于“小概率事件在一次实验中几乎不可能发生”这样一个人们在实践中广泛采用的原则。因此,要支持一个假设H1,可以针对其相反假设H0通过一次实验中小概率事件的发生来否定H0。“小概率事件”的概率越小,否定原假设H0就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平(significant level)。, ~( g* Z- z3 P$ ]" G2 S
* |- W4 Y. t) G; a关键词释义: ' {9 N- n% z( p/ B' WH1:备择假设,是研究者想收集证据予以支持的假设。一般为对总体数据需要验证的某一假设,即验证的目标。 M3 n. ?8 E; u% ?, O7 ?6 ]H0:零假设,又称原假设,是研究者想收集证据予以推翻的假设。一般设立在样本数据上,设立一个与备择假设相反的假设(对立假设,alternative hypothesis),用于假设检验。即类似反证法里的先给出一个相反的论点。$ Y' p7 F+ n9 Y; e. u. c. I
显著性水平(significant level):由于统计学中有随机性参与的数学计算,因此区别与代数中的“等于”,用显著性水平来划分属于“等于”的差距范围。; ]/ C# l' P. M N
显著性差异(significant difference):当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的,比如一些一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。常用 P>0.05 表示差异性不显著;0.01<P<0.05 表示差异性显著;P<0.01表示差异性极显著。! o' A# C5 o% Z' a
第一类错误:原假设为真,但我们由于“等于”的差距范围选择的过于严苛,而拒绝了原假设。即「拒绝了一个真的假设」,可直接用显著性水平alpha来表示,alpha = P(拒绝H0|H0为真)。 ; w8 A% D: ^8 c6 h第二类错误:原假设为假,但我们由于“等于”的差距范围选择的过于宽松,而支持了原假设。即「支持了一个假的假设」,由 (1-显著性水平alpha) 来表示,记为beta,beta = 1-alpha = 1-P(拒绝H0|H0为真) = P(支持H0|H0为假)。* N+ ]( }! h) P
检验统计量:检验统计量是根据样本观测结果计算得到并据以对原假设和备择假设做出决策的某个样本统计量。它实际上是对总体参数的点估计量,但点估计量不能直接作为检验的统计量,只有将其标准化后,才能用于度量它与原假设的参数值之间的差异程度。常用统计量有均值、方差、协方差、相关系数;常用的检验统计量有t统计量、Z统计量等。: U: M% x* @; M+ c& X+ Q* o: ^, ?
P值(P-value):1 Q! K; q4 {4 o/ q