3 ]1 P5 ? ?4 C3 b- Y8 C: [! m5 DAbstract : ?. R$ f5 C# @ G Z4 I7 e5 l* M& s2 t" R- h
In this paper,the influence of the least squares estimates for the multivariate linear regression models under the restricted conditions is discussed,and multivariate restricted W-K distance and Cook distance is defined as measures of influence.Their distributions are given,and the relationships between the restricted W-K distances and the generalized correlation coefficients are also established. ' R( L3 O. w ^1 [1 |; O/ {- Q1 d y5 _' A8 c8 J2 B# h# R- J$ N
考虑多元线性回归模型 . U# J/ ]. I8 ~. w& ]0 J- r" Y8 k# g1 M9 S3 o. m3 c
Yn×p=Xn×mBm×p+En×p, (1)4 Z( {8 @3 Q+ m+ q) T0 O0 W
: ]) }+ L' d' l
其中Y=(y1,…,yn)T为因变量的n次观测数据阵,X=(x1,…,xn)T为第一列元素全是1的已知自变量设计阵且rank(X)=m,B=(β1,…,βm)T为回归系数矩阵,E=(ε1,…,εn)T为随机误差阵,ε1,…,εn相互独立,且E(εi)=0,Cov(εi)=V(i=1,…,n),V为正定阵,则由[1]p348知模型(1)中B的最小二乘估计(简记为LSE)为,协方差阵V的无偏估计为,其中P=X(XTX)-1XT,残差阵为。然而,在实际问题中,由于主观和客观的种种原因,人们或多或少对B有些先验信息。即是说B总有一定的约束。 - ~ ~. i/ W; S: e$ ? J 记模型(1)在约束条件AB=0(A为q×m阶行满秩固定阵)下的模型为模型(2)。. M6 s6 g7 h8 X9 W
由[1]知模型(2)中B的LSE为,其中F=AT[A(XTX)-1AT]-1A,协方差阵V的无偏估计为,其中W=YTLY,L=I-P+Q,Q=X(XTX)-1F(XTX)-1XT,残差阵为。本文约定,若A=0,则F=0。 2 S* _! z1 y3 ?# r 考虑在模型(1)中剔除k个数据点后所得的一新的多元线性回归模型。 0 O4 q1 }& a# G! n% M% @ & r2 m$ d; O& p Y(I)=X(I)B+E(I), (3)% R' m. \! X" W8 T0 R/ b/ u8 z
3 B; q! S1 H7 O7 x) N这里Y(I),X(I)和E(I)的意义同[2]p350。 ; v9 G9 F& o4 x! y1 R 记模型(3)在条件AB=0下的模型为模型(4)。 2 m- b0 R2 g* S8 o: L8 H5 K( |, F% E记模型(3)和(4)的相应估计量分别为,,和,,。" A! N" U% M2 e: f
对模型(1)剔除一组或多组数据对回归系数最小二乘估计的影响问题现已有许多学者做了大量研究工作,并得到了许多很好的结果,见文[2-5]。文[6]对模型(2)在p=1的情形下讨论了约束W-K统计量与广义相关系数之间的联系。本文对多元约束线性回归模型(2)考虑了类似的影响问题,§2将文[2-7]的结果推广到模型(2)的情形,得到了更一般的结果。 7 B7 z1 x0 K& ? R 0 a' e/ l. F: I6 ~4 o( s B; N/ X1 预备引理3 _" S) L b2 V5 u- P* R. k
$ l7 ?9 W% ~0 l2 z% k& m" G' X% w 引理1 在模型(4)的条件下,若E(I)的各行向量均为正态随机向量,且n>m+p-q+k,则5 Z, x, I$ U3 ]" W4 w# `+ l
①! Q+ p1 z* B) w: p' ~' n
* f0 Y1 S, a6 {. u+ l: ~) W ② 相互独立, ( H; B6 H, N% E/ N( h2 a E7 b. g ③' o" P* ]5 q/ ^1 @0 _7 {
) O' j8 x& D3 I$ O# Q8 x& C: Q) y
DTX,YI=DTY,D=(di1,…,dik)为n×k阵,dij为第ij个元素是1其余全为0的n维向量。, c& \2 z$ T z1 t
证明 用同[6]完全类似的方法易得①成立。现证②,记R=L(I)Y(I),则 / Z" n i4 i: }3 m( H# w0 c" N+ O+ P0 _* O+ X( G
& R% g* Q/ x* K& `5 z 0 Q- J5 E- E1 [7 u/ H& Y由文[1]知和R独立和Vec(R)独立4 {/ c& m; {; Z$ I/ l8 ^; ?
。而后者是显然成立的,故和R独立,从而与独立,即得②成立。最后,由W1=YT(I)L(I)Y(I),L2(I)=L(I),rank(L(I))=n-m+q-k,L(I)X(I)B=0,及文[1]知③成立。 " d% D7 D! {. _1 j% u- \5 Y1 Q, q. z# U9 \$ ~( @7 Z# H% _
证毕 $ K$ S3 ^$ r! i) }& [4 M1 h % @! I) \6 q: J/ N1 X3 R! p. \ 引理2 对模型(2)和(4),若记且假设E的各行向量均为正态随机向量,且n>m+p-q+k,则 0 }7 U8 ^) W; [% z ① W1与W2相互独立,且W=W1+W2,W2~Wp(k,V),W~Wp(n-m+q,V),+ i& M. M9 F; o0 L, J
② 7 @" b* _" R( p3 k+ o7 @" z F3 G. ^# r
特别地,当k=1时,+ O; B- T7 W) ?4 J1 H
证明 记L1=L[I-D(DTLD)-1DT]L, L2=LD(DTLD)-1DTL,W1=YTL1Y,W2=YTL2Y。则易证W=W1+W2,L=L1+L2。由此即知L1和L2都为投影阵,且rank(L1)=n-m+q-k,rank(L2)=k。因rank(L)=rank(L1)+rank(L2)且LB=L1B=L2B=0,故由多元Cochran定理知①成立。 " W4 D ?: Y% ]3 e$ r0 Q. T: \ 由Wilks分布的定义及①和引理1③知②成立。# w# D& L5 E7 u9 W( [, q
" z3 `/ X1 B. B! K* A# U, @+ G& b5 B
证毕 ! `: p! k1 @; l) f% J1 o' V, q* { ]" F* e J7 b# o" {2 主要结论0 j9 I/ B! d4 _( k+ Y7 B, {
( S' g) f) d: `& R 定义1 对模型(2),称3 v- Z+ ~4 ?% q; P+ g" S