& F3 ^/ r' l, l+ F/ \6 pIn this paper,the influence of the least squares estimates for the multivariate linear regression models under the restricted conditions is discussed,and multivariate restricted W-K distance and Cook distance is defined as measures of influence.Their distributions are given,and the relationships between the restricted W-K distances and the generalized correlation coefficients are also established.5 T: s6 e/ W& R1 m# s( S: [
6 R% ] f1 B) a) K, f* J 考虑多元线性回归模型 , m n5 G8 e4 N: P7 n r: C' c `! E# S+ h
Yn×p=Xn×mBm×p+En×p, (1)1 k2 _% J! G1 L- N$ U# w+ S q
7 w3 c+ U2 o- @6 r: J+ F
其中Y=(y1,…,yn)T为因变量的n次观测数据阵,X=(x1,…,xn)T为第一列元素全是1的已知自变量设计阵且rank(X)=m,B=(β1,…,βm)T为回归系数矩阵,E=(ε1,…,εn)T为随机误差阵,ε1,…,εn相互独立,且E(εi)=0,Cov(εi)=V(i=1,…,n),V为正定阵,则由[1]p348知模型(1)中B的最小二乘估计(简记为LSE)为,协方差阵V的无偏估计为,其中P=X(XTX)-1XT,残差阵为。然而,在实际问题中,由于主观和客观的种种原因,人们或多或少对B有些先验信息。即是说B总有一定的约束。& r7 I& j6 ~. ^' W$ R/ O& u9 H
记模型(1)在约束条件AB=0(A为q×m阶行满秩固定阵)下的模型为模型(2)。 . Y* T* I3 ~5 K& E" @/ a- m% F9 z由[1]知模型(2)中B的LSE为,其中F=AT[A(XTX)-1AT]-1A,协方差阵V的无偏估计为,其中W=YTLY,L=I-P+Q,Q=X(XTX)-1F(XTX)-1XT,残差阵为。本文约定,若A=0,则F=0。1 G0 i0 Z; Z# ]8 t. G
考虑在模型(1)中剔除k个数据点后所得的一新的多元线性回归模型。8 ]! `' \- P8 F: a& T V
" Y& X" n" }' t! e& K- h Y(I)=X(I)B+E(I), (3) 0 k e' N* V% H" K1 _" J$ K t1 B ; F0 L+ _! N2 ?% u; v8 q6 c4 ]3 G这里Y(I),X(I)和E(I)的意义同[2]p350。& |& m6 n8 Z7 m' ~1 X/ u: }6 d
记模型(3)在条件AB=0下的模型为模型(4)。 , P7 \, z& ~+ F: X记模型(3)和(4)的相应估计量分别为,,和,,。 - D" p+ N% x4 e# ~$ a. I8 K 对模型(1)剔除一组或多组数据对回归系数最小二乘估计的影响问题现已有许多学者做了大量研究工作,并得到了许多很好的结果,见文[2-5]。文[6]对模型(2)在p=1的情形下讨论了约束W-K统计量与广义相关系数之间的联系。本文对多元约束线性回归模型(2)考虑了类似的影响问题,§2将文[2-7]的结果推广到模型(2)的情形,得到了更一般的结果。- \+ X$ D: Y7 T- x# y0 V
% d, c3 W. d1 l7 r2 `1 预备引理& P% e2 n& s" w q
1 R. D) C d. n- [- \$ |7 O
引理1 在模型(4)的条件下,若E(I)的各行向量均为正态随机向量,且n>m+p-q+k,则9 U" [, Y. B* q# L" C3 b7 g
① " V; ~5 H2 m7 ^% J+ ^+ H % E" k0 U" T9 p) A; e; M' E ② 相互独立, 2 g; i/ @# {0 z# {0 O ③+ x M' h- q( S( l- j
$ ?9 K2 z" T8 h+ r% t( E
DTX,YI=DTY,D=(di1,…,dik)为n×k阵,dij为第ij个元素是1其余全为0的n维向量。" P" R0 U9 z! q0 }* |; ]
证明 用同[6]完全类似的方法易得①成立。现证②,记R=L(I)Y(I),则7 i( q+ p/ P+ e, e: l& z
4 z/ o* M7 F& e6 h 3 [( e( w1 L( W5 ?4 p # `: ~' ]) Z D6 ?0 [由文[1]知和R独立和Vec(R)独立9 g2 P, u6 }& j+ g1 |
。而后者是显然成立的,故和R独立,从而与独立,即得②成立。最后,由W1=YT(I)L(I)Y(I),L2(I)=L(I),rank(L(I))=n-m+q-k,L(I)X(I)B=0,及文[1]知③成立。' }7 Q3 V% {& h3 B* I# X
& ?0 C* s6 R. @) ^: b, {证毕6 l* p- T! _; {9 h. D) A7 U
% m! ~1 F" d7 n; C# p; b D/ i 引理2 对模型(2)和(4),若记且假设E的各行向量均为正态随机向量,且n>m+p-q+k,则 $ V+ @# V* ~! R; p2 N# X. b2 g ① W1与W2相互独立,且W=W1+W2,W2~Wp(k,V),W~Wp(n-m+q,V), - |0 ]. Z3 g( C, e; ?# S7 W ② 4 Y: \& B" Y# s! g; @2 z1 p
特别地,当k=1时,/ I% O# K/ w# z7 Z+ G
证明 记L1=L[I-D(DTLD)-1DT]L, L2=LD(DTLD)-1DTL,W1=YTL1Y,W2=YTL2Y。则易证W=W1+W2,L=L1+L2。由此即知L1和L2都为投影阵,且rank(L1)=n-m+q-k,rank(L2)=k。因rank(L)=rank(L1)+rank(L2)且LB=L1B=L2B=0,故由多元Cochran定理知①成立。. N2 G; Q% c# h" v; ^6 L
由Wilks分布的定义及①和引理1③知②成立。* j: B" p2 d4 V7 z
3 R# h" ?6 U& E6 ?' e
证毕 . @/ o6 c6 T4 J' t ( A2 U& ^! w1 C4 B( N2 主要结论. L- t w- d+ E3 S
7 c( c9 ~' x/ S% ]( z! c 定义1 对模型(2),称 3 |8 u. Z: `0 l: z/ ^/ b5 |2 N- F+ P+ y' n
(5) ' P5 B% m9 V) _; p8 S) i 9 S8 n6 [9 D1 M. ~5 I( q3 U7 R为k个数据点的多元约束广义Cook距离。对不同的M和C,可得到DHI(M,C)的各种距离和统计意义。 6 a8 A/ g6 @: H+ s; S 定理1 设PI-QI的谱分解式为PI-QI=ΓΛΓT,Γ为正交阵,Λ为对角阵,其对角元素λ1,…,λk为PI-QI的特征根。则在引理2的条件下有1 c& Y: K5 y+ }7 B, H5 X; U
2 H1 X5 J( P; A8 \# @: ?9 x7 U9 R1 T; r
(6), L5 G' x0 I& `, c! f
; X) Y4 A$ F1 F8 D( u+ } (7) % B9 }3 A+ P8 J: M 0 D# j/ q f9 p6 E/ ?5 O: N (8)9 Z& c9 G- c: s* c# Y$ y
: X/ f+ I: D( ^' C
其中h定义为4 X) c+ o" b: P6 j( P- N6 r" _% k8 V
" w4 \' i: V8 E( N) |" X. T
# d* `5 k9 H% k# r5 F p
5 f# b9 {" }2 K2 W
h1,…,hk相互独立且服从p元正态分布。 . t( c7 s- y+ K9 V 证明 由引理1①和(5)式,并经直接运算即可得定理的结论。+ O: A+ B7 j8 W, ^, b5 \
! L2 G8 A" W% s% y. c% m9 {" ~
证毕8 |7 s; K& h" T3 K
Z- X! f9 N# ]* D1 e( |, k% c
特别地在定理1中令A=0且k=1,则得: C% m$ [8 r3 t9 Z
推论1 对模型(1),有. G- m6 p, E9 f2 N9 c8 @
,其中。 " ]$ M+ q, l" Q$ U8 N 这与文[2]、[4-7]的相应结果一致。因此定理1是文[2]、[4-7]相应结果的推广。 + `8 y7 t, [; u6 f 因为当k>1时的分布较复杂,因此,这里只讨论k=1的情形。 W6 J8 w/ Z2 u4 W9 J4 p2 s% q 定理2 在模型(2)的条件下,若ε1,…,εn均为正态随机向量,且n>m+p-q+1,则,% v1 Q; f) q, S( J
; M& O5 F% j1 p都服从Beta分布" n5 U9 L8 N2 p+ u
证明 记,则由定理1知上述统计量全等于τ2i/(n-m+q)。因此,我们只须证明。而由引理2知 0 o, m) U; V. _$ Y * M/ k( u% v. t! n- [4 q- k6 t+ H, X& m( K, }3 z5 `& }% W9 F