( h$ S! Z9 u7 H1 S) H; T (5) 0 x. ~+ C( f/ E0 o, p " R0 T* p7 e7 y# a& X9 s为k个数据点的多元约束广义Cook距离。对不同的M和C,可得到DHI(M,C)的各种距离和统计意义。2 L* X/ ?$ G3 ]" u8 u: \$ A
定理1 设PI-QI的谱分解式为PI-QI=ΓΛΓT,Γ为正交阵,Λ为对角阵,其对角元素λ1,…,λk为PI-QI的特征根。则在引理2的条件下有) `( l9 \! f* r' S8 h. v' ?; p
3 K' s8 J# ?: S (6)" ^. W. A" F# A9 [. L7 t L4 ]
% t4 m7 s( ~7 C! s% \/ L (7): ~+ L1 `7 h! D4 t1 o
! I. |" J; q( j' _
(8) * }3 T5 b' m- B0 G" N$ _' k2 F- {3 E. G, s1 L
其中h定义为 2 A' O- f4 y& S9 u9 w- i7 t" x+ ~3 e4 ^& }; ]
) P3 i5 y5 l2 y! ?; Y' U, i$ S2 j6 p+ C: w. d
h1,…,hk相互独立且服从p元正态分布。 / f, A @2 V3 C! Y d: A) X- o: G 证明 由引理1①和(5)式,并经直接运算即可得定理的结论。. {, o% c z$ t1 D' {- B
, m* _% W4 }& x2 o3 Z% k证毕 & g/ q9 P9 {: @& e9 H3 r# J3 q+ O$ ~, o/ g k7 M! D- w
特别地在定理1中令A=0且k=1,则得 ( t t% n( S2 z# \- c 推论1 对模型(1),有 + t+ E* Y$ V! p9 ~3 E. ?+ J,其中。 / e. J. @1 d2 l 这与文[2]、[4-7]的相应结果一致。因此定理1是文[2]、[4-7]相应结果的推广。 " Y Q- Y- E6 Q* F# x 因为当k>1时的分布较复杂,因此,这里只讨论k=1的情形。 9 |) J) P: s- T+ x- R 定理2 在模型(2)的条件下,若ε1,…,εn均为正态随机向量,且n>m+p-q+1,则, * u A6 |5 Q; L; g1 J9 q) s* w& R9 Q5 D1 [0 | |/ O5 O1 V- O4 }
都服从Beta分布* x; L4 Q( T+ z) h' E' ?: @& I3 |
证明 记,则由定理1知上述统计量全等于τ2i/(n-m+q)。因此,我们只须证明。而由引理2知 / Z: a# j" P0 r3 j' X 6 A0 M! z3 b8 l1 a* `! X# _, x1 d- t( _! w
; A, i: R' m' e& ?9 v" k由此即得。5 v6 ~- s. R/ W6 t+ s" @
9 Z5 @* G) L8 f) D证毕# I" H/ K. v* b; C+ _
8 A6 J3 ~) w4 z# v2 |8 ^6 n9 p 特别地,若A=0,则得 8 k1 J4 i, d' s/ X( [2 | 推论2 对模型(1)在定理2的条件下,有0 U) m0 _' a3 }+ [0 E h
4 `' }& Q5 F! u9 u. f$ W% n' {% u, l8 e+ z. ?
' _/ V. F9 x( F2 w$ B& m
都服从Beta分布。/ t% h2 `: M1 [1 \5 H
定理3 在定理1的假设下,有0 e+ t/ E% M9 W; ~
6 E- d# x" H, `# {5 X; D
(9)/ v% e# P# h( x
' S$ P/ T& t r2 r0 t& [3 v (10) 0 K& ]5 {) W: E9 Y: @/ Y- o1 `( d' {) v. r- Z9 k: v/ x+ x
(11) & z5 m, ? l [& ~ . N: Q9 @; i/ ~0 P9 i其中相互独立且都服从Hotelling T2(p,n-m+q-1)。; [& F+ U7 ?8 E' x( H: k
证明 由引理1①和(5)式,易得(9)、(10)和(11)式成立。为证定理的后一部分,须证h和相互独立。由h=(I-Λ)-1/2ΓDLY和q-k)YTL1Y,并用同引理1完全类似的方法即得h和相互独立。因此,由引理1③和定理1及文[1]知t*2j~HotellingT2(p,n-m+q-1),j=1,…,k且t*21,…,t*2k相互独立。 , K; u. Z- q% y, m/ l3 f! W 1 a0 p4 ]' D' Q, `; R3 v+ \证毕# l0 E9 I3 }3 S3 j$ `! N
4 T1 V2 _9 R7 b' F% A 特别地,当k=1时,有- N2 U! n8 s8 k- `
定理4 对模型(2),若ε1,…,εn均为正态随机向量,且n>m+p-q+1,则& f" E2 p6 M5 t3 E- y& [0 b
: `! L2 k: G( ]+ g& @/ Z6 T7 y0 z5 P
) o# Y7 |% h& U
都服从F(p,n-m+q-p)。4 e. C; h2 w4 R, K; f
证明 因为在定理3中令k=1即得上述统计量都等于,其中,故只需证T~F(p,n-m+q-p)。用同文[2]p362完全类似的方法易得与相互独立。因此,由和定理1及文[1]知τ*2i~HotellingT2(p,n-m+q-1)。由T2分布与F分布之间的关系即得 ) |& J& t8 Q8 j3 K+ }3 ?0 B( A) o" d
T~F(p,n-m+q-p)" k, X) _- e+ H' x1 G3 ^' _
# z6 a- d& Q \8 p2 ~* q$ u. |证毕 * ~6 S1 b8 c6 S0 X" W* \! N! T: k% L% Q9 a, q7 t
现考虑k个数据点的剔除对XI处拟合值的影响。由一元线性回归分析方法得3 q: p6 F( a9 }) X9 \; {
定义2 给定模型(2),k个数据点为XI处拟合值的影响可定义为 + l+ g( r- q" X' I" {6 J$ r * H* j% I* E4 M' D4 W % X0 T+ ~! b8 V8 ?+ Y% _0 A3 c! x+ U8 T: n k
称WKHI为多元约束Welsch-Kuh统计量。注意,此时WKHI为k×p阶矩阵,为使用方便,考虑W-K统计量的如下形式:) V4 L5 w- G: q, o) o