例题
- 已知总体 X∼N2(μ,Σ),样本 x′=[2128969810],现进行如下检验
H0:μ′=[7,11] H1:μ′=[7,11]如果F2,2,0.05=19,pnn+1−pT2(p,n)∼Fp,n+1−p,请回答如下问题
(1)计算 Hotelling T2统计量;
作为一个看完了前一篇文章的人,你应该知道了什么是 Hotelling T2,所以直接写解题过程吧!
开玩笑的,前面那么抽象,怎么看的懂嘛!那我们就来推导一下Hotelling T2 吧!(这里不是正经推导,正经的话是下一道证明题)
一元均值的假设检验
t=s/nXˉ−μ0这是我们一元的时候构建的统计量 t,来检验均值是否相等,其中
X=n1j=1∑nXj,s2=n−11j=1∑n(Xj−X)2不知道你对这个熟不熟悉🤔
总之,我们要从一元推广到多元,怎么办呢?先给 t 来换一种表示的方法:
t=s/n(X−μ0)=[n(X−μ0)(s2)−1(X−μ0)]21这两部分是一模一样的,你可以将右边化简得到左边。
Hotelling T2统计量
现在我们可以把它推广到多元了。把 t 平方一下,去掉 21
我们可以得到 Hotelling T2统计量:
T2=n(X−μ0)′S−1(X−μ0)其中X=n1∑j=1nXj,S=n−11∑j=1n(Xj−X)(Xj−X)′ ,j 是第 j 次的观测样本,j 对应列号。
我来解释一下,这里的式子和上面的 t 的转化形式是一样的,只是多元中并没有矩阵的平方,所以这里是 (Xj−X)(Xj−X)′。
而且这里也很形象,t 平方不就变成了 T2 嘛!
公式有了,至此,第一题就可以做了。
注意这里 x′=[2128969810] ,x 是个列向量 x=2868129910 第一列就是X1,第二列就是X2,即 p = 2(2维),n = 4(4组观测样本,每组2个值),但后面还是看横着的好理解。
计算 Xˉ
Xˉ=[4(2+8+6+8)4(12+9+9+10)]=[424440]=[610]计算 (X−μ0)
原假设说了 μ′=μ0(就是符号定义不一样)=[711],因此 (X−μ0)=[6−710−11]=[−1−1]
计算样本协方差矩阵 S
我们知道 :x′=[2128969810],S=n−11∑j=1n(Xj−X)(Xj−X)′
还记得 j 对应列号嘛,这里就一列一列带进去就好了
j=1:[2−612−10]=[−42]
j=2:[8−69−10]=[2−1]
j=3:[6−69−10]=[0−1]
j=4:[8−610−10]=[20]
然后乘起来 :(Xj−X)(Xj−X)′
对于 j=1:
[−42][−42]=[(−4)(−4)(2)(−4)(−4)(2)(2)(2)]=[16−8−84]对于j=2:
[2−1][2−1]=[4−2−21]对于j=3:
[0−1][0−1]=[0001]对于j=4:
[20][20]=[4000]最后加起来:
j=1∑4(xj−xˉ)(xj−xˉ)′=[24−10−106]除以n−1=3得样本协方差矩阵:
S=31[24−10−106]=[8−310−3102]计算 Hotelling T2统计量;
好了,现在可以算统计量的值了…
看一下公式:
T2=n(X−μ0)′S−1(X−μ0)好的,先算个S−1:
S−1=449[23103108]=S−1=221[9151536]代入:
T2=4⋅([−1−1]⋅221[9151536]⋅[−1−1])=11150(2)在α=0.05水平下检验H0。
Hotelling T2的性质
知道了统计量,那这个统计量服从什么分布呢?难到又要一群人研究一个新的分布,然后再画张图吗?可以不用,因为这样老师就出不了题目了:
(n−1)p(n−p)T2与Fp,n−p 同分布。
Fp,n−p 是服从自由度为 p 和 n−p 的 F 分布随机变量。那 F 统计量是…这里我们不需要算 F 统计量的值,只是用它的分布,所以就不用管了。
再者,这里是统计量越大越拒绝原假设。
pnn+1−pT2(p,n)∼Fp,n+1−p,题目里虽然写的是这个,但是你带入p和n,显然服从的是 F2,3,题目没给这个的5%的值啊,所以应该是笔误吧(艹皿艹 )
所以:
(n−1)p(n−p)T2=31T2=Fp,n−p=F2,2 T2=F=31×11150=1150≈4.5455临界值F2,2,0.05=19。由于 4.5455<19,不能拒绝原假设。
结论
在显著性水平 α=0.05下, 没有足够证据表明总体均值向量μ与[7,11]′ 有显著差异。
似然比法的原理及性质。
原理: 令Θ表示参数θ的取值范围,Θ0表示H0限定下参数θ的取值范围,则当
Λ=maxθ∈ΘL(θ)maxθ∈Θ0L(θ)<c⟹拒绝H0其中,L(θ)为似然函数,c为适当选定的常数。
性质:
在大样本情形下,当原假设成立时,有 −2lnΛ∼χv−v02。其中,v−v0=(Θ的维度)−(Θ0的维度)。
例题
令 X∼Np(μ,Σ),X1,X2,…,Xn为其随机样本。样本均值为X,样本协方差矩阵为 S,并且 W≡(n−1)S∼Wp(n−1,Σ),X与S独立。请证明以下结论:
(1)总离差j=1∑n(Xj−μ0)(Xj−μ0)′=组内差(W)j=1∑n(Xj−X)(Xj−X)′+组间差n(X−μ0)(X−μ0)′
第一题虽然有一大坨内容,但是还是很好写的,因为不需要什么多元的知识就可以做了。
j=1∑n(Xj−μ0)(Xj−μ0)′ =j=1∑n[(Xj−X)+(X−μ0)][(Xj−X)+(X−μ0)]′这一步很好理解,两项里面减一个加一个X不改变原式,然后两两看成一个整体。
之后对着里面做类似于 (a+b)(a+b)=a2+b2+ab+ba 这样的分解。
=j=1∑n(Xj−X)(Xj−X)′+j=1∑n(X−μ0)(X−μ0)′ +j=1∑n(Xj−X)(X−μ0)′+j=1∑n(X−μ0)(Xj−X)′一共拆成了4项,我们一项一项来看。
∑j=1n(Xj−X)(Xj−X)′
这一项我没看出来什么,所以保留。
∑j=1n(X−μ0)(X−μ0)
这里的 X 和 μ0 都是常数,所以求和就是 n倍 的他们。
所以 ∑j=1n(X−μ0)(X−μ0)=n(X−μ0)(X−μ0)′
∑j=1n(Xj−X)(X−μ0)′
孩子们, X 和 μ0 是常数。所以可以提出去。
所以 ∑j=1n(Xj−X)(X−μ0)′=(∑j=1n(Xj−X))(X−μ0)′
那这一坨等于什么呢?(∑j=1n(Xj−X),很简单,还是继续打开。
j=1∑n(Xj−X)=j=1∑nXj−nX=nX−nX=0另一项也同理值为0
所以答案就出来了。
题目说样本协方差矩阵为 S,并且 W≡(n−1)S∼Wp(n−1,Σ) 所以 W=∑j=1n(Xj−X)(Xj−X)′
所以得出结论。
总离差j=1∑n(Xj−μ0)(Xj−μ0)′=组内差(W)j=1∑n(Xj−X)(Xj−X)′+组间差n(X−μ0)(X−μ0)′(2)∣总离差∣=∣W∣+∣W∣n(X−μ0)′W−1(X−μ0)
设 d=X−μ0,则 总离差 = W+ndd′。(设为d,只是不想写太多) 考虑这样一个矩阵:
M=[1nd−d′W]其中:
- 1 (标量)
- −d′ (1×p行向量)
- nd (p×1列向量)
- W (p×p 矩阵)
别问为什么要考虑这个,问就是”古人的智慧”(doge)
老师在 ppt 里给出了这样的计算公式:
分块矩阵行列式展开公式:可以按A展开,或者按D展开
ACBD=∣A∣⋅∣D−CA−1B∣=∣D∣⋅∣A−BD−1C∣老师的矩阵全是AAAA,看花了,这里改成ABCD。
同样的,我们对 M 求行列式。这里先按 W 这个矩阵 展开
∣M∣=∣W∣⋅1−(−d′)W−1(nd)=∣W∣⋅1+nd′W−1d再按 1 这个矩阵 展开
∣M∣=∣1∣⋅∣W−(nd)⋅1⋅(−d′)∣=∣W+ndd′∣look familiar?∣M∣=∣总离差∣=∣W+ndd′∣,古人的智慧这一块。
好了,两个式子连等,可以得到了这个:
∣总离差∣=∣W+ndd′∣=∣W∣1+nd′W−1d感觉和题目要求证明的差了一个括号?我们这里 ∣1+nd′W−1d∣ 是模。可以直接改成括号吗?怎么感觉不太对呢?
怎么不对!对的对的。我们来分析一下:
- 1 是 1×1
- n 是 1×1
- d′ 是 1×p
- W−1 是 p×p
- d′ 是 p×1
最后乘起来再加起来就是一个标量,所以模什么的,直接变成括号就好了。
∣W+ndd′∣=∣W∣(1+nd′W−1d)然后再把|W|乘进去,d 用 X−μ0 换掉。
∣总离差∣=∣W∣+∣W∣⋅n(X−μ0)′W−1(X−μ0)证明完毕。
(3) 统计量T2=n(X−μ0)′S−1(X−μ0)∼T2(p,n−1)
你看了这个题目,你可能会问:它让我证明的是什么?这个分布不就是 Hotelling T2分布吗?其实我们还没证明。
在上一章的简答题里,老师给出了Hotelling T2 分布的定义:
设 X∼Np(0,Σ),Y∼Wp(n,Σ) 且独立,则 T2=nX′Y−1X∼T2(p,n)。
所以这里说人话就是让我们把 n(X−μ0)′S−1(X−μ0) 变形变形,写成一个Hotelling T2 分布的形式。
题目已经给了p = p 和 n = n - 1,所以带入,我需要凑出这样的形式:
T2=(n−1)X′Y−1X∼T2(p,n−1)其中:X∼Np(0,Σ),Y∼Wp(n−1,Σ)
所以借助一下”古人的智慧”:
原式=n(X−μ0)′(S)−1n(X−μ0)这没问题吧,只是把 n 掰开了
这里也有个结论:n(X−μ0)∼Np(0,Σ),所以这就是我们要的 X
那 Y 呢?注意题目给了一个条件:W≡(n−1)S∼Wp(n−1,Σ)
所以 Y 也很好构造了。
S=n−11W代入后:
原式=n(X−μ0)′[n−11W]−1n(X−μ0)′把n−11放外面,即可得到:
T2=n(X−μ0)′S−1(X−μ0)=(n−1)[n(X−μ0)]′W−1[n(X−μ0)]∼T2(p,n−1)得证。
方差不齐对多元方差分析的影响。
多元方差分析的定义。
多元方差分析是一元方差分析向多维的推广,用于检验不同总体均值向量之间是否存在差异。 包括单因素多元方差分析和双因素多元方差分析
多元统计分析-第三章计算详解
周四 6月 04 2026 2778 字 · 12 分钟