统计量的分布称为抽样分布(sampling distribution)。在使用统计量进行统计推断时需要知道抽样分布。一般来说要给出统计量的精确分布是很困难的,但在某些特殊情形下,如总体是正态分布的情形下,我们可以给出某些统计量的精确分布,这些精确抽样分布为正态总体情形下参数推断提供了理论依据。
在数理统计中,最重要的三个分布分别为:分布,t分布和F分布。
(一)分布
定义6.2.1 (分布)设为独立同分布的随机变量,且都服从N(0,1),记,则称Y服从自由度为n的分布,记分布的概率密度为
图6.2.1
分布的概率密度可以由下面的方法导出,如果,其分布为。假设为独立同分布的随机变量,则仍是独立同分布的随机变量,从而由分布的可加性知,
由此可得出(6.2.1)。分布的密度函数的图形如图6.2.1所示。
分布有如下的性质,
(1)分布可加性
设,且两者相互独立,则。
证明 根据分布的定义,我们可以把Y1和Y2分别表示为
其中和都服从标准正态分布N(0,1),且相互独立。所以,根据分布的定义,
(2)分布的数学期望和方差
。即分布的期望等于自由度,而方差等于自由度的2倍。
证明:设,可以表示为,其中且相互独立,因而,,从而有
由分步积分可以得出,于是有,由的独立性,有
(3)分布分位点
对子给定的正数α,0<α<1,称满足条件
的点为分布的上(侧)α分位点,如图6.2.2所示。对于不同的α,n,上侧α分位点的值可见附表4。
图6.2.2
例6.2.1 对于α=0.1,n=25,查附表4得。也可以通过Excel查出(25)的值。具体如下;在Excel表单的任一单元格输入“=”在主菜单中点击“插入(I)”“函数(F)”在“选择类别”的下拉式菜单中选择“统计”选择“CHIINV”点击“确定”在函数参数表单中输入Probability=0.1, Deg-free-dom=25,点击“确定”即在单元格中出现“34.382”。
例6.2.2 分布的概率值也是可以通过Excel表单得出。假设(25),计算P(X>36)的值,具体如下:在Excel表单的任一单元格输入“=”在主菜单中点击“插入(I)”“函数(F)”在“选择类别”的下拉式菜单中选择“统计”选择“CHIDIST”点击“确定”在函数参数表单中输入“X=36,Deg_freedom=25”,然后点“确定”在单元格中出现“0.0716”。即。注意,Excel中分布的概率值实际上给出的是尾概率的值。如果要计算,则先要在Excel中求出P(X>36)的值,再由给出。
注 费歇(R. A. Fisher)曾证明,当n充分大时,分布的上侧α分位点可以有如下的近似,
其中是标准正态分布的上侧分位点。利用这个关系式可以求出n>40时,分布的上侧α分位点的近似值。
(二)t分布
定义6.2.2 (t分布)设,且X,Y相互独立,则称随机变量
服从自由度为n的t分布。记分布又称为学生氏(Student)分布。t(n)分布的概率密度函数为
t分布密度函数如图6.2.3所示,其中为标准正态密度函数。
图6.2.3
t分布有如下的性质:
(1)t分布的密度函数ft(y)是偶函数,关于y轴对称。
(2)由t分布的密度函数可以得到,
即当n足够大时,t分布近似于标准正态分布N(0,1)。
(3)t分布分位点。对于给定的正数,称满足条件的点分布的上侧α分位点,如图6.2.4所示。
图6.2.4
由t分布密度函数的对称性可知:。对于不同的α,n,上侧a分位点的值可见附表3。
例6.2.3 对于α=0.05,n=25,查附表3得。也可以通过Excel查出的值。具体如下:在Excel表单的任一单元格输入“=”在主菜单中点击“插入(I)”“函数(F)”在“选择类别”的下拉式菜单中选择“统计”选择“TINV”点击“确定”在函数参数表单中输入“Probabilit 0.1,Deg_freedom=25”,点击“确定”即在单元格中出现“1.708”。
例6.2.4 t分布的概率值也可以通过Excel表单简单得出的。假设X~t(5),计算P(X>2)的值,具体如下:在Excel表单的任一单元格输入“=”在主菜单中点击“插入(I)”“函数(F)”在“选择类别”的下拉式菜单中选择“统计”选择“TDIST”点击“确定”在函数参数表单中输入“X=2,Deg_freedom=5,Tails=1”,然后点“确定”即在单元格中出现“0.05097”。注意“Tails=1”表示所得的概率是单边的,如果“Tails=2”表示所得的概率是双边的,所求出的是的值,即。
注 数理统计书后的附表中的t的分位点的α不是很多,而且n也只到45为止。一般情形下,当n>45时,可以用标准正态分布来近似。但在Excel中可以查到你所想要的任意α和n取值的上。分位点。
(三)F分布
定义6.2.3 (F分布)设,且U,V相互独立,则称随机变量
服从自由度为的F分布。记分布的概率密度函数为
F分布密度函数如图6.2.5所示。
图6.2.5
F分布有如下的性质:
(1)由F分布的定义可知,若。
(2)如果,则。
证明:由t分布的定义可知,X可表示为
其中,并且Y与Z相互独立,所以
再由F分布的定义即可知。
(3)F分布分位点。对于给定的正数α,0<α<1,称满足条件
的点为分布的上侧α分位点,如图6.2.6所示,
图6.2.6
对于不同的α,n,上侧α分位点的值可见附表5,由性质(1),我们可以得出F分布分位点如下关系式,
证明:设,则有
即有
例6.2.5 对于,查附表5得。也可以通过Excel查出的值。具体如下:在Excel表单的任一单元格输入“=”在主菜单中点击“插入(I)”“函数(F)”在“选择类别”的下拉式菜单中选择“统计”选择“FINV”点击“确定”在函数参数表单中输入Probability=0.1,Deg_freedom1=9,Deg_freedom2=10,然后点击“确定”即在单元格中出现“2.347”。
注 一般数理统计书后的附表中的F的α分位点的α是比较小的值,如α=0.1,0.05,0.025,0.01,0.005等,对于较大的α值的分位点通常可以利用计算得出。
例6.2.6 如F表中查不到,所以,
但在Excel中可以查到你所想要的任意α和取值的F分布的上分位点。
例6.2.7 对于F分布的概率值可以通过Excel表单简单得出。假设X~F(9,10),计算P(X>3)的值,具体如下:在Excel表单的任一单元格输入“=”在主菜单中点击“插入(I)”“函数(F)”在“选择类别”的下拉式菜单中选择“统计”选择“FDIST”点击“确定”在函数参数表单中输入“X=3,Deg_freedom1=9,Deg_freedom2=10”,然后点“确定”即在单元格中出现“0.0510”。注意Excel得出的F分布的概率值实际上是分布尾部概率的值。如果要计算P(X⩽3)的值,先计算P(X>3)的值,然后再由P(X⩽3)=1-P(X>3)给出P(X⩽3)=0.9490。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。