自从高斯在研究测量误差时导出了正态分布,人们在以后的生活和实践中越来越意识到正态分布的常见性和重要性。这不仅因为很多随机变量的分布是正态分布,还由于现实世界中许多研究对象是受大量的相互独立的随机因素影响着,而其中每一个个别因素在总的影响中所起的作用都是微乎其微,这样的对象往往就近似地服从正态分布,这就是中心极限定理的客观背景。粗略而言,中心极限定理主要描述了大量的随机变量之和的分布可用正态分布来逼近。
最早的中心极限定理是关于n重贝努里试验的。早在18世纪初期,德莫佛就事件发生的概率p=1/2时证明了二项分布的极限分布为正态分布。此后,拉普拉斯和李雅普诺夫等人改进了他的证明并把二项分布推广到了更为一般的分布。到了20世纪二三十年代,林德伯格条件和费勒条件的提出及特征函数理论的系统化,更是促进了中心极限定理的显著发展。
中心极限定理(central limit theorem,常简写为CLT)这一名称是1920年由波利亚给出的。至今,学者们已得到了多种情形下的中心极限定理,在本节中我们仅仅列出其中最基本的几个结果。
(一)独立同分布情形
定理5.2.1 (林德伯格(Lindeberg)一勒维(Lévy)中心极限定理,也称之为独立同分布的中心极限定理)设为独立同分布的随机变量序列,且期望和方差存在(σ>0),则对任意的x∈R,有
这也就是说,均值为μ,方差为σ2的独立同分布的随机变量的部分和的标准化变量,当n充分大时,近似地服从标准正态分布N(0,1),即
显然,上式也可以表示为
将定理5.2.1应用到n重贝努里试验中,可得如下推论。
推论5.2.1 (德莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理)设nA为在n重贝努里试验中事件A发生的次数,p为事件A在每次试验中发生的概率(0<p<1),即P(A)=p,则对任意的,有
证明 引入随机变量
易见,并且相互独立,都服从参数为p的0-1分布,从而
由定理5.2.1,知结论成立。
注意到nA服从二项分布B(n,p),所以由德莫弗—拉普拉斯中心极限定理可知,当n充分大时,二项分布可用正态分布来逼近。
例5.2.1 某宴会提供一瓶6升(l)的大瓶法国红酒,假定与会者每次所倒红酒的重量服从同一分布,期望值为100毫升(ml),标准差为32毫升。若每次所倒红酒都是相互独立的,试问:倒了55次后该瓶红酒仍有剩余的概率约为多少?
解 设Xi为第i次所倒的红酒重量(单位:ml),i=1,2,…,55,则相互独立。对任意的的分布相同,且。由独立同分布的中心极限定理,知
所以
例5.2.2 某校1500名学生选修“概率论与数理统计”课程,共有10名教师主讲此课,假定每位学生可以随意地选择一位教师(即,选择任意一位教师的可能性均为1/10),而且学生之间的选择是相互独立的。问:每位教师的上课教室应该设有多少座位才能保证该班因没有座位而使学生离开的概率小于5%。
解 由于每位学生可以随意地选择一位教师,因此我们只需要考虑某个教师甲的上课教室的座位即可。引入随机变量;
则Xi独立同分布,均服从参数为1/10的。0-1分布。记,则Y为选择教师甲的学生数,且Y~B(1500,1/10)。利用德莫弗—拉普拉斯中心极限定理知
设教室需设a个座位,那么为使学生不因没有座位而离开教室,就需Y⩽a。由题意,知需要满足
查附表2,得,故需,解得a>169.11。故每位教师的上课教室应该设有170个座位才能保证因没有座位而使学生离开的概率小于5%。
例5.2.3 在2008年5月1日,杭州在全国首先推出公共自行车服务,执行至今,杭州市政府想了解一下市民对该服务政策的满意率p,0<p<1。某调查公司受委托进行调查,随机抽取调查对象,并将调查对象中对此服务满意的频率作为p的估计。现要保证至少有95%的把握使得真实满意率p与调查所得的满意率估计之间的差异小于10%,问至少需要调查多少对象?
解 设随机调查了n个对象,记
则Xi独立同分布,均服从参数为p的0-1分布,。记Yn,为n个对象中对服务政策满意的人数,则,且。而利用(5.2.3)或德莫弗-拉普拉斯中心极限定理,可以得到
由题意知需满足
即
查附表2,得,从而需
由于对任意的0<p<1,有,即至少需要调查97个对象。
事实上,此题也可以用切比雪夫不等式来解答。
由于,利用切比雪夫不等式,知
成立,则一定可以保证。而(5.2.5)式的成立,即需
同样由于对任意的0<p<1,有,所以n⩾500,Hp利用切比雪夫不等式,我们得到的解答是:至少需要调查500个对象。
(二)独立不同分布情形
定理5.2.2 (李推普诺夫(Lyapunov)中心极限定理)设为相互独立的随机变量序列,其期望存在,若存在ε>0,使得
其中。那么对于任意的,有
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。