连续型随机变量的随机抽样有两种情况:一是当随机变量的概率分布函数的反函数可以用显式表示时,可以采用直接抽样方法;二是当随机变量的概率分布函数的反函数不能用显式表达时,可以用舍取抽样方法。
7.4.1 直接抽样方法
所谓直接抽样方法是建立在下述定理基础上的。
定理:设随机变量ξ具有单调递增连续分布函数F(x),则z=F(ξ)是[0,1]上均匀分布的随机变量。
证:因F(x)是概率分布函数,则F(x)在[0,1]上取值。又F(x)是单调递增连续函数,所以,当ξ在[-∞,x]内取值时,随机变量Z则在[0,F(x)]上取得值。因而,当Z在[0, 1]上取得一个值z时,至少有一个x满足
z=F(x)=p{ξ≤x} (7-41)
由上式取反函数得
x=F-1(z)(7-42)
用F1(z)表示随机变量Z的分布函数,根据定义有
F1(z)=P{Z≤z} (7-43)
则
F1(z)=P{F(ξ)≤z}=P{ξ≤F-1(z)} (7-44)
将式(7-42)代入上式,有
F1(z)=P{ξ≤x} (7-45)
又Z在[0,1]上取值,则
上式即是在[0,1]上服从均匀分布的随机变量的分布函数。定理由此得证。
由上述定理得知,若z为[0,1]上均匀分布的随机变量,F(x)为某一随机变量ξ的分布函数,且单调递增连续,则
ξ=F1(z)(7-47)
是以F(x)为分布函数的随机变量。这样,就可以用均匀分布随机抽样产生ξ的抽样。
例7.2 产生[a,b]上均匀分布的随机变量ξ的随机抽样值。
解:ξ的分布函数F(x)为
则有
解得
ξ=F-1(z)=(b-a)z+a
将z的随机抽样值η代入上式,即可求出分布函数为F(x)的随机变量ξ的随机抽样值XF(ξ):
XF(ξ)=F-1(η)=(b-a)η+a
7.4.2 舍取抽样法
当有的分布函数的反函数不存在显式或是不容易求出时,可以采用舍取法进行抽样。这种方法的实质是从许多随机数序列中选取一部分,使之成为具有给定分布的随机抽样值。那么,哪一些可舍,哪一些该取呢?
设随机变量在有限区间[a,b]上取值,其分布密度函数在[a,b]上有限,即
f(x)≤f0 (7-48)
又f(x)定义于[a,b]区间,故有
这种情况如图7-3所示,在[a,b]范围内,曲线f(x)以下的面积R为1。显然,要抽取的随机变量可以理解为是分布在横轴上的,问题也可以直观地理解为横轴上哪一点的函数值越大,哪一点被抽到的概率也就越大。这就意味着在如图7-3所示的面积R中(阴影中)进行均匀随机投点,就可以获得ξ的随机抽样值。在投点过程中,落入R中的则取,落到R外的则舍,这是唯一的原则。
图7-3 舍取抽样
设投点值用S(x′,f′)表示,为了进行随机均匀投点,可取两随机数列:{η1},{η2}。则
x′=(b-a)η1+a(7-49)
若
f′=f0η2(7-50)
f′<f(x′)(7-51)
或
f0η2<f[(b-a)η1+a](7-52)
成立,则说明点S(x′,f′)是落在R中的,x′即为所求的ξ的随机抽样值XF(ξ):
XF(ξ)=x′=(b-a)η1+a(7-53)
否则说明点S(x′,f′)在面积R之外,应予以舍去。另取一组η1、η2,并看其是否满足式(7- 51)或式(7-52),继续作假设试验。由此可以得到服从分布密度函数为f(x)的随机变量ξ的随机抽样序列。表7-6是常见分布随机变量的抽样公式。
表7-6 常见随机变量的抽样公式
以上是在假定ξ是在有限区间[a,b]内取值的情况下进行的。如果ξ不是在有限区间内取值,那么,总可以选择某一个有限区间[a1,b1],且
式中ε是任意小的正数。
然后,再利用上述方法在[a1,b1]内进行抽样,即可得到所需的随机抽样序列。
由上述方法可以看到,在舍取抽样的诸多投点中,有许多投点是舍去的。因而,在舍取抽样中存在着一个效率问题。对舍取抽样的效率B可以用下式来加以定义:
B=n/N(7-54)
式中:N为进行随机投点的总次数;n为S点落入R之中的次数。
由于随机投点是在以b-a为长,f0为高的矩形(见图7-3)中均匀进行的,因而,当N足够大时,有显然,B也表示每一次随机投点落入面积R之中的概率。不同的随机变量具有不同的密度分布函数f(x),a、b和f0也可能取不同的值。用舍取法进行随机抽样时可以用B值来衡量其各自的抽样效率。
例7.3 设随机变量ξ具有分布密度函数:
求其舍取抽样B。
解:
由式(7-55)有
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。