令
为抽自T的简单随机样本;令
是非负独立同分布表示删失的随机变量,具有分布函数G.在随机右删失模型下,我们不能完全观察到Xi,而仅能观察到
观察到的数据对
就是删失简单随机样本(CSRS).设
是Y1,Y2,…,Yn的从小到大的次序值,且设
ri=(Y(i))中的个体数,
di=在时刻Y(i)之前死亡的人数,
这样,Kaplan&Meier(1958)[132]定义生存函数的CSRS乘积限估计为
为了比较(t)和
(t)的估计效率,我们进行了计算机模拟运算.模拟数据来自于三个不同分布Exponential(1),Weibull(2,0.5),Gamma(0.5,2)分布.对于每一种分布都进行了5000次简单随机抽样和5000次排序集抽样,每次抽样的样本量都选为60.假设删失分布服从[0,C]上的均匀分布,取不同的C值使删失数据百分比达到近似5%到近似30%.这样对不同的删失百分比,我们都得到5000个删失简单随机样本和5000个删失排序集样本,并且计算出相应估计量的值.
对于模拟计算,一般利用估计量的均方误差(MSE)来评估估计效率.详细地说,对真实值S的任一估计量,若第i次抽样所算出的估计值为
, 则估计量
的均方误差定义为
其中N是抽样次数.显然,均方误差的值越小,估计量的估计效率越高.
另外,为了从整体上更好的评价(t)和
(t)的估计效率,我们还分别计算了这两个估计量与生存函数S的L2距离.对真实函数S的任一估计量
与S的L2距离定义为
其中tl,l=1,2,…,L是从S的定义域中选择出来的具有代表性的点,我们在模拟运算中每次都选择了50个代表点.显然,估计量的L2距离越小估计效率越高.
表3.3给出了删失简单随机抽样下生存函数乘积限估计的L2距离.表3.4给出了删失排序集抽样下生存函数乘积限估计的L2距离.从表3.3和表3.4显然可以看出,(t)的整体估计效率高于
(t).
表3.1 删失简单随机抽样下生存函数乘积限估计的平均值和均方误差
表3.2 删失排序集抽样下生存函数直接乘积限估计的平均值和均方误差
(续表)
表3.3 删失简单随机抽样下生存函数乘积限估计的L2距离
表3.4 删失排序集抽样下生存函数乘积限估计的L2距离
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。