生物统计学[44-46]为我们的相关研究提供了很好的方法,我们的工作中主要应用了如下几种统计学方法。
1)相关分析
相关分析是生物统计学中一种重要的统计学方法,它是考察两个或多个数据型变量之间相互变化关系的统计分析方法,其重要任务是研究变量之间关系的密切程度,用相关系数来衡量变量之间的密切程度。相关系数的计算公式如下:
式中,—和分别为变量X和Y的平均值,r的取值范围是[-1,+1]。若r为正数,说明两变量呈正相关,即X和Y有相同的变化趋势;若r为负数,说明两变量呈负相关,即X和Y有相反的变化趋势。由样本得到的相关系数是一个统计量,由于可能存在抽样误差,样本相关系数的大小并不能直接说明总体线形相关关系是否确实存在,要通过显著性检验才能对此做出统计推断。建立假设如下。
零假设H0:ρ=0,备择假设HA:ρ≠0。
对此假设可以用3种方法检验,即F检验、t检验和利用相关系数临界值表检验。
2)偏相关分析
当多个变量之间彼此互相影响时,其中两个变量之间的相关性要受到其他变量的影响,因而,这时变量之间的两两简单相关系数并不能反映两个变量之间的真正关系。只有在其他变量保持不变的条件下,计算该两变量之间的相关系数才有意义。这样的相关称为偏相关。设有m个变量,首先计算它们之间两两简单相关系数,并将这些相关系数列在下列矩阵中:
其逆矩阵为
偏相关系数rij·为
rij·=-
3)均数差异显著性检验
由于在我们研究的实际问题中,总体方差是未知的,所以采用t检验。
式中为样本的平均数,n为样本含量,S为样本标准差,μ为样本总体均数。
这一统计量不再服从标准正态分布,而是服从n-1的t分布。
t分布与标准正态分布相似,也是对称分布,它关于t=0对称,只有一个峰值,峰值在t=0处,分布曲线受自由度影响,自由度越小,离散程度越大。统计量服从自由度为n-1的t分布,其临界值要由t分布的分布数表查得。
4)卡方检验
卡方检验(χ2检验)主要有3种用途,一个样本方差的同质性检验、适合性检验和独立性检验。卡方值的计算公式如下:
式中,χ2为样本的卡方值,O为实际观测值,E为理论推算值。χ2的取值范围是[0,∞],实际上其符合程度由χ2概率决定。由χ2值表可知,χ2值与概率成反比,χ2值越小,概率值越大;χ2值越大,概率值越小。χ2检验的步骤如下:
(1)提出无效假设H0,同时给出相应的备择假设HA。
(2)确定显著性水平α,一般可确定为0.05或0.01。
(3)利用式(214)计算χ2值。
(4)进行统计推断,从附表中查出χ2α值,如果实际χ2>χ2α,表明p>α,应接受H0,否定HA,说明在α显著标准下理论值与实验值之间的相关性不显著;如果实际χ2<χ2α,表明p<α,应否定H0,接受HA,说明在α显著标准下理论值与实验值之间的相关性是显著的。
5)多元线性回归分析
多元线形回归是研究一个变量(因变量)对其他两个或两个以上变量的线性回归关系。多元线形回归的数学模型如下:
Y=β0+β1X1+β2X2+…+βmXm+e(2-15)
式中,Y为因变量,X1,X2,…,Xm为m个自变量,e为随机误差。
多元回归方程的显著性检验用F检验方法。
6)总体方差分析
为了度量变量的变异程度,可以用各观测值离均差的大小来表示,对于样本来说,其样本方差定义为
式中,s2为样本方差,x为样本的观测值 为样本的平均值,N为样本容量。
对于总体,其样本方差的定义为
式中,σ2为总体方差,x为样本的观测值,μ为该总体算术平均值,N为样本容量。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。