首页 百科知识 相关性分析界面介绍

相关性分析界面介绍

时间:2023-11-01 百科知识 版权反馈
【摘要】:按对删除可以充分使用数据。如果按对删除有效,则某个特定的偏相关系数的自由度是基于在任何零阶相关计算中使用的最小个案数。百分位数区间简单地使用对应于所需置信区间百分位数的有序 bootstrap 值。标记显著性相关。这是 Pearson 相关系数的分子。这可能因为个案数不同而产生一组系数。对二分类数据,这些转换不适用。

5.1.1.1 偏相关界面介绍

IBM SPSS Statics20.0提供了【偏相关(R)】分析选项卡,从菜单中选择:分析 > 相关 > 偏相关(R)。如图5-1所示。

图5-1 IBM SPSS Statics20.0的相关性分析选项卡示意图

读入数据,点击分析菜单栏下的相关命令,点击偏相关按钮,进入偏相关对话框,如图5-2所示。

图5-2 IBM SPSS Statics20.0的相关性分析偏相关对话框示意图

【显著性检验】您可以选择双尾概率或单尾概率。如果预先已知关联的方向,请选择单尾。否则,请选择双尾。

【显示实际显著性水平】缺省情况下,将显示每个相关系数的概率和自由度。如果取消选择此项,则使用单个星号标识显著性水平为 0.05 的系数,使用两个星号标识显著性水平为 0.01 的系数,而不显示自由度。此设置同时影响偏相关矩阵和零阶相关矩阵。

在“偏相关”对话框中,选择好变量和控制变量,单击选项按钮,弹出选项对话框,如图5-3所示:

图5-3 IBM SPSS Statics20.0的相关性分析选项对话框示意图

【统计量】可以选择以下方式中的一个或两个都选:

均值和标准差:为每个变量显示。还显示具有非缺失值的个案数。

零阶相关系数:显示所有变量(包括控制变量)之间简单相关的矩阵。

【缺失值】您可以选择以下选项之一:

①按列表排除个案:将从所有计算中排除其任何变量(包括控制变量)具有缺失值的个案。

②按对排除个案:对于偏相关所基于的零阶相关的计算,不使用其一对变量或其中一个变量具有缺失值的个案。按对删除可以充分使用数据。但是,个案数可能随系数的不同而不同。如果按对删除有效,则某个特定的偏相关系数的自由度是基于在任何零阶相关计算中使用的最小个案数。

在“偏相关”对话框中,单击Bootstrap按钮,弹出Bootstrap对话框,如图5-4所示:

图5-4 IBM SPSS Statics20.0的相关性分析Bootstrap对话框示意图

选择执行 bootstrap。Bootstrap 方法可以导出稳健的标准误估计值,并能为诸如均值、中位数、比例、概率比、相关系数或回归系数等估计值导出置信区间。它还可用于构建假设检验。当参数估计方法的假设存在疑问(例如,异方差残差拟合较小样本的回归模型),参数推论无法执行或需要非常复杂的标准误计算公式(例如,为中位数、四分位数和其他百分位数计算置信区间)时,Bootstrap 是最好的替代选项。

【样本数】对于生成的百分位数和 BCa 区间,建议使用至少 1000 个 bootstrap 样本。指定一个正整数。

【为 Mersenne 扭曲器设置种子】设置种子允许您复制分析。使用此控件类似于将“Mersenne 扭曲器”设为活动生成器并在“随机数生成器”对话框中指定固定起始点,两者的重大差别在于在此对话框中设置种子会保留随机数生成器的当前状态并在分析完成后恢复该状态。 请参阅 主题 随机数字生成器 详细信息。

【置信区间】指定一个大于 50 且小于 100 的置信水平。百分位数区间简单地使用对应于所需置信区间百分位数的有序 bootstrap 值。例如,一个 95% 的百分位数置信区间使用 bootstrap 值的第 2.5 个和第 97.5 个百分位数作为区间的下限和上限(必要时插bootstrap 值)。偏差修正加速 (BCa)区间为调整区间,它更加准确,但代价是需要更长的计算时间。请参见Bootstrap Estimates (bootstrapping algorithms)以了解计算详情。

【抽样】简单方法为通过放回方式从原始数据集进行个案重新取样。分层方法为通过放回方式从原始数据集进行个案重新取样,但在层次变量的交叉分类定义的层内。如果层中的单元相对均一,且不同层间的单元相差较大,则分层 bootstrap 抽样非常有用。

5.1.1.2 双变量相关性界面介绍

IBM SPSS Statics20.0提供了【双变量(B)】相关性分析选项卡,从菜单中选择:分析 > 相关 > 双变量(B)。如图5-5所示。

图5-5 IBM SPSS Statics20.0的相关性分析选项卡示意图

读入数据,点击分析菜单栏下的相关命令,点击双变量相关按钮,进入双变量相关对话框,如图5-6所示。

图5-6 IBM SPSS Statics20.0的相关性分析双变量相关对话框示意图

• 相关系数。对于正态分布的定量变量,请选择 Pearson 相关系数。如果您的数据不是正态分布的,或具有已排序的类别,请选择 Kendall 的 tau-b 或 Spearman,后两者度量秩次之间的相关性。相关系数的值范围为 –1(完全负相关)到 +1(完全正相关)。0 值表示没有线性关系。在解释结果时请小心谨慎,不要因显著的相关性而得出任何因果结论。

• 显著性检验。您可以选择双尾概率或单尾概率。如果预先已知关联的方向,请选择单尾。否则,请选择双尾。

• 标记显著性相关。用一个星号来标识显著性水平为 0.05 的相关系数,用两个星号来标识显著性水平为 0.01 的相关系数。

在“双变量相关”对话框中,选择好变量和控制变量,单击选项按钮,弹出选项对话框,如图5-7所示:

图5-7 IBM SPSS Statics20.0的相关性分析双变量相关选项对话框示意图

【统计量】对于 Pearson 相关性,您可以选择以下一项或两项:

• 均值和标准差:为每个变量显示。还显示具有非缺失值的个案数。无论缺失值设置如何,都将逐变量处理缺失值。

• 叉积偏差和协方差:为每对变量显示。偏差的叉积等于校正均值变量的乘积之和。这是 Pearson 相关系数的分子。协方差是有关两个变量之间关系的一种非标准化度量,等于叉积偏差除以 N–1。

【缺失值】您可以选择以下选项之一:

• 按对排除个案:会从分析中排除对其计算相关系数的一对变量中一个或两个含有缺失值的个案。由于每个系数均基于对特定变量对具有有效代码的所有个案,因此在每次计算中会使用可用的最大信息量。这可能因为个案数不同而产生一组系数。

• 按列表排除个案:从所有相关性中排除对任意变量有缺失值的个案。

5.1.1.3 距离相关性界面介绍

IBM SPSS Statics20.0提供了【距离(D)】相关性分析选项卡,从菜单中选择:分析> 相关 > 距离(D)。如图5-8所示。

图5-8 IBM SPSS Statics20.0的相关性分析选项卡示意图

读入数据,点击分析菜单栏下的相关命令,点击距离相关按钮,进入距离相关对话框,如图5-9所示。

图5-9 IBM SPSS Statics20.0的相关性分析距离相关对话框示意图

该过程计算测量变量对或个案对之间相似性或不相似性(距离)的各种统计量。随后,这些相似性或距离测量可与其他过程(例如因子分析、聚类分析或多维尺度)一起使用,以帮助分析复杂的数据集。

在“距离相关”对话框中,选择好变量和标注,选择不相似度量标准,单击度量按钮,弹出非相似性度量对话框,如图5-10所示:

图5-10 IBM SPSS Statics20.0的相关性分析非相似性度量对话框示意图

从“度量”组中选择与数据类型(区间、计数或二值)相应的选项,然后,在下拉列表中选择与该数据类型相应的测量。根据数据类型,可用的测量有:

• 定距数据。欧氏距离、平方 Euclidean 距离、Chebychev、块、Minkowski 或定制。

• 计数数据。卡方测量或 phi 平方测量。

• 二分类数据。欧氏距离、平方 Euclidean 距离、尺度差分、模式差分、方差、形状或 Lance 和 Williams。(在“存在”和“不存在”中输入值以指定哪两个值有意义,“距离”将忽略其他所有值。)

【转换值】组允许您在计算近似性之前,为个案或变量标准化数据值。对二分类数据,这些转换不适用。可用的标准化方法有 z 得分、范围 –1 至 1、范围 0 至 1、1 的最大量级、1 的均值和使标准差为 1。

【转换测量】组允许您转换距离测量所生成的值。在计算了距离测量之后应用这些转换。可用的选项有绝对值、更改符号和重新调整到 0–1 范围。

在“距离相关”对话框中,选择好变量和标注,选择相似度量标准,单击度量按钮,弹出相似性度量对话框,如图5-11所示:

图5-11 IBM SPSS Statics20.0的相关性分析相似性度量对话框示意图

从“度量”组中选择与数据类型(定距或二分类)相应的选项,然后,在下拉列表中选择与该数据类型相应的测量。根据数据类型,可用的测量有:

• 定距数据。Pearson 相关或余弦。

• 二分类数据。Russell 和 Rao、简单匹配、Jaccard、切块、Rogers 和 Tanimoto、Sokal 和 Sneath 1、Sokal 和 Sneath 2、Sokal 和 Sneath 3、Kulczynski 1、Kulczynski 2、Sokal 和 Sneath 4、Hamann、Lambda、Anderberg 的 D、Yule 的 Y、Yule 的 Q、Ochiai、Sokal 和 Sneath 5、phi 4 点相关或离差。(在“存在”和“不存在”中输入值以指定哪两个值有意义,“距离”将忽略其他所有值。)

【转换值】组允许您在计算近似性之前,为个案或变量标准化数据值。对二分类数据,这些转换不适用。可用的标准化方法有 z 得分、范围 –1 至 1、范围 0 至 1、1 的最大量级、1 的均值和使标准差为 1。

【转换测量】组允许您转换距离测量所生成的值。在计算了距离测量之后应用这些转换。可用的选项有绝对值、更改符号和重新调整到 0–1 范围。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈