首页 百科知识 四格表资料的χ

四格表资料的χ

时间:2023-02-21 百科知识 版权反馈
【摘要】:图8-1 大学生是否兼职情况(二)操作四格表资料的χ2检验可通过菜单“Analyze”→“Descriptive Statistics”→“Crosstabs...”实现。用鼠标在“Chi-square”左侧的方框点击一下即可打上“√”,表示选择做χ2检验,点击“Continue”按钮,回到图8-3。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计算默认计算时间限制在5分钟内。
四格表资料的χ&;;_社会调查与统计分析实验教材

例8-1 某研究者想了解某校在校大学生不同性别的兼职情况是否相同,随机抽取了某校大学生44人,调查他们的兼职情况(结果为兼职、不兼职)。问该校男女兼职率是否不同钥

(一)分析

男女大学生是否兼职,这属于二分类变量资料(即两样本率的比较问题)。在SPSS中进行两样本率的比较在“Crosstabs”交叉表模块进行。数据录入格式如图8-1所示。其中,每行表示一名学生,每列表示一个变量;性别变量“1”表示男性,“2”表示女性;兼职变量“1”表示兼职,“0”表示不兼职。

图8-1 大学生是否兼职情况

(二)操作

(1)四格表资料的χ2检验可通过菜单“Analyze”→“Descriptive Statistics”→“Crosstabs...”实现。

(2)点击“Crosstabs...”,弹出的对话框如图8-2所示。在左侧的变量列表中,选中行变量“性别”,单击按钮“”,将变量选入到“Row(s)”列表框中;将列变量“兼职”选入到“Column(s)”列表框中,如图8-3所示。

(3)点击图8-3右上方的“Statistics...”按钮,系统会弹出一个新的界面(见图8-4)。用鼠标在“Chi-square”左侧的方框点击一下即可打上“√”,表示选择做χ2检验,点击“Continue”按钮,回到图8-3。

(4)点击“Cells...”,弹出一个新的界面(见图8-5),可根据结果显示的需要,选择“Observed”(显示四个格子的实际频数)、“Expected”(计算四个格子的理论频数)、“Row”(显示行百分比)、“Column”(显示列百分比)或“Total”(显示合计的行和列百分比),然后点击“Continue”按钮,即回到图8-3,最后再点击“OK”按钮,即可得到统计分析结果。

图8-2 Crosstabs对话框(1)

图8-3 Crosstabs对话框(2)

图8-4 Crosstabs:Statistics对话框

图8-5 Crosstabs:Cell Display对话框

(三)界面说明

对如图8 2所示的界面简介如下:

(1)“Row(s)”:用于选择行×列表中的行变量。

(2)“Column(s)”:用于选择行×列表中的列变量。

(3)“Layer”:Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入“Layer”框,并用“Previous”和“Next”按钮设为不同层。

(4)“Display clustered bar charts”:显示重叠条图。

(5)“Suppress tables”:禁止在结果中输出行×列表。

(6)“Exact...”:针对2×2以上的行×列表设定计算确切概率的方法,可以是近似计算(Asymptotic only)、蒙特卡罗模拟(Monte Carlo)或确切计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计算默认计算时间限制在5分钟内。这些默认值均可更改。

(7)“Statistics...”:弹出Statistics对话框(见图8 4),用于定义所需计算的统计量:

①“Chi-square”:计算χ2值。

②“Correlations”:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

③“Norminal”:选择是否输出反映分类资料相关性的指标,很少使用。

“Contingency coefficient”:列联系数,其值介于0~1;

“Phi and Cramer's V”:这两者也是基于χ2值的,Phi在四格表χ2检验中介于-1~1,在R×C表χ2检验中介于0~1,Cramer's V则介于0~1;

“Lambda”:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;

“Uncertainty coefficient”:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。

④“Ordinal”:选择是否输出反映有序分类资料相关性的指标,很少使用。

“Gamma”:介于0~1,所有观察实际数集中于左上角和右下角时,其值为1;

“Somers'd”:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;

“Kendall's tau-b”:介于-1~1;

“Kendall's tau-c”:介于-1~1。

⑤“Eta”:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例。

⑥“Kappa”:计算Kappa值,即内部一致性系数。

⑦“Risk”:计算比数比OR值。

⑧“Mc Nemar”:进行Mc Nemar检验(配对χ2检验)。

⑨“Cochran's and Mantel-Haenszel statistics”:计算χ2 M-H统计量(分层χ2),可在下方输出H 0假设的OR值,默认为1。

(8)“Cells...”:点击弹出Cells对话框(见图8 5),用于定义列联表单元格中需要计算的指标:

①“Counts”:是否输出实际观察数(Observed)和理论数(Expected);

②“Percentages”:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total);

③“Residuals”:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数与理论数的差值除以理论数),或者由标准误确立的单元格残差(Adjusted Standardized)。

(四)结果解释

对例8 1进行卡方检验的输出结果如图8 6和图8 7所示。

图8-6 男女大学生兼职情况

图8 6为交叉列表,行变量为“性别”,列变量为“是否兼职”,其中“Count”为实际频数,“%within性别”为行百分比,即男性中兼职的百分比为45.5%,不兼职的百分比为54.5%;而女性中兼职的百分比为68.2%,不兼职的百分比为31.8%。

图8-7 男女大学生兼职情况卡方检验输出结果

图8 7给出了几种方法的检验结果,从左到右分别为:检验统计量值(Value)、自由度(df)、双侧近似概率(Asymp.Sig.(2-sided))、双侧精确概率(Exact Sig.(2-sided))、单侧精确概率(Exact Sig.(1-sided))。从上到下分别为: Pearson卡方(Pearson Chi-square)、连续性校正的卡方(Continuity Correction)、对数似然比方法计算的卡方(Likelihood Ratio)、Fisher's精确概率法(Fisher's Exact Test)、线性相关的卡方值(Linear-by-Linear Association)、有效记录数(N of Valid Cases)。另外,“Pearson Chi-square”卡方值2.316处标注有a表示没有格子的理论频数小于5;“Continuity Correction”处标注有b表示只为2×2表计算。

在实际工作中,对于四格表资料,通常规定:

(1)当n≥40且所有的T≥5时,用四格表卡方检验(Pearson Chisquare)。

(2)当n≥40但有1≤T<5时,用连续性校正的卡方检验(Continuity Correction)。

(3)当n<40或T<1时,这时不能用卡方检验,需改用Fisher's精确概率法(Fisher's Exact Test)。

本例中n=44>40且所有的T≥5,满足四格表卡方检验的条件,无须校正,可直接采用第一行Pearson Chi-square的结果(见图8 7),χ2=2.316, P=0.218>0.05。即在是否兼职这一调查结果中,男生和女生的比例差异无统计学意义。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈