公卫人

 找回密码
 立即注册

QQ登录

只需一步,快速开始

不劳无获:如何获取钢镚? 因为论坛,所以相逢。 捐赠百科答题至尊

公卫考研:一起风雨兼程 因为梦想,所以努力。 真题答案政治英语

职称考试:诸君逢考必过 因为热爱,所以执着。 模拟考场技能执医中级

查看: 130|回复: 2

[经验] 丁小丁SPSS系列专讲33:卡方检验(1)

[复制链接]
小食指1991 发表于 2017-10-9 12:35:45 | 显示全部楼层 |阅读模式

注册后推荐绑定QQ,之后方才可以使用下方的“用QQ帐号登录”。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
前面我们学习了t检验,单因素方差分析和部分非参数检验,这些都是为了处理计量数据而使用到的具体方法,现在,我们要学习的是计数资料的统计分析,卡方检验正是这类数据的首选。与t检验和方差分析不同的是,卡方检验是一种非参数检验。它的操作依然很简单,分分钟就能学会,但其背后所需要了解的理论知识却也不少,只有掌握了这些理论性的东西,我们才会知道,当卡方检验得出结果之后要以哪些为准。& ]( Q9 x7 R! F# }7 R
但在进行卡方检验之前,有一点极其重要,就是搞清楚原因变量和结果变量,一般而言,原因变量是分组变量,而结果变量就我们的研究目的所对应的变量,当此两者相互对调时,得出的结论以及使用的方法是有区别的。
! i! B) W* S) [  T8 E卡方检验的学习,我们将从原因和结果变量是否有序展开,首先,我们先来了解当原因变量和结果变量均为无序分类资料时的做法。接下来咱们继续以07-01为例,由于研究目的是比较试验组和对照组在疗效上有无差异,故而疗效即为研究目的(结果变量),自然地,组别就是原因变量。其次,因为组别和疗效在此处均为二分类数据,所以这份交叉表则为2×2的表格,套话叫四格表,假如其中一个变量是3分类,另一个是4分类,那么就是3×4,就叫12格列联表。
2 g, P( z3 p' W: l 图片1.jpg $ H0 m7 d' m. W. d- `' v: s$ o
第一步,一定记着给频数变量加权,上讲说过其操作方法。
% d4 e1 @9 d/ r第二步,在交叉表里进行卡方分析。
( G' o+ f3 X& a+ I 图片2.jpg
' [0 Q, ]8 Z* H+ U  q% n* p第三步,将原因变量和结果变量选入行与列框中,至于谁在行,谁在列结果是一样的,但习惯上,我们会将原因变量选入行,将结果变量选入列,不过在一些实际情况下,我们需要变通,切不可一概而论。7 N( T) `* j2 x, j7 L
图片3.jpg
6 }+ I3 W/ J, V; h$ }精确选项,在卡方检验里这个选项还是很重要的,尤其在除四格表之外的列联表检验时,一定要选上。为什么呢?因为选上以后能够在结果中出现Fisher确切概率法的结果,四格表数据之所以可以不选,是因为它的结果中自带Fisher结果。+ y- k% ~+ ^  a9 s
图片4.jpg
/ h$ j9 j2 }8 Y. t  t4 q6 v; a  k; M统计量选项,选择卡方即可,至于相关性,名义,有序,按区间标定,以及Kappa,风险都是做其他检验的,后面的课程会涉及到,然后McNemar是做配对卡方的,最下面CMH统计量是进行分层卡方分析的。大家注意,每当你在一个选项之下勾选部分功能以后,一定不要忘记点下面的继续,如果是直接关闭掉此对话框,刚才的操作是不会保留下的。# u% f* x9 l  i/ }
图片5.jpg 6 P& H4 l) q, D$ U3 R6 j2 Q
单元格选项,系统默认的是观察值(俗名实际频数),我们最开始学习时可以勾选期望值(理论票数),等做熟练以后就可以不用选了。卡方检验的原理就隐藏在其中,即卡方的目的就是看实际频数与理论频数的吻合程度怎么样。另外就是百分比的选项框,由于卡方检验主要是比较构成比或率的差异,因此这地方就得选上百分比,那么,我们到底应该选行还是列,或者总计的百分比呢?很简单,你只需和原因变量的选入保持一致就行了,比如,我们之前将原因变量选入了行里,所以此处也就对应选择行百分比,如果你的原因变量被选入到列里,此处就选择列百分比即可。
& k( l9 q  E0 u2 N; C 图片6.jpg ) j7 ^- H3 r. l( W
剩余两个选项菜单可以默认,确定以后出现结果。第一张为案例处理摘要,主要是看有多少案列(样本量)参与,是否存在缺失。3 k+ P6 t; P/ ?. ^
图片7.jpg 1 s3 |2 Y# R8 Z( R  }' O; ?
第二张表即为计数资料的统计描述,其中计数是实际频数,期望的计数是理论频数,有同学会问,实际频数好理解,就是实际收集来的数据,试验组有效有多少案例,无效有多少案例等等,但理论频数是怎么来的呢?其实是这样的,我们从下表中可以发现有个行的合计与列的合计,行的合计是各组的例数,比如试验组104共例,对照组共有96例。而列的合计则表示,总的有效率和无效各是多少。不难看出,总有效率为88%,无效率为12%,我们以试验组为例试想一下,既然总的有效率是88%,也就是说,从理论上来讲,试验组104人中应该有88%的人有效,即104*88%=91.5人,同理,无效的人数应该有104*12%=12.5,余者以此类推。随后,我们也看到,在每组中还有我们选择过的行百分比(组别中的%),这个不用我多说,很容易看,比如试验组有效率为82.7%,对照组有效率为93.6%。" C* j. G' E' [
图片8.jpg + R' d' g. [' Y
第三张表非常重要,在卡方检验的结果里我们看到有Pearson卡方,连续校正,似然比,Fisher的精确检验,线性和线性组合,那么,我们在看最终结果时,到底以何者为准呢?重点来了,大家认真去记。
5 o4 P4 m( j- p# _$ k5 z. G+ b 图片9.jpg 9 w6 r# F4 f$ J* Z+ f
①Pearson卡方:当总样本量大于等于40,没有一个单元格的理论频数小于5时,看它的结果,在本例中,样本量200>40,此外,我们怎么样知道有没有理论频数小于5呢?很容易,可以看第二份表里的具体理论频数大小进行判断,但是这并不是一个好方法,最便捷的做法莫过于直接看卡方检验表之下的备注——a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 11.52。是的,系统会自动帮我完成这项工作,它不仅会告诉你有几个单元格的理论频数小于5(此处为0个,即没有),而且还能告诉你,最小的理论频数是多少(11.52)。既然Pearson卡方的前提条件满足了,我们不妨对结果进行解读,和前面学过的很类似,第一,我们先找到统计量卡方值(5.780),df为自由度,不用管它。第二,找出P值(0.016),此处虽然给出三个P值,但一般情况下看渐进就可以了。还是那句老话,每一个P值背后都隐藏着一对检验假设,此外也不例外。不过,对于现在的我们而言,要判断零假设和备择假设应该也非难事,我们只需把握住最核心的东西,知道零假设为无差异假设,备择假设为有差异假设即可。比如本例,零假设即为试验组和对照组有效率无差异,备择假设自然就是两组有效率有差异。因P=0.016,故零假设成立的可能性只有1.6%,不用说,实打实的小概率事件,所以拒绝零假设,接受备择假设,可认为试验组和对照组的有效率差异是有统计学意义的,那么它的现实意义又是什么呢?此刻,我们返回第二张统计描述的表,可以看到试验组的有效率(82.7%)低于对照组的有效率(93.6%),换言之,对照组的干预措施更加有效。至于其他的结果怎么看,什么时候看,我们下一讲接着唠。
# b* [! A. J$ e$ \9 i) D

评分

参与人数 1金钱 +100 收起 理由
epiman + 100 积极发布原创帖子内容,再接再厉!

查看全部评分

本帖被以下淘专辑推荐:

zhuiqiuwcl2 发表于 2017-10-9 19:08:37 | 显示全部楼层
赞赞赞赞赞赞赞赞
回复

使用道具 举报

mymemoryxzq 发表于 2017-10-13 15:44:12 | 显示全部楼层
66666正要学习
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

安卓版|我要捐赠|关于我们|接种问答|公卫人 ( 沪ICP备06060850号-3 )

GMT+8, 2017-10-23 19:29 , Processed in 0.185087 second(s), 46 queries , Gzip On, MemCache On.

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表