公卫人

 找回密码
 立即注册

QQ登录

只需一步,快速开始

不劳无获:如何获取钢镚? 因为论坛,所以相逢。 捐赠百科答题至尊

公卫考研:一起风雨兼程 因为梦想,所以努力。 真题答案政治英语

职称考试:诸君逢考必过 因为热爱,所以执着。 模拟考场技能执医中级

查看: 300|回复: 2

[经验] 丁小丁SPSS系列专讲33:卡方检验(1)

[复制链接]
小食指1991 发表于 2017-10-9 12:35:45 | 显示全部楼层 |阅读模式

注册后推荐绑定QQ,之后方才可以使用下方的“用QQ帐号登录”。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
前面我们学习了t检验,单因素方差分析和部分非参数检验,这些都是为了处理计量数据而使用到的具体方法,现在,我们要学习的是计数资料的统计分析,卡方检验正是这类数据的首选。与t检验和方差分析不同的是,卡方检验是一种非参数检验。它的操作依然很简单,分分钟就能学会,但其背后所需要了解的理论知识却也不少,只有掌握了这些理论性的东西,我们才会知道,当卡方检验得出结果之后要以哪些为准。
- M7 X- T" i- w4 ^. ]+ K2 k但在进行卡方检验之前,有一点极其重要,就是搞清楚原因变量和结果变量,一般而言,原因变量是分组变量,而结果变量就我们的研究目的所对应的变量,当此两者相互对调时,得出的结论以及使用的方法是有区别的。
/ j7 R9 l! U& P卡方检验的学习,我们将从原因和结果变量是否有序展开,首先,我们先来了解当原因变量和结果变量均为无序分类资料时的做法。接下来咱们继续以07-01为例,由于研究目的是比较试验组和对照组在疗效上有无差异,故而疗效即为研究目的(结果变量),自然地,组别就是原因变量。其次,因为组别和疗效在此处均为二分类数据,所以这份交叉表则为2×2的表格,套话叫四格表,假如其中一个变量是3分类,另一个是4分类,那么就是3×4,就叫12格列联表。0 A' [! O& C3 e
图片1.jpg
8 o% B: e% ~! v/ t第一步,一定记着给频数变量加权,上讲说过其操作方法。
6 F: d: `2 l1 |# I第二步,在交叉表里进行卡方分析。
7 I6 M, _4 O7 ?" _ 图片2.jpg / S% G' M* \7 g! A
第三步,将原因变量和结果变量选入行与列框中,至于谁在行,谁在列结果是一样的,但习惯上,我们会将原因变量选入行,将结果变量选入列,不过在一些实际情况下,我们需要变通,切不可一概而论。- c( p+ O/ v/ j, J
图片3.jpg $ V/ M% ?  h$ C4 U
精确选项,在卡方检验里这个选项还是很重要的,尤其在除四格表之外的列联表检验时,一定要选上。为什么呢?因为选上以后能够在结果中出现Fisher确切概率法的结果,四格表数据之所以可以不选,是因为它的结果中自带Fisher结果。
9 p3 w; }+ j( d7 m/ C& E5 w 图片4.jpg
+ v& t0 A3 z/ P/ Y* T, r* J' }统计量选项,选择卡方即可,至于相关性,名义,有序,按区间标定,以及Kappa,风险都是做其他检验的,后面的课程会涉及到,然后McNemar是做配对卡方的,最下面CMH统计量是进行分层卡方分析的。大家注意,每当你在一个选项之下勾选部分功能以后,一定不要忘记点下面的继续,如果是直接关闭掉此对话框,刚才的操作是不会保留下的。
( M# n) E3 {; P% [- Q% @* o) l6 T 图片5.jpg   q5 ~( S3 s" c+ U
单元格选项,系统默认的是观察值(俗名实际频数),我们最开始学习时可以勾选期望值(理论票数),等做熟练以后就可以不用选了。卡方检验的原理就隐藏在其中,即卡方的目的就是看实际频数与理论频数的吻合程度怎么样。另外就是百分比的选项框,由于卡方检验主要是比较构成比或率的差异,因此这地方就得选上百分比,那么,我们到底应该选行还是列,或者总计的百分比呢?很简单,你只需和原因变量的选入保持一致就行了,比如,我们之前将原因变量选入了行里,所以此处也就对应选择行百分比,如果你的原因变量被选入到列里,此处就选择列百分比即可。9 ~" t( `2 r4 T+ a# u" G" t
图片6.jpg
0 o- O, {& I. W剩余两个选项菜单可以默认,确定以后出现结果。第一张为案例处理摘要,主要是看有多少案列(样本量)参与,是否存在缺失。
" p" Z) |+ l. Q# n) p 图片7.jpg ; r- P1 j2 T; E8 y* Y$ I/ c; \' S
第二张表即为计数资料的统计描述,其中计数是实际频数,期望的计数是理论频数,有同学会问,实际频数好理解,就是实际收集来的数据,试验组有效有多少案例,无效有多少案例等等,但理论频数是怎么来的呢?其实是这样的,我们从下表中可以发现有个行的合计与列的合计,行的合计是各组的例数,比如试验组104共例,对照组共有96例。而列的合计则表示,总的有效率和无效各是多少。不难看出,总有效率为88%,无效率为12%,我们以试验组为例试想一下,既然总的有效率是88%,也就是说,从理论上来讲,试验组104人中应该有88%的人有效,即104*88%=91.5人,同理,无效的人数应该有104*12%=12.5,余者以此类推。随后,我们也看到,在每组中还有我们选择过的行百分比(组别中的%),这个不用我多说,很容易看,比如试验组有效率为82.7%,对照组有效率为93.6%。
4 V& z' P$ V$ O 图片8.jpg
$ D6 `+ f8 i4 N, A. A0 ~7 k# A! G! V& h第三张表非常重要,在卡方检验的结果里我们看到有Pearson卡方,连续校正,似然比,Fisher的精确检验,线性和线性组合,那么,我们在看最终结果时,到底以何者为准呢?重点来了,大家认真去记。# ^8 ?6 {. V5 O: K
图片9.jpg
0 _( F. k9 \4 b: k①Pearson卡方:当总样本量大于等于40,没有一个单元格的理论频数小于5时,看它的结果,在本例中,样本量200>40,此外,我们怎么样知道有没有理论频数小于5呢?很容易,可以看第二份表里的具体理论频数大小进行判断,但是这并不是一个好方法,最便捷的做法莫过于直接看卡方检验表之下的备注——a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 11.52。是的,系统会自动帮我完成这项工作,它不仅会告诉你有几个单元格的理论频数小于5(此处为0个,即没有),而且还能告诉你,最小的理论频数是多少(11.52)。既然Pearson卡方的前提条件满足了,我们不妨对结果进行解读,和前面学过的很类似,第一,我们先找到统计量卡方值(5.780),df为自由度,不用管它。第二,找出P值(0.016),此处虽然给出三个P值,但一般情况下看渐进就可以了。还是那句老话,每一个P值背后都隐藏着一对检验假设,此外也不例外。不过,对于现在的我们而言,要判断零假设和备择假设应该也非难事,我们只需把握住最核心的东西,知道零假设为无差异假设,备择假设为有差异假设即可。比如本例,零假设即为试验组和对照组有效率无差异,备择假设自然就是两组有效率有差异。因P=0.016,故零假设成立的可能性只有1.6%,不用说,实打实的小概率事件,所以拒绝零假设,接受备择假设,可认为试验组和对照组的有效率差异是有统计学意义的,那么它的现实意义又是什么呢?此刻,我们返回第二张统计描述的表,可以看到试验组的有效率(82.7%)低于对照组的有效率(93.6%),换言之,对照组的干预措施更加有效。至于其他的结果怎么看,什么时候看,我们下一讲接着唠。
. V: U1 H; {/ X2 q: g# I2 o

评分

参与人数 1钢镚 +100 收起 理由
epiman + 100 积极发布原创帖子内容,再接再厉!

查看全部评分

本帖被以下淘专辑推荐:

zhuiqiuwcl2 发表于 2017-10-9 19:08:37 | 显示全部楼层
赞赞赞赞赞赞赞赞
回复

使用道具 举报

mymemoryxzq 发表于 2017-10-13 15:44:12 | 显示全部楼层
66666正要学习
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

提现|充值|关于|接种|公卫人 ( 沪ICP备06060850号-3 )

GMT+8, 2018-4-22 05:15 , Processed in 0.333345 second(s), 40 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表