大家好,欢迎来到IT知识分享网。
我们常需要考察某变量和其他很多变量之间的线性相关性,比如,考察A和B、A和C的相关性,然后,我们想知道A和B更相关,还是A和C更相关?这时候应该怎么处理呢?
简单来说,我们可以对A和B、A和C分别做简单线性相关,如果,两个相关系数均没有统计学意义(即p均>0.05),那也没有必要比较A和B还是和C更相关了。所以,咱们的前提是:A和B、A和C之间的相关系数有统计学意义(即p均<0.05)。
比如,图中蓝线代表的是A和B,橙线代表的是A和C。
SPSS给出的结果如下表,两个相关系数均有统计学意义,其中r_AB=0.54(p<0.001),r_AC=0.747(p<0.001)。表面看上去,r_AC>r_AB,是不是说明A和C之间更相关呢?
我们知道单纯比较并不可靠,如果有适当的统计学检验能加以佐证结果,就比较有说服力了。首先,我们可以分别求出两个相关系数的置信区间,然后考察两个区间的关系,以比较两个相关系数。
其实求相关系数的置信区间很简单,在简单相关的界面,选中自助抽样(英文为Bootstrap),选择执行自助抽样。
咱们看SPSS的结果,r_AB=0.54,区间为0.353至0.747;r_AC=0.747,区间为0.618~0.857。二者的置信区间有交叉,说明两个相关系数的差异是没有统计学意义的,也就是说,通过统计学检验,两个相关系数是一样的,并不是我们认为的A和C更相关。
当然,还有另外一种方法,只需要知道相关系数r和样本量n。刚刚的例子中,r_AB=0.54,r_AC=0.747,样本量均为54,可求出
u值服从标准正态分布,如果u>1.96或者u<-1.96,则说明p<0.05;如果-1.96<u<1.96,则说明p>0.05。例子中u= -1.828,在 -1.96和1.96之间,说明p>0.05,两个相关系数在统计学上没有差异。当然,有读者会提出如果相关系数是负的怎么办呢,因为我们考察的是相关程度,直接用相关系数的绝对值即可。
End.
作者:杨老师 (中国统计网特邀认证作者)
本文为头条号作者原创。未经允许,不得转载。
运行人员:中国统计网小编(微信号:itongjilove)
中国统计网,是国内最早的大数据学习网站,公众号:中国统计网
http://www.itongji.cn
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/92543.html