大家好,欢迎来到IT知识分享网。
之前我们学习了变量的相关关系、正相关和负相关的数字特征、样本相关系数、一元线性回归模型和经验回归模型,为了保证学习效果,同学们要及时回顾,同学们还有哪些疑问也可以留言提出哦!
高中数学 | 高中知识点解析与讲解8.4 – 分类变量与列联表!(建议收藏!)
今天,我们一起来了解一下分类变量和列联表吧!
一,经验回归模型求证过程
之前我们学习了经验回归模型,也知道了求该模型的方法为最小二乘法,今天我们来简单了解一下求该模型的过程吧!
首先,我们可以利用点到直线的距离来刻画散点与拟合直线之间的接近程度,因此,我们可以得到散点(xi,yi)(i=1,2,…,n)到直线y=bx+a的总距离为∑|yi-(bxi+a)|,(i=1,2,…,n),由于绝对值不方便计算,我们假设Q=∑(yi-bxi-a)^2,(i=1,2,…,n),我们知道Q越小越好,那么我们就可以求Q取最小值时的a和b,即之前学习过的^b和^a,其分别为:
^b=[∑(xi-¯x)(yi-¯y)]/[∑(xi-¯x)^2],(i=1,2,…,n)
^a=¯y-^b¯x
这部分同学们作为了解就可以了。
二,分 类 变 量
现实生活中,我们需要在一定的范围内,对不同现象或者性质之间是否存在相关性进行分析,这时,我们就需要对随机变量进行分类了。
一般的,为了表示方便,我们常使用一种特殊的随机变量对现象或者性质进行区分,我们称这类特殊的随机变量为分类变量,例如用1和0表示男性和女性等。
三,列 联 表
当我们分析样本空间Ω中一对分类变量之间的相互影响关系的时候,为了更加方便的分析,我们会使用2X2列联表。
例如,对于性别是否对体育锻炼的经常性有影响的分析中,有一对分类变量,分别是性别X和是否经常锻炼Y,那么我们可以得到列联表:
其中最后一行的前两个数分别为事件{Y=0}和{Y=1}中样本点的个数,最后一列的前两个数分别为事件{X=0}和{X=1}中样本点的个数,中间四个格子中的数分别为事件{X=x,Y=y}(x,y=0,1)中样本点的个数,右下角为样本空间中样本点的总数。
针对上述问题,我们可以得到如果性别对体育锻炼的经常性没有影响,则P(Y=1|X=0)=P(Y=1|X=1)。
今天,我们了解了分类变量和列联表,希望可以帮助同学们更好的进行高中数学学习哦!
同学们有任何不懂的内容可以留言提问,如果有需要的话我们会有习题类推文哦!
下一期我们将继续讨论数学学习的相关问题呀!如果你想知道更多,请关注我们哦!
本文由如意王学习室原创,欢迎关注,带你一起长知识!
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/88141.html