大家好,欢迎来到IT知识分享网。
第一章 绪论
1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。
2,教育统计学分为描述统计、推断统计和实验设计三类。
(1) 描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐系数、多系列相关系数)反映一致性程度。
(2) 推断统计包括总体参数估计和假设检验两部分。
3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。
随机事件:随机现象的每一种结果。
随机变量:把能表示随机现象各种结果的变量称之
4,总体:是我们研究的具有某种共同特性的个体的总和。
样本数目大于30称为大样本,小于等于30称为小样本。
第二章 数据的初步整理
1,教统资料来源有经常性资料和专题性资料。
专题性资料包括(1)教育调查。按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。(2)教育实验。分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合)
2,数据的分类。按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。
3,频数分布表制作步骤:求全距;决定组数和组距;决定组限;登记频数。
4,用累计频数表示的频数分布表称为累计频数分布表。
第三章 集中量
1,集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。
2,加权平均数:是不同比重数据(或平均数)的平均数。
几何平均数:是n个数值连乘积的n次方根。
调和平均数:是一组数据倒算的算术平均数的倒数,亦称倒数平均数。
第四章 差异量
1,差异量是指表示一组数据变异程度或离散程度的量。差异量越大,表示数据分布越广,越不整齐;相反,表示分布越集中,变动范围越小。
2,全距是一组数据中最大值与最小值之差,又称极差,用R表示。
四分位距是指用依一定顺序排列的一组数据中间部分50%个频数距离的一半作为差异量指标。四分位距就是第三个四分位数(第75百分位数)与第一个四分位数(第25半分位数)差的一半。
百分位距是指两个百分位数之差。常用的有两种:一为第90与第10百分位数之差;一为第93与第7百分位数之差。
3,标准差越大,表明离散程度越大,即数据越参差不齐,分布范围越广。
4,差异系数是指标准差与其算术平均数的百分比。用CV表示。差异系数越大表明离散程度越大。
5,偏态量和峰态量是用以描述数据分布特征的统计量。
第五章 概率及概率分布
1,互不相容事件是指在一次试验中不可能出现的事件。
独立事件指A事件出现的概率不影响B事件出现的概率。
2,二项试验满足条件:一次试验只有两种可能结果,即成功和失败;各次试验相互独立;各次试验中成功的概率相等。
二项分布是一种离散型随机变量的概率分布。
当二项分布接近正态分布时,在N次二项试验中成功事件出现次数的平均数为np 标准差npq的开方。
3,在正态分布中,当平均数相等时,标准差越大,峰越低,覆盖范围越广即峰越宽。当标准差相等时,峰的形状不变,但中心不同,平均数越大,峰越靠近右。
第六章 抽样分布及总体平均数的推断
1,区分以下三种不同性质的分布:
总体分布:总体内个体数值的频数分布;
样本分布:样本内个体数值的频数分布;
抽样分布:某一种统计量的概率分布;
2,抽样分布是统计推断的理论依据。抽样误差我们用抽样分布上的标准差来表示,因此,某种统计量在抽样分布上的标准差称为该统计量的标准误。如:平均数抽样分布的标准差称为平均数的标准误。标准误越小,可靠度越大。标准误是统计推断可靠性的指标。
3,对总体参数的推断有两种形式:总体参数估计(即根据样本统计量对相应总体参数所做的估计,分为点估计和区间估计)和假设检验(即利用样本信息,根据一定概率,对总体参数或分布的某一假设做出拒绝或保留的决断)
4,关于显著性水平:显著性水平越高(a值越小),越不容易拒绝零假设,可靠性越大。
第七章 平均数差异的显著性检测
1、【相关样本】两个样本内个体之间存在着一一对应关系,这两个样本称为相关样本。①一种是用同一个测验对同一组被试在实验前后进行两次测验,所获得的两组测验结果是相关样本。②另一种是根据某些条件基本相同的原则,把被试一一配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一个测验所获得的测验结果,也是相关样本。
2、【独立样本】两个样本内的个体是随机抽取的,它们之间不存在一一对应关系,这样的样本称为独立样本。
3、【方差齐性检验】对两个总体的方差是否有显著性差异所进行的检验称为方差齐性(相等)检验。对两个独立样本方差是否齐性,要进行F检验。
第八章 方差分析
1、【方差分析的目的】在比较多组平均数的时候,人们常用方差分析综合性地确定几个平均数差异的显著性。
2、组间差异对组内差异的比值越大,则各组平均数的差异越明显。
3、【单因素实验】只有一个自变量的实验称为单因素实验。
4、【多因素实验】有两个或两个以上自变量的实验称为多因素实验。
5、【随机区组设计的方差分析】在检验某一因素多种不同水平(即不同实验处理)之间差异的显著性时,为了减少被试间个别差异对结果的影响,把从同一个总体中抽取的被试条件相同的原则分成各组(称区组),使每个区组内的被试尽量保持同质。在对各区组施以多种实验处理之后,用方差分析法对这多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析。
第九章 总体比率的推断
1、对点计数据的统计决断,不能采用前述的统计推断方法,而应采用总体比率的推断方法或x²检验。
2、比率的抽样分布是二项分布。
第十章 X²检验
1、【x²检验】x²检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
2、【单向表】把实得的点计数据按一种分类标准编制成表就是单向表。
3、【双向表】把实得的点计数据按两种分类标准编制成表就是双向表。对双向表的数据所进行的x²检验,就是双向表的x²检验。
4、【同质性检验】在双向表x²的检验中,如果是判断几次重复实验的结果是否相同,这种x²检验称为同质性检验。
第十一章 相关分析
1、【相关关系】两个变量之间不精确、不稳定的变化关系称为相关关系。
2、【相关系数】用来描述两个变量相互之间变化方向及密切程度的数字特征称为相关系数,一般用r表示。
3、【积差相关】当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量之间的相关称为积差相关。
4、【协方差】协方差是两个变量离差乘积之和除以n所得之商。
5、【等级相关】等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。(斯皮尔曼等级相关及肯德尔和谐系数多列等级相关)
6、【斯皮尔曼等级相关】当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定成正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为斯皮尔曼等级相关。
7、【等级秩序性分数】根据某种标准对某项成绩所评定的等级,或按某种指标的优劣程度所排列的名次等,均属于等级秩序性分数。
8、【肯德尔和谐系数】当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量,称为肯德尔和谐系数。
9、【点二列相关】当两个变量其中一个是正态连续性变量,另一个是真正的二分名义变量,这时,表示这两个变量之间的相关,称为点二列相关。
第十二章 回归分析
1、【回归分析】如果我们将存在相关的两个变量,一个作为自变量,另一个作为因变量,并把两者之间不十分准确、稳定的关系,用数学方程式来表达,则可利用该方程由自变量的值来估计、预测因变量的估计值,这一过程称为回归分析。
2、【回归线】如果散点的分布有明确的直线趋势,我们就可以配制一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线。
3、【最小二乘法】在配制回归线时,回归线系数(b)的确定原则是使散布图上相应点的纵向距离平方和为最小,这种求b的方法称为最小二乘法。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/123535.html