大家好,欢迎来到IT知识分享网。
常用统计术语
- 总体:具有相同性质的成员所组成的集合,它是指研究对象的全体。
- 个体:组成总体的基本单元
- 样本:从总体中抽出的若干个体所构成的集合,它是总体的一个子集。
- 样本单位:构成样本的每个个体
- 样本容量:样本中个体的数目
- 变量:相同性质的事物间表现差异性的某项特征
6.1 定量变量:其值是定量的,表现为数值大小,一般有度量衡单位。
(1)连续变量:表示在变量范围内可抽出某一范围的所有值,变量值之间是连续的、无限的
(2)离散变量:只能取得有限个不同数值,或无限可数多个不同数值
6.2 定性变量:其值是定性的,表示某个个体属于集中互不相容的类型中的一种。
- 参数(parameters):此类数据具有区间尺度的所有特性,此外有一个自然零点,数据值之间的比例是有意义的。 (例如:人的体重,飞行里程等)
- 统计数(statistics):是由样本计算所得的数值,它是描述样本特征的数量,如样本平局数 ,样本标准差等。
- 误差:也叫做实验误差(experimental error),是指实验中不可控因素所引起的观测值偏离真值的差异
- 随机误差:也称为抽样误差(sampling error)或偶然误差(accidental error), 它是由于实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。
- 系统误差:是由于实验处理以外的其他条件不一致所产生的带有倾向性的或定向性的偏差。 系统误差主要是由一些相对固定的因素引起,如仪器调校的差异,不同药品批次的差异,不同操作者操作习惯的差异等。系统误差在某种程度上是可以控制和避免的。
- 准确性:也称为准确度(accuracy), 只在调查或实验中某一实验指标或性状的观测值与真值接近的程度
- 精确度(precision):指调查或实验中同一实验指标或性状的重复观测值彼此接近的程度。
数据尺度
- 名目尺度:这类数据不表示数量,只能按照某种属性对客观事物进行分类和分组。 (例如:婚姻状况,性别,职业等)
- 顺序尺度:这类数据表示有序的关系系列 (例如:教育水平,军衔,顾客满意度等)
- 区间尺度:这类数据具有顺序尺度的所有特性,除此之外,任意两个数据值之间的差是有意义(可度量)的。 但这类数据没有自然零点,只有一个任意设定的零点,数据之间的比例没有意义。(例如,温度等)
- 比例尺度:此类数据具有区间尺度的所有特性,此外有一个自然零点,数据值之间的比例是有意义的。 (例如:人的体重,飞行里程等)
描述统计和推论统计
- 描述统计:列举, 组织以及用图形表示数据
- 推论统计:从不完整的信息中获得结论,即从特定样本中归 纳概括有关总体的结论
- 估计 (例如,估计华南地区 高血压的发生率)
- 假设检验 (例如, 检验一个新药对于降低胆固醇水平的有效性)
数据分布中心的度量
- 平均数(Mean)
- 中位数(Median)
- 众数(Mode)
数据分散性(Dispersion)或变异性(Variability)的度量
- 全距(Range):最大值与最小值之间的差距
- 方差(Variance)
- 标准差(Standard deviation)
变异系数
变异系数是样本变量的相对变异量,是不带单位的纯数。用变异系数可以比较不同样本相对变异程度的大小。
将样本标准差除以样本平均数,得出的百分比就是变异系数
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/49797.html