Python平均值(mean)、方差(var)和标准差(std)

Python平均值(mean)、方差(var)和标准差(std)4.python求均值、方差、标准差 #求均值 arr_mean = np.mean #求方差 arr_var = np.var #求标准差 a

大家好,欢迎来到IT知识分享网。

1.平均值(mean)

平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小;其数学定义为

Python平均值(mean)、方差(var)和标准差(std)

平均值计算公式

以下面10个点的CPU使用率数据为例

14 31 16 19 26 14 14 14 11 13

其平均值为17.2

2.方差、标准差

方差这一概念的目的是为了表示数据集中数据点的离散程度;其数学定义为:

Python平均值(mean)、方差(var)和标准差(std)

方差

标准差与方差一样,表示的也是数据点的离散程度;其在数学上定义为方差的平方根:

Python平均值(mean)、方差(var)和标准差(std)

标准差

3.为什么使用标准差?

Python平均值(mean)、方差(var)和标准差(std)

一个标准差 68%, 两个标准差 95%, 三个标准差 99%。

标准差定义是总体各单位标准值( xi)与其平均数(μ)离差平方和的算术平均数的平方根。它反映组内个体间的离散程度。

所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差。

标准计算公式:

假设有一组数值X₁,X₂,X₃,……Xn(皆为实数),其平均值(算术平均值)为μ,公式如图1。

标准差也被称为标准偏差,或者实验标准差,公式为

Python平均值(mean)、方差(var)和标准差(std)

一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差约为17.08分,B组的标准差约为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。

一个标准差 68%, 两个标准差 95%, 三个标准差 99%。

与方差相比,使用标准差来表示数据点的离散程度有3个好处:

  1. 表示离散程度的数字与样本数据点的数量级一致,更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例,其方差约为41,而标准差则为6.4;两者相比较,标准差更适合人理解。
  2. 表示离散程度的数字单位与样本数据的单位一致,更方便做后续的分析运算。
  3. 在样本数据大致符合正态分布的情况下,标准差具有方便估算的特性:66.7%的数据点落在平均值前后1个标准差的范围内、95%的数据点落在平均值前后2个标准差的范围内,而99%的数据点将会落在平均值前后3个标准差的范围内。

4.python求均值、方差、标准差

#求均值

arr_mean = np.mean(arr)

#求方差

arr_var = np.var(arr)

#求标准差

arr_std = np.std(arr,ddof=1)

print(“平均值为:%f” % arr_mean)

print(“方差为:%f” % arr_var)

print(“标准差为:%f” % arr_std)

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/51212.html

(0)
上一篇 2024-04-27 07:22
下一篇 2024-04-27 11:45

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信