【概率论与数理统计01】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(上)

【概率论与数理统计01】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(上)前记:大多数通信领域的论文都用到了复杂的数学工具,而数学推导中其中很大一部分都涉及到了概率论的知识,痛恨当时自己没有好好学(大哭)。所以今天又来开一个新坑,我一遍学一遍填,希望有朝一日能把这个坑筑成一座楼。统计分布在概率论中占有重要地位,是一些分析研究的基础,然而每个分布都有自己与众不同的特性,仿佛是一个个性格迥异的人,但是他们都生活在概率论这个村子里,彼此之间有着不可告人小秘密,今天就来看一看那些年,这村子里的四兄弟(正态,伽马,伽马,卡方)之间的故事。0.经典中的经典  开篇放一个大招镇.

大家好,欢迎来到IT知识分享网。

前记:大多数通信领域的论文都用到了复杂的数学工具,而数学推导中其中很大一部分都涉及到了概率论的知识,痛恨当时自己没有好好学(大哭)。所以今天又来开一个新坑,我一遍学一遍填,希望有朝一日能把这个坑筑成一座楼。
统计分布在概率论中占有重要地位,是一些分析研究的基础,然而每个分布都有自己与众不同的特性,仿佛是一个个性格迥异的人,但是他们都生活在概率论这个村子里,彼此之间有着不可告人小秘密,今天就来看一看那些年,这村子里的四兄弟(正态,伽马,伽马,卡方)之间的故事。

0. 经典中的经典

    开篇放一个大招镇场子,这个概率分布的族谱包括19个离散和57个连续性分布,但是一般人是记不住这么多分布的(不过我听说真的有人把这些分布的特性都记住,向大佬膜拜orz),最好的方法是随用随学,善用搜索,哪里不会补哪里,不过一些重要的分布还是要记住的。贴上原图链接: Univariate Distribution Relationship Chart
    除了这个图,wiki百科也是一个很好的学习资源,不知道为什么wiki百科上英文版的介绍比中文版的全…。其次Random Website也是一个比较方便和全面学习概率的网站。以上举的这两个网址都是比较数学化的,接下来介绍一个数学科普类读物,是靳志辉先生著的《火光摇曳》,本书前几章介绍了正态分布和伽马函数的来源,很有意思,建议有时间看一看。

  • 【概率论与数理统计01】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(上)


    图1 概率分布关系图
  •     很明显,今天我们要介绍的四兄弟在他们的族谱中都处在中心位置(画红圈的那几个),毫不夸张的说,这四兄弟及其衍生分布占据了家族的半壁江山。考虑到这个图有些凌乱,我画了一个简化图,看看他们之间的关系到底如何。

  • 【概率论与数理统计01】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(上)


    图2 四个分布关系简图
  • \newline
    \newline

    1. 威武的大哥——正态分布

        《火光摇曳》里第一句话是这么讲的:

        神说,

        要有正态分布,

        就有了正态分布。

        神看正态分布是好的,

        就让随机误差就服从了正态分布。

        正态分布看似很神秘,但其实在我们的生活中随处可见,比如最近刚出炉的高考成绩,人群的身高等等都服从近似的正态分布。为什么正态分布会如此常见呢?这是因为中心极限定理(Central Limit Theorems,CLT)的缘故,定理指出在适当的条件下,大量相互独立随机变量的均值经过适当标准化后收敛于正态分布。即当一个随机事件取样足够大时,结果近似为正态分布。 但要注意的是使用中心极限定理时,这两个条件需要满足:第一个条件就是取样需要随机,比如在观测成绩分布时,不能总盯着名校的尖子生看,要一视同仁,同等看待。第二个条件就是影响结果的因素是相互独立或者影响比较小的,以身高为例,父母的身高和是否热爱运动都会对身高产生影响,但是这两个因素的关系并不大,因此身高的人群分布曲线可以近似为正态分布。
        我个人认为正态分布的钟形分布曲线是最美观的,不仅形状优雅,还充满着对称之美。

  • 【概率论与数理统计01】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(上)


    图3 正态分布概率密度曲线
  •     若一个随机变量 X X X 满足正态分布,即 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2), 那么其概率密度函数可写为
    f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f_X(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} fX(x)=2π
    σ
    1
    e2σ2(xμ)2

    其中 E ( X ) = μ E(X) = \mu E(X)=μ 表示期望, D ( X ) = σ 2 D(X) = \sigma^2 D(X)=σ2 表示方差。若期望为 0,方差为 1,则定义为标准正态分布,概率密度函数为
    ϕ ( x ) = 1 2 π e − x 2 / 2 \phi(x) = \frac{1}{\sqrt{2\pi}}e^{-x^2/2} ϕ(x)=2π
    1
    ex2/2

    其一阶导数满足 ϕ ′ ( x ) = − x ϕ ( x ) \phi^\prime(x) = -x\phi(x) ϕ(x)=xϕ(x),说明概率密度函数在 x < 0 x<0 x<0 时单调递增,在 x > 0 x>0 x>0 时单调递减。其二阶导数满足 ϕ ′ ′ ( x ) = ( x 2 − 1 ) ϕ ( x ) \phi”(x) = (x^2-1)\phi(x) ϕ(x)=(x21)ϕ(x),说明概率密度函数在 − 1 ≤ x ≤ 1 -1 \le x \le 1 1x1 时为凹函数,其余区间为凸函数。
        另外正态分布满足独立可加性,若两个独立的随机变量 X 1 X_1 X1 X 2 X_2 X2 分别满足 X 1 ∼ N ( μ 1 , σ 1 2 ) X_1 \sim N(\mu_1,\sigma^2_1) X1N(μ1,σ12) X 2 ∼ N ( μ 2 , σ 2 2 ) X_2 \sim N(\mu_2,\sigma^2_2) X2N(μ2,σ22),那么 X 1 + X 2 ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) X_1+X_2 \sim N(\mu_1+\mu_2,\sigma^2_1+\sigma^2_2) X1+X2N(μ1+μ2,σ12+σ22)

    \newline
    \newline

    2. 神秘的二哥——伽马分布

    伽马函数

        提到伽马分布不得不提到伽马函数,这个函数看起来很奇怪,是一个幂函数与指数函数相乘的积分形式
    Γ ( k ) = ∫ 0 ∞ x k − 1 e − x d x , k ∈ ( 0 , ∞ ) \Gamma(k) = \int_{0}^{\infty}x^{k-1}e^{-x}dx, \quad k\in(0,\infty) Γ(k)=0xk1exdx,k(0,)

    利用分部积分法可得
    Γ ( k + 1 ) = ∫ 0 ∞ x k e − x d x = ( − x k e − x ) ∣ 0 ∞ + ∫ 0 ∞ k x k − 1 e − x d x = k Γ ( k ) \Gamma(k+1) = \int_{0}^{\infty}x^{k}e^{-x}dx=(-x^ke^{-x})|^{\infty}_0+ \int_{0}^{\infty}kx^{k-1}e^{-x}dx = k\Gamma(k) Γ(k+1)=0xkexdx=(xkex)0+0kxk1exdx=kΓ(k)

    也就是 Γ ( k + 1 ) / Γ ( k ) = k \Gamma(k+1) /\Gamma(k) =k Γ(k+1)/Γ(k)=k,很显然 Γ ( 1 ) = 1 \Gamma(1) = 1 Γ(1)=1,那么 Γ ( k ) = ( k − 1 ) ! \Gamma(k) = (k-1)! Γ(k)=(k1)!。发现没有,伽马函数竟然能化简成阶乘的形式!自从中世纪以来,有许多数学家都在探索阶乘的秘密,他们试图将阶乘写成有关 n n n 的函数,例如著名的斯特林公式,但是这只是近似,在 n n n 较小时仍存在很大误差。因此伽马函数被赋予了特殊的意义——阶乘的另一种形式。然而我们在高中学习的阶乘仅在自然数域有意义,而伽马函数将阶乘的定义域扩充到了全体非负数,举个例子 1 2 ! = π 2 \frac{1}{2}!=\frac{\sqrt{\pi}}{2} 21!=2π

    伽马分布

        介绍完了伽马函数,接下来进入正题伽马分布,把伽马函数等式的左端移到右端,被积的函数就是标准伽马分布的概率密度函数
    f ( x ) = 1 Γ ( k ) x k − 1 e − x f(x) = \frac{1}{\Gamma(k)}x^{k-1}e^{-x} f(x)=Γ(k)1xk1ex

    设随机变量 X X X 服从标准伽马分布,记为 X ∼ G a ( α ) X \sim \rm{Ga}(\alpha) XGa(α) α \alpha α 即为 k k k,意思是形状参数(shape parameter)。例如当 α = 1 \alpha=1 α=1 时, X X X 服从标准指数分布;当 α > 1 \alpha >1 α>1 时, X X X 服从单峰分布。

  • 【概率论与数理统计01】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(上)


    图4 伽马分布概率密度曲线
  • 对随机变量 X X X 进行线性变换,令 Y = λ X Y=\lambda X Y=λX,其中 λ \lambda λ 为尺度参数(scale parameter),那么可以得到伽马分布的一般性表达式
    f ( x ) = λ α Γ ( α ) x α − 1 e − λ x f(x) = \frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x} f(x)=Γ(α)λαxα1eλx

    Y ∼ G a ( α , λ ) Y \sim \rm{Ga}(\alpha,\lambda) YGa(α,λ),这里也存在一个特例, α = n / 2 \alpha = n/2 α=n/2 λ = 1 / 2 \lambda=1/2 λ=1/2 的伽马分布是自由度为 n n n 的卡方分布。伽马分布的期望 E ( Y ) = α / λ E(Y)=\alpha/\lambda E(Y)=α/λ,方差 D ( Y ) = α / λ 2 D(Y)=\alpha/\lambda^2 D(Y)=α/λ2

    伽马分布的线性性质

        设 X ∼ G a ( α 1 , λ ) X \sim \rm{Ga}(\alpha_1,\lambda) XGa(α1,λ) Y ∼ G a ( α 2 , λ ) Y \sim \rm{Ga}(\alpha_2,\lambda) YGa(α2,λ),且 X X X Y Y Y 独立,则 X + Y ∼ G a ( α 1 + α 2 , λ ) X+Y \sim \rm{Ga}(\alpha_1+\alpha_2,\lambda) X+YGa(α1+α2,λ),该性质可由卷积公式求联合概率密度得到。这个结论表明,两个尺度参数相同的独立伽马变量相加后仍为伽马变量,尺度参数不变,形状参数为相加和。这个结论可推广到多个独立伽马变量相加,但当形状参数趋近于无穷时,根据中心极限定理,此时的伽马分布可近似为正态分布。
        伽马分布具有简单的线性性质,若 X ∼ G a ( α 1 , λ ) X \sim \rm{Ga}(\alpha_1,\lambda) XGa(α1,λ) Z = a X + b Z=aX+b Z=aX+b,则 Z − b ∼ G a ( α 1 , λ / a ) Z-b \sim \rm{Ga}(\alpha_1,\lambda/a) ZbGa(α1,λ/a),这个可以由反函数的概率密度公式推导得出。这个结论表明伽马分布的线性变换保证形状参数不变。

    正态分布转化为伽马分布

        设一个正态分布 X ∼ N ( 0 , σ 2 ) X \sim N(0,\sigma^2) XN(0,σ2),则 Y = X 2 Y = X^2 Y=X2 服从伽马分布,证明如下:
    y > 0 y>0 y>0 时, Y Y Y 的分布函数为
    F Y ( y ) = P ( X 2 ≤ y ) = P ( − y ≤ X ≤ y ) = F X ( y ) − F X ( − y ) . F_Y(y)=P(X^2 \le y) = P(-\sqrt{y}\le X \le \sqrt{y}) = F_X(\sqrt{y}) – F_X(-\sqrt{y}). FY(y)=P(X2y)=P(y
    Xy
    )=
    FX(y
    )
    FX(y
    ).

    对上式两边关于 y y y 求导,得
    P Y ( y ) = P X ( y ) 1 2 y + P X ( − y ) 1 2 y P_Y(y) = P_X(\sqrt{y}) \frac{1}{2\sqrt{y}}+P_X(-\sqrt{y}) \frac{1}{2\sqrt{y}} PY(y)=PX(y
    )2y
    1
    +
    PX(y
    )2y
    1

    整理后为
    P Y ( y ) = { 1 2 π y σ e − y 2 σ 2 , y > 0 0 , 其 他 . P_Y(y) = \left\{ \begin{aligned} \frac{1}{\sqrt{2\pi y}\sigma}e^{-\frac{y}{2\sigma^2}},\quad &y>0\\ 0,\qquad\quad&其他. \end{aligned} \right. PY(y)=2πy
    σ
    1
    e2σ2y,
    0,
    y>0.

    Y ∼ G a ( 1 2 , 1 2 σ 2 ) Y \sim \rm{Ga}(\frac{1}{2},\frac{1}{2\sigma^2}) YGa(21,2σ21)

    其实这个性质可以由卡方分布简单的得出,因为 X ∼ N ( 0 , σ 2 ) X \sim N(0,\sigma^2) XN(0,σ2),那么 X 2 σ 2 ∼ χ 2 ( 1 ) \frac{X^2}{\sigma^2} \sim \chi^2(1) σ2X2χ2(1),服从自由度为 1 的卡方分布。 X 2 ∼ σ 2 χ 2 ( 1 ) X^2 \sim \sigma^2\chi^2(1) X2σ2χ2(1)成立,因为卡方分布时伽马分布的一种特殊情况因此, G a ( 1 2 , 1 2 ) \rm{Ga}(\frac{1}{2},\frac{1}{2}) Ga(21,21) χ 2 ( 1 ) \chi^2(1) χ2(1) 等价。根据伽马分布的线性变换, σ 2 G a ( 1 2 , 1 2 ) \sigma^2\rm{Ga}(\frac{1}{2},\frac{1}{2}) σ2Ga(21,21) = G a ( 1 2 , 1 2 σ 2 ) \rm{Ga}(\frac{1}{2},\frac{1}{2\sigma^2}) Ga(21,2σ21),证毕。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/15268.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信