9 随机变量及其分布II
type
status
date
slug
summary
tags
category
icon
password
本课程为国家发展研究院朱晓宝老师所开设的《概率统计(B)》。
💫 连续型随机变量
取值连续的随机变量我们称为 连续型随机变量 。
取值离散意味着随机变量的值域是一个连续的集合,比如随机变量就是一个连续型随机变量:

在学习离散型随机变量时,我们为了更简单明了的了解其概率特征,我们引入了离散型随机变量的概率分布。那么对于连续型随机变量,我们是否也有类似的概念呢?
对于离散型的情况来说,随机变量可以取至多可数个值,我们可以考虑随机变量取每个值的概率。但是连续型可以这么做吗?实际上是不可以的,比如对于上面的来说,实际上的情况是(具体原因我们会在后面讨论)。
对于连续型随机变量,我们要引入的是以下的 概率密度函数 的概念:
概率密度函数
对于连续型随机变量,我们赋予其取值的概率密度,也就是概率密度函数。
概率密度函数用来衡量随机变量取值于某个小区间的概率:

连续型随机变量的概率密度函数满足
上面的式子某种意义上可以看作是概率密度函数的定义。如果越大,那么随机变量取值在附近的可能性就越大。
例 我们刚刚说,对于定义域为连续型随机变量来说,对于任意一点,我们有
因为
而当 的时候,我们有
所以根据夹逼定理:
那么就有
对于随机变量,我们自然关心它在取值在某个区间上的概率,那么这个值如何计算呢?
我们发现,我们现在能用的工具只有
我们就需要想办法把转换为上面的形式。我们可以考虑把区间进行分割:

也就是把区间拆成
这样,我们就把这个区间拆成了个不相交的区间的并。我们令,我们就可以把要求的概率写成
最后那个式子中已经出现了我们能使用的工具,可以将其转化为
但是还缺一点,在刚刚分割的过程中我们并没有要求,这该怎么保证呢?其实也很容易,我们只需要令,那么这个固定长度的区间就会被划分为无穷多份,每一份的长度就会趋于0。这样我们就有
等式右边其实就是我们学过的定积分的定义,因为当的时候,也是趋于0的。所以上述的概率其实就是
即在上的定积分。
概率密度函数的性质
首先是我们在上一部分推出的两个性质:
考虑概率密度函数的定义
我们可以得到概率密度函数是非负的:
此外,结合我们上面推出的随机变量在某个区间上的概率,我们可以发现
所以概率密度函数在 上的积分为1:
对于任意的区间 ,我们可以把 类似地划分成一些小区间,在最后积分的时候合并起来,我们就可以得到
我们在讲离散型随机变量的时候说过,如果有一个数列满足,那么它就能够构成一个概率分布;同样的,如果有一个函数满足,那么它就能构成一个概率密度函数。
分布函数
连续型随机变量自然也有分布函数,定义和离散型随机变量保持相同,为
有了上面概率密度的性质,我们就可以得出 连续型随机变量分布函数 的公式:
那么分布函数有什么特点呢?
- 递增。这一点和离散型随机变量一样,但离散型随机变量比较好理解,因为只有当遇到某一个取值点的时候,分布函数会发生跳跃,那连续型随机变量为什么会递增呢?
考虑,我们有
所以有,也就说明了是递增的。
- 连续。如果大家对比较熟悉,那连续也是容易证明的。,我们来证明当时,。
计算可得
因为连续,所以在上是有界的,所以存在,使得 恒成立。那我们只需要取 ,就有
所以分布函数是连续的。
- 。这一条和离散型随机变量的性质相同,证明方法也类似。
首先,利用概率密度函数的性质我们可以得出
那么就有。
其次,
- 连续型随机变量的分布函数与概率密度函数之间满足
当连续的时候,一定可导,因为
当时,我们有。这不仅证明了可导,还证明了。
例子
我们来看一些常见的连续性随机变量。
(我们以后用这个符号来表示随机变量服从分布)
例 均匀分布:
我们来计算它的分布函数。
当时,
当时,
当时,
所以的分布函数为
我们可以用这个例子来验证分布函数和概率密度函数的关系,我们对求导有:
这就是的表达式,所以我们就在这个例子中验证了。
例 指数分布(有时也写作),其概率密度函数为
类似地,我们求积分即可。
当时,我们有
当时,我们有
所以的分布函数为
分布函数的图像为

此外,当时,
例 标准正态分布,其密度函数为
与前面两个例子不同,这个概率密度函数在整个实数轴上都有非0的概率密度。
如何求它的分布函数呢?理论上,我们应该求
但这个函数时积不出来的,因为 的原函数不能用初等函数表示出来,可以参考微分代数的Liouville's theorem:
但如果是求在某些区间上的定积分,我们通过换元的方法就可以做到。
首先,我们可以算出
我们考虑用极坐标换元
那么上面的式子就变成
所以原积分
以后如果见到类似的积分(我们在学到随机变量的数字特征时就会用到),如果是奇数次幂,我们可以算出
因为这个函数是奇函数。
如果是偶数次幂,我们也能得到
所以我们可以类似地递推算出每一个偶数次幂的值。
比如现在我们要计算
我们利用递推公式可以得到
因为标准正态分布比较特殊,所以以后我们一般用或者来表示其概率密度函数,而用或表示其分布函数。
对于,这两个数字都是有意义的,0是的均值,而1是的方差。在以后我们还会遇到一般的正态分布。
例 标准正态分布的概率密度函数图像如下:
我们可以看出:
这其实就是大家高中学过的正态分布的原则。
通过上面的概率,我们还可以算出一些其他关于标准正态分布的概率,如
例 已知连续型随机变量的概率密度为
(1)求的分布函数;
为了求分布函数,我们要先求出概率密度函数,也就是要先求出,方法就是利用概率密度函数的两条性质。
首先,我们要求,那么就有
其次,我们要求,所以
所以的概率密度函数就是
积分可以得到其分布函数:
(2)求概率。
可以通过概率密度函数和分布函数两种方式来算。
通过概率密度函数:
通过分布函数:
关于随机变量的总结

相同点:
- 概率分布和密度函数都要非负,求和为1;
- 分布函数都是增函数,并且在正无穷处取1,负无穷处取0。
不同点:
- 概率分布是一个数列,表示的是随机变量取到每个值的概率;密度函数是一个函数,表示随机变量取到某个小区间的概率;
- 离散型随机变量的分布函数会出现跳跃,跳跃高度为取到该点的概率,因此只是右连续的;连续型随机变量的分布函数是连续的;
- 离散型随机变量计算事件概率用求和来算;连续型随机变量计算事件概率使用积分来算,取到某个点的概率为0。
💫 既非连续型也非离散型的分布
有一些随机变量的分布既非离散型,也非连续型,比如:

其分布函数的图像为

它的取值既非离散的,也非连续的,与我们上面讨论的分布都不一样,我们通常不考虑这种分布。
对于下面这种分布,虽然其取值是连续的,但是它是并不具有概率密度函数的(因为它取的概率为),所以我们一般也不把它当作连续型随机变量。

一般来说,我们把取值连续且具有概率密度函数的随机变量当作连续型随机变量。
Prev
8 随机变量及其分布I
Next
前言
Loading...