8 随机变量及其分布I

type
status
date
slug
summary
tags
category
icon
password
本课程为国家发展研究院朱晓宝老师所开设的《概率统计(B)》。

💫 随机变量的引入

定义在样本空间上的函数称为 随机变量
notion image
一般来说,我们会用大写的英文字母等来表示随机变量。
和函数的性质一样,我们知道同一个样本点只能对应一个随机变量的取值,不能对应到多个取值;而不同的样本点可以对应到同一取值。
 
回顾一下我们当时是怎么定义概率的:概率为定义在中事件上的实函数
notion image
我们发现概率和随机变量的定义非常像,但是其实不一样,因为概率作用在样本空间的子集上,而随机变量作用在样本空间的元素上。此外,概率的值域是,而随机变量的值域为
 
随机变量作为函数,它的随机性体现在哪里呢?其实就体现在“随机变量的取值依赖于随机出现的结果”上。
 
甲⼄两⼈扔⼀枚硬币赌博,扔⼀次,若出现正面,则甲收⼊1元,否则,甲付出1元。考察甲的收⼊,令表示扔一次硬币后甲的收⼊。显然,的取值依赖于扔硬币的结果:
 
某⼈请客吃饭,⾛在街上,现在恰好⾛到⼀家江浙菜馆门⼝,此饭店的右侧是⼀家湘菜馆,⽽左侧是⼀家川菜馆,他正在犹豫去哪家吃饭。
notion image
此⼈考虑扔两枚硬币,若都是正面,则去右侧的湘菜馆,若都是反面,则去左侧的川菜馆,否则,则去江浙菜馆。令为最终吃饭的位置,那么
 
⼀个有3个小孩的家庭,小孩的性别⼀共有8种情形:
bbb, bbg, bgb, gbb, bgg, gbg, ggb, ggg 考察家中男孩的⼈数,令为男孩数,那么
在某种意义上,我们可以用随机变量的不同取值来构造事件,从而划分整个样本空间。比如
 
引入随机变量的目的是将随机现象的结果数量化,从而用简洁的语言来描述随机事件,比如上面家庭中的小孩性别和吃饭位置。不过,在某些情况下,我们只能观测到随机变量的取值,而看不到具体的样本点,比如上面家庭中小孩性别的问题,如果观察到,那么我们可以知道,但是如果观察到,我们就不知道对应的样本点是什么。
在以后涉及到随机变量的时候,我们通常省去中的,而是简写为
 

💫 离散型随机变量

离散型随机变量的定义

取值离散的随机变量我们称为 离散型随机变量
取值离散意味着随机变量的值域是一个离散的集合,上面我们讲的三个例子中的随机变量都是离散型随机变量。
 
像我们上面提到的,根据随机变量的不同取值可以对样本空间进行划分。
如果样本空间为,离散型随机变量的所有不同的取值为,那么我们可以将样本空间划分为
notion image
此外我们还知道
那么其实这一系列事件将样本空间划分为了不相交的几部分,所以我们有

概率分布

概率分布其实就是高中学过的离散型随机变量概率分布列。
设离散型随机变量的所有不同的取值为 ,记 ,那么称
的概率分布
概率分布的性质为
如果有数列满足上面的性质,那么这个数列也能构成一个概率分布。
 
我们一般还会把这个概率分布写成概率分布表的形式:
notion image
 
对于随机变量
它的概率分布为
notion image
根据这个概率分布我们可以求以下的概率:
(1)家里至少有两个男孩;
(2)家里超过4个男孩;
(3)家里至少有1个男孩,但是没有3个以上男孩。
 
上面三个事件的概率能够用的概率分布来求的原因是这三个事件都能用随机变量表示出来。
利用离散型随机变量的概率分布可以求用此随机变量表达的事件的概率。
 
52张扑克牌任取5张,求其中A的张数⼤于2的概率。
表示任取5张牌时取到A的数目。我们知道取到A张数的所有可能性为0,1,2,3,4,那么就可以求出的概率分布。考虑,这意味着取出了张A,那么就取出了张其他牌,所以
我们要求的事件其实就是 ,我们就可以用概率分布得到
 
⼥⼉找爸爸下军棋,⼥⼉每局赢的概率为,在⼥⼉要求下必须她赢⼀局才能结束。求⾄少要下4局才结束的概率。
表示结束时下的局数,那么的可取值为 。考虑,这意味着前局都是爸爸赢,最后1局是女儿赢,这其实是我们在7 事件的独立性中学到的 重Bernoulli试验中结果恰好在第次首次出现的概率,为
虽然我们写出了这样一个概率分布,这个东西是不是一个概率分布呢? 是自然的,我们来证明它们的和为1:
所以它确实是一个概率分布。
我们要求的至少要下4局对应的事件就是 ,所以概率为
 
我们也可以换一种方法来求,考虑对立事件,那就是
 
的概率分布为,求
(1)
所以
(2)
因为取值只有1,3,5,所以
(3)
(4)
(5)
(6)
事实上,我们可以求任意的
的时候,;当时,因为,所以也会出现一个跳跃,变成0.1。以此类推,我们可以画出随着变化的图像。
notion image
那么对于任意一个,都可以找到它对应的,这个被我们称为的分布函数。

分布函数

随机变量 分布函数 定义为
对于我们上面讲的离散型随机变量,我们看其分布函数可以得到它的一些特点:
  • 阶梯形的增函数,只在随机变量的取值处跳跃,跳跃高度为随机变量取到该值的概率;
  • 右连续,也就是
    • (什么是连续呢?也就是在每一点处的函数值都有,右连续的函数只有从右边逼近某个点的时候上式才成立,也就是成立,而是不一定成立的。
  • ,并且
    • 两个无穷处的取值是因为,所有的取值都满足这一条件,所以;而,所有的取值都不满足这一条件,所以
 
根据上面的定义,我们可以发现离散型随机变量的分布函数和概率分布是相互确定的:
  • 一方面,如果知道概率分布,那么
    • 另一方面,如果知道分布函数,那么
       
      设离散型随机变量的分布函数如下
      (1)求的概率分布;
      我们知道,离散型随机变量分布函数在间断点处的跳跃高度就是离散型随机变量在间断点处的取值,所以有
      (2)求
      我们求类似的概率可以用两种方法来求:通过概率分布或者通过分布函数。
      通过概率分布:
      通过分布函数:
      (3)求
      通过概率分布:
      通过分布函数:
       
      以后遇到分布函数相关的计算,我们就可以用类似上面的思路,也就是以下几个公式:
      • :分布函数的定义
      • ,因为
        • ,因为
          • ,因为
             
            Prev
            7 事件的独立性
            Next
            9 随机变量及其分布II
            Loading...