概统 第二章 随机变量及其分布

第二章 随机变量及其分布

随机变量概念

是一个概率空间, 是定义在样本空间 内的一个单值函数,如果对任意 实数 ,有

则称 随机变量,记作 .

是一个函数, 为自变量,定义域为 .

以下简记 .

分布函数概念

为随机变量,对于任意实数 ,记
为随机变量 的分布函数.

分布函数性质

  1. 单调不减函数,即对任意实数 ,有

  2. ,且

  3. ,即右连续.

  4. 对于任意实数 ,且 ,有

  5. 对任意的 ,有

特别地,如果 X 是连续性随机变量,则有

离散型随机变量

定义

是一个随机变量,如果 的取值是有限个或无穷可列个值,则称 离散型随机变量. 设离散型随机变量 所有可能取的值为 取各个可能值的概率 ( 即事件 的概率 ) ,则称 概率分布分布律.

也可采用表格形式表示,即

对于任意实数,有

其中 表示对于满足 的一切 发生的概率求和.

离散型随机变量的概率分布的性质

  1. .

  2. .

离散型随机变量 的分布函数

设离散型随机变量 的概率分布为 ,则 的分布函数为

其中 表示对于满足 的一切 发生的概率求和. 内除 可能取的值 外,处处是连续的.

连续性随机变量

连续性随机变量及其概率密度

设随机变量 的分布函数为 ,如果存在非负可积函数 ,使得对于任意实数 ,有

则称 连续型随机变量概率密度函数,简称 概率密度.

连续性随机变量的概率密度 的性质

  1. .

  2. .

  3. 对于任意实数,有

  4. 在点 处连续,则有 .

此外,任意连续型随机变量 取任意给定的值 的概率等于 ,即 .

⪡ 注 ⪢

  1. 性质1,2 是函数 为某一随机变量 的概率密度的 充要条件.

  2. 给定 的概率密度 就能确定 ,由于 位于积分号之内,故改变 在这个区间内有限个点的函数值,并不改变 在该区间内取值的概率.

  3. 由于连续型随机变量 的分布函数 必可表示成 ,故此时的 一定是 上的连续函数. 反之,不能说凡是连续的 对应的 就一定是连续性随机变量.

  4. 连续型随机变量 的分布函数 必连续,但密度函数 不一定连续.

常见的离散型、连续性随机变量及其概率分布

常见的离散型随机变量及其概率分布

分布

若随机变量 只可能取 两个值,其概率分布

则称 服从参数为 分布两点分布,其中 .

⪡ 注 ⪢

该分布用来描述只有两种对立结果 ( 成果与失败、合格与不合格、击中与未击中等 ) 的伯努利试验.

二项分布

若随机变量 的概率分布为

则称 服从参数为 二项分布,记作 ,其中 .

⪡ 注 ⪢

  1. 二项分布描述的是 重伯努利试验,若每次试验成功率为 ,进行 次独立重复试验,则成功总次数 服从 二项分布. 或若 重伯努利试验中事件 发生的次数,则 ,其中 .

  2. 如果 服从二项分布 ,则 服从二项分布 ,其中 .

几何分布

若随机变量 的概率分布为

则称 服从参数为 几何分布,其中 .

⪡ 注 ⪢

1.几何分布与二项分布都以独立重复试验为背景. 其中二项分布描述在 次独立重复试验中成功的次数,其取值为 而几何分布则描述在连续独立重复试验中首次取得成功所进行的试验次数,其取值为 .

2.几何分布具有 "无记忆性",即当 均大于 时,有

超几何分布

若随机变量 的概率分布为

则称 服从参数为 超几何分布,其中 均为正整数且 .

泊松分布

若随机变量 的概率分布为

其中 ,则称 服从参数为 泊松分布,简记作

⪡ 注 ⪢

泊松分布中参数 的概率意义是随机变量 数学期望,即

泊松定理

若随机变量 服从二项分布 ,则当 充分小而 充分大且 适中时 近似服从参数为 的泊松分布,即

⪡ 注 ⪢

  1. 上式表明 : 以 为参数的二项分布的概率值可以由参数为 的泊松分布的概率值近似. 上式也能用来作二项分布概率的近似计算.

  2. 注意定理的条件 要求 很大又 很小且 适中. 实际应用中,当 时即可利用上式,不过 应尽量地大,否则近似效果不佳.

常见的连续性型随机变量及其概率分布

均匀分布

若随机变量 的概率密度为

则称 服从区间 上的 均匀分布,记为 . 的分布函数为

⪡ 注 ⪢

在区间 上服从均匀分布的随机变量 内任一子区间上取值的概率只依赖于该子区间的长度,而与其在 内的位置无关. 即若 ,则

指数分布

若随机变量 的概率密度为

其中 为参数,则称 服从参数为 指数分布,记为 . 的分布函数为

⪡ 注 ⪢

  1. 指数分布常用作描述一些电子元器件的使用寿命,当 时,.
  2. 服从指数分布的随机变量 具有 "无记忆性",即对任意 ,有 . 如果 是某一元件的寿命,那么该式表明 : 已知元件已使用了 小时,它总共能使用至少 小时的条件概率,与从开始使用时算起它至少能使用 小时的概率相等,这就是说,元件对它已使用过 小时没有记忆. 具有这一性质是指数分布有广泛应用的重要原因.

正态分布

一般正态分布

若随机变量 的概率密度为

其中 均为常数,且 ,则称 服从参数为 正态分布,简记为 . 的分布函数为

,其分布函数为 ,则有

其中 为标准正态分布的分布函数.

,则 具有以下性质:

  1. 概率密度曲线 关于 对称. 这表明对于任意

  1. 取到最大值 的驻点. 在 处曲线 有拐点. 曲线 轴为渐近线.
标准正态分布

时,称 服从 标准正态分布,记为 ,其概率密度和分布函数分别用 , 表示,即

标准正态分布 的分布函数中 与概率密度 的性质主要有 :

  1. ,即 是偶函数.

  2. 内严格单调递增,在 内严格单调递减,在 处取最大值 .

  3. 的两个拐点.

  4. ,即 轴是 的水平渐近线.

  5. . 特别地,.

  6. 对于任意实数 ,有 .

随机变量函数的分布

是一个随机变量, ( 一般 是已知的连续函数 ) 是一个实函数,则 也是一个随机变量. 所谓求随机变量 的函数的分布问题,就是由已知的随机变量 的概率分布去求得它的函数 的概率分布或概率密度乃至分布函数. 这里 是这样的随机变量,当 取值 时, 取值 .

对于一般情形,设法将 的概率分布通过 的概率分布表示 : . 用这种方法,在许多情形下可以求出的概率分布.

离散型随机变量函数的分布的求法

是离散型随机变量,其概率分布为

则随机变量 的函数 取值 的概率为

如果在函数值 中有相同的数值,则将它们相应的概率之和作为随机变量 取该值的概率,就可以得到 的概率分布.

连续性型随机变量函数的分布的求法

为连续型随机变量,其分布函数、概率密度分别为 ,随机变量 的函数,则 的分布函数或概率密度可用下面两种方法求得 :

定义法

如果随机变量的函数 是连续型的,最基本的方法是 分布函数法,即先求出 的分布函数 ,其中 是随机变量 的概率密度. 然后将 关于 求导,一般能得到 的概率密度.

公式法

是严格单调函数时可由如下方法求出 的概率密度 : 设随机变量 具有概率密度 ,又设函数 可能取值的区间上处处可导且单调, 的反函数,则 是连续型随机变量,且其概率密度为

其中 是函数 可能取值的区间上的值域.

⪡ 注 ⪢

利用公式法直接写出 的概率密度时,要注意三点 :

  1. 要检验函数 是否严格单调 ( 一般可利用导数 来检验 ),如果不是严格单调的,那就不能用这一公式.

  2. 公式中的 要取绝对值,否则可能会导致错误.

  3. 如果 是离散型的,首先确定 的可能取值,而后通过计算概率 求得 的概率分布.