暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Python漫游数学王国 | 随机变量及其分布

265

随机变量及其分布


01

随机变量

有些随机实验的结果是用数值表示的,有些不是。当实验结果不是用数值表示时,很难对其进行描述和研究,所以有必要将实验结果数值化,这便是引入随机变量的初衷。

【例14.1】将一枚硬币抛掷三次,观察正面和反面出现的情况,样本空间是S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}。以X记三次投掷得到正面H的总数,那么,对于样本空间S中的每一个样本点e,X都有一个数与之对应。X是定义在样本空间S上的一个实值单值函数,它的定义域是样本空间S,值域是实数集合{0,1,2,3}。这样的X称为随机变量。

代码如下:


运行结果如图14.1所示。

■ 图14.1


注释/


numpy.random.RandomState()是一个伪随机数生成器,和设置seed的效果是一样的。


随机变量按其取值情况可分为离散型随机变量与连续型随机变量。离散型随机变量的取值可以一一列举,连续型随机变量的取值不能一一列举。


01

离散型随机变量及其分布律

要掌握一个离散型随机变量X的统计规律,必须且只须知道X的所有可能取值以及取每个可能值的概率。本节引入 scipy的stats子模块介绍离散型随机变量。

首先引入stats,查看stats包含哪些离散型随机变量的分布,代码如下:

运行结果如图14.2所示。

■ 图14.2

这里列出了15种离散型分布,仅介绍其中的三种——bernoulli,binom,poisson。

1. 0-1分布

0-1分布也叫伯努利(Bernoulli)分布。设随机变量X只可能取两个值0和1,它的分布律是:

则称X服从参数为p的(0-1)分布或伯努利分布。scipy中bernoulli()对应(0-1)分布,代码如下:

运行结果如图14.3所示。

运行结果如图14.4所示。




2. 二项分布

设X为n重伯努利实验中某事件A发生的次数,X可取k=0,1,2,…,n。若P(A)=p,则X的分布律为:

称X服从参数为n,p的二项分布。scipy中binom对应二项分布,使用方法代码如下:

运行结果如图14.5所示。

■ 图14.5


注释/


pmf是概率质量函数。rv服从参数为5,0.3的二项分布,rv. pmf(x)返回随机变量rv取值为0,1,2,3,4,5时的概率值,与使用分布律公式算得的值是一致的,代码如下:

运行结果如图14.6所示。

■ 图14.6

【例14.2】某种型号电子元件的使用寿命如果超过1500小时,则为一级品。已知某一大批产品的一级品率为0.2,现在从中随机地抽查20只。问20只元件中恰有k只(k=0,1,…,10)为一级品的概率是多少?

解由题意可得,20只元件中一级品的只数服从参数为20,0.2的二项分布,所求概率代码如下:

运行结果如图14.7所示。

进一步,可作上述结果的图形,以便对该结果有一个直观的了解,代码如下:

运行结果如图14.8所示。

注释/


(1) subplots()函数返回一个包含figure和axes对象的元组,因此,使用fig,ax=plt.subplots()将元组分解为fig和ax两个变量。fig变量可用来修改figure层级的属性,ax变量中保存着子图的可操作axes对象。

(2) ax.plot(x,rv.pmf(x),'ro',ms=8,label='binom pmf')使用红色圆圈标记绘制x与rv.pmf(x),标记大小为8,标签为binom pmf。

(3) ax. vlines(x,0,rv.pmf(x),colors='g',lw=5,alpha=0.5)在x处绘制从0到rv. pmf(x)的垂直线,线条颜色为绿色,线条宽度为5,透明度为0.5。

从图形输出结果可以看到,当k增加时,相应概率先是随之增加,增大到最大值(k=4时)后单调减少。

【例14.3】某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率。

解代码如下:

运行结果如图14.9所示。

■ 图14.9

3. 泊松分布

设随机变量X所有可能的取值为0,1,2,…,取各个值的概率为

其中,λ>0是常数。则称X服从参数为λ的泊松分布。scipy中poisson对应泊松分布,代码如下:

运行结果如图14.10所示。

■ 图14.10

【例14.4】某公司制造一种特殊型号的微芯片,次品率达0.1%,各芯片成为次品相互独立。求在1000只产品中至少有2只次品的概率。

解由题可知,产品中的次品数服从参数为n=1000,p=0.001的二项分布,这里n很大,p很小,该二项分布可用参数为n、p的泊松分布来逼近,我们尝实验证这一结论,代码如下:

运行结果如图14.11所示。

■ 图14.11

从输出结果可以看到,两种分布下所得概率相差无几。


01

参考书籍


《Python漫游数学王国——高等数学、线性代数、数理统计及运筹学》

ISBN:9787302597797

作者:毕文斌、毛悦悦

定价:128元

内容简介

本书参考高等学校理工科“高等数学”“线性代数”“概率论与数理统计”“运筹学”等课程教学大纲,使用Python语言实现相关计算、图形展示及模型求解,内容包含Python编程语言入门、极限的运算、函数的求导及积分、微分方程求解、级数、行列式计算、线性方程组求解、随机变量及其分布、随机变量的数字特征、参数估计、假设检验、方差分析与回归、线性规划、非线性规划、动态规划、图与网络计划及排队论等。本书内容翔实,文字精练,例题丰富,注重本科数学理论与科学计算的密切结合。本书可以作为高等学校理工科在校本科生的学习实验用书,也可以作为对Python科学计算感兴趣的人员的参考用书。





    文章转载自清华计算机学堂,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论