本小节简要介绍概率的几种定义及常用性质,要点如下:
古典定义
统计定义
主观定义
公理化定义
加法法则
乘法公式
条件概率
事件独立性
概率的定义
古典定义
具有以下特征的随机试验模型,称为古典概率模型。
某一事件 A 发生的概率为该事件所包含的基本事件个数 m 与样本空间所包含的基本事件个数 n 的比值,记为 P(A)。
统计定义
在相同条件下进行 n 次重复试验,如果随机事件 A 发生的次数为 m,m/n 称为随机事件 A 发生的频率。随着 n 逐渐增大,随机事件发生的频率越来越接近某一数值 p,p 称为随机事件 A 的概率。
主观定义
有的随机事件的发生的可能性不能通过等可能事件个数来计算,也不能根据大量重复试验中该事件发生的频率来获得,此时需要应用主观概率。
古典概率和统计概率属于客观概率,它们的确定完全取决于对客观条件进行的理论分析,或者是大量重复试验的结果,不以个人的意志为转移。而主观概率的确定则很灵活,它依赖于个人的主观判断,不同的人对同一事件给出的概率值往往有一定差异。
公理化定义
1933 年,柯尔莫哥洛夫给出概率的公理化定义。
满足以下 3 个性质的事件发生可能性大小的度量为概率的公理化定义。
概率的性质
概率的加法法则
P(A∪B)=P(A)+P(B)
例如一枚骰子,求掷出奇数或掷出 6 的概率。由于奇数和 6 是互斥的,因此可以将两个概率直接相加。
P(A∪B)=P(A)+P(B)−P(A∩B)
条件概率与乘法公式
P(B∣A)= P(A)/P(AB),P(A)>0
P(AB)=P(A)P(B∣A)=P(B)P(A∣B)
A 的发生与否不影响 B 的发生,也就是
P(B∣A)=P(B)
于是由乘法公式得
P(AB)=P(A)P(B)
本小节简要介绍一下常见的两种离散型概率分布,二项分布和泊松分布。
二项分布
泊松分布
二项分布
Python代码: scipy.stats.binom.pmf
n = 10
p = 0.5
k = np.arange(0, 11) # 有 0 ~ 10 次正面朝上的可能
binomial = scipy.stats.binom.pmf(k, n, p)
print("0~10次正面朝上的概率分别为: {:.6f}".format(binomial))
泊松分布
Python代码: scipy.stats.poisson.pmf
rate = 2
n = np.arange(0, 11) # 有 0 ~ 10 次发生事故的可能
poisson = scipy.stats.poisson.pmf(n, rate)
print("发生4次事故的概率为: {:.6f}".format(poisson[4]))
本小节简要介绍一下常见的三种连续型概率分布,均匀分布和指数分布和正态分布。
均匀分布
指数分布
正态分布
均匀分布
Python代码: scipy.stats.uniform.pdf(x, loc, scale)
loc 为 a,scale 为 b - a
a = 120
b = 140
k = 134.8
uniform = scipy.stats.uniform.pdf(k, a, b - a)
print("X={}的概率为: {:.6f}".format(k, uniform))
指数分布
Python代码: scipy.stats.expon.pdf(x, scale)
scale 是 lambda 的倒数。
x = np.arange(0, 11) # x 有 0 ~ 10 年 11 种可能
expon = scipy.stats.expon.pdf(x, scale=1/3)
print("0~10的概率分别为: {}".format(expon))
正态分布
标准正态分布的 PDF 如下
Python代码: scipy.stats.norm.pdf(x, loc, scale)
loc 为 mu, scale 为 sigma
mu = 40
sigma = 4
k = 50.0
scipy.stats.norm.pdf(k, mu, sigma)
本小节简要介绍一下期望和方差的定义和性质,以及常见分布的期望和方差。
定义
性质
常见分布的数学期望
定义
性质
常见分布的方差
期望
定义
性质
a 是常数, X, Y 是随机变量
离散分布的数学期望
二项分布
Python代码: scipy.stats.binom.mean
scipy.stats.binom.mean(n, p, loc=0)
泊松分布
Python代码: scipy.stats.poisson.mean
scipy.stats.poisson.mean(mu, loc=0)
# mu 是 lambda 的值
连续分布的数学期望
均匀分布
Python代码: scipy.stats.randint.mean
scipy.stats.randint.mean(low, high, loc=1)
指数分布
Python代码: scipy.stats.expon.mean
scipy.stats.expon.mean(loc=0, scale=1)
# scale 是 lambda 的倒数
正态分布
Python代码: scipy.stats.norm.mean
scipy.stats.norm.mean(loc=0, scale=1)
# loc 是 mu 的值
方差
定义
如果 E(X) 存在,且 [X−E(X)] 2也存在,则 X 的方差如下
var(X)=E[X−E(X)] 2
性质
var(X)=E(X 2)−[E(X)] 2
离散分布的方差
二项分布
X~B(n,p)
var(X)=np(1−p)
Python代码: scipy.stats.binom.var
scipy.stats.binom.var(n, p, loc=0)
泊松分布
X~Poi(λ)
var(X)=λ
Python代码: scipy.stats.poisson.var
scipy.stats.poisson.var(mu, loc=0)
# mu 是 lambda 的值
连续分布的方差
均匀分布
Python代码: scipy.stats.randint.var
scipy.stats.randint.var(low, high, loc=1)
指数分布
Python代码: scipy.stats.expon.var
scipy.stats.expon.var(loc=0, scale=1)
# scale 是 lambda 的倒数
正态分布
Python代码: scipy.stats.norm.var
scipy.stats.norm.var(loc=0, scale=1)
# loc 是 mu 的值
阅读量:2022
点赞量:0
收藏量:0