概率论(H)¶
约 1130 个字 4 张图片 预计阅读时间 3 分钟
任课教师:苏中根
成绩组成
- 点名+作业:20%
- 期中:20%
- 期末:60%
几何概型¶
样本空间\(\Omega\)含有不可数个基本事件的结果,每个事件的概率为0。同时\(\Omega\)是\(R^n\)的可测区域,事件\(A\)是\(\Omega\)的可测子集。
\(P(A)= \frac{m(A)}{m(\Omega)}\),其中\(m(A)\)是\(A\)的测度。
Buffon 投针
- 一根长度为\(l\)的针,投在一张画满间距为\(d\)的平行线的平面上(\(l<d\))。求针与线相交的概率。
- 以针的任意位置为样本点,该点可由针的中点与最接近的线的距离\(x\),以及针的倾斜角\(\theta\)确定。
- 样本空间\(\Omega = \{(x,\theta)|0\leq x\leq \frac{d}{2},0\leq \theta \leq \pi\}\)为一矩形。
- 其中,与线相交的事件\(A = \{(x,\theta)|x\leq \frac{l}{2}\sin\theta\}\)。
- 则\(P(A) = \frac{2l}{\pi d}\)。(面积比)
概率空间¶
\(P(\bigcup_{i=1}^{m}A_i) \leq \sum_{i=1}^{m}P(A_i)\)
\(LHS = \sum_{i=1}^{m}P(A_i) - \sum_{i \ne j}^{m}P(A_i \cap A_j)+\cdots + (-1)^{m-1}P(\bigcap_{i=1}^{m}A_i)\)
全概率公式
若\(B_1,B_2,\cdots,B_n\)是样本空间\(\Omega\)的一个划分,即\(B_i \cap B_j = \emptyset\),\(\bigcup_{i=1}^{n}B_i = \Omega\),则对任意事件\(A\)有\(P(A) = \sum_{i=1}^{n}P(A|B_i)P(B_i)\)。
贝叶斯公式
若\(B_1,B_2,\cdots,B_n\)是样本空间\(\Omega\)的一个划分,即\(B_i \cap B_j = \emptyset\),\(\bigcup_{i=1}^{n}B_i = \Omega\),则对任意事件\(A\)有\(P(B_i|A) = \frac{P(A|B_i)P(B_i)}{\sum_{j=1}^{n}P(A|B_j)P(B_j)}\)。
随机变量¶
离散型随机变量¶
- Possion分布
- \(X\)取非负整数,\(P(X=k) = \frac{\lambda^k}{k!}e^{-\lambda}\)
- 用于描述单位时间内某事件发生的次数
- 二项分布
- \(X\)取非负整数,\(P(X=k) = C_n^k p^k(1-p)^{n-k}\)
- 用于描述\(n\)次独立重复试验中成功次数的分布
连续型随机变量¶
分布列\(X\)的概率密度函数\(f(x)\)满足:
- \(f(x) \geq 0\)
- \(\int_{-\infty}^{+\infty}f(x)dx = 1\)
- \(P(X \in B) = \int_{B}f(x)dx\)
分布函数
称 \(F(x) = P(\xi \leq x)\) 为随机变量\(\xi(\omega)\)的分布函数。
- 具有以下性质:
- \(P(a \leq \xi \leq b) = F(b) - F(a)\)
- 单调不减性:\(a \leq b \Rightarrow F(a) \leq F(b)\)
- \(F(-\infty) = 0, F(+\infty) = 1\)
- 右连续性:\(\lim_{x \to x_0^+}F(x) = F(x_0)\)
- \(F(x)=\int_{-\infty}^{x}f(t)dt\)
example
- 在三角形\(ABC\)内任取一点\(P\),\(P\)到\(BC\)的距离为\(\xi\),求\(\xi\)的分布函数。
- 设BC边上高为\(h\),\(x \leq 0\)时,\(F(x) = 0\);\(0 \leq x \leq h\)时,在三角形内作平行于BC的DE,其与BC的距离为\(x\),则\(\{\xi \leq x\}\)表示点P落在梯形DECB内。
- \(P(\xi \leq x) = \frac{S_{DECB}}{S_{ABC}} = 1 - (1-\frac{x}{h})^2\)
- \(x \geq h\)时,\(F(x) = 1\)
- 则\(F(x) = \begin{cases} 0 & x \leq 0 \\ 1-(1-\frac{x}{h})^2 & 0 \leq x \leq h \\ 1 & x \geq h \end{cases}\)
- 常见的连续型随机变量:
- 均匀分布
- 向\((a,b)\)区间内随机取点
- 每一点是等可能的,即\(P(X = x) = 0\)
- 则\(P(X \in A) = \frac{m(A)}{m(\Omega)} = \frac{|A|}{b-a}\)
- 指数分布
- \(X\)取非负实数,\(f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}\)
- \(P(X \gt x) = e^{-\lambda x}\)
- 通常用于描述使用寿命等(使用寿命大于x的概率是\(e^{-\lambda x}\))
- 无记忆性:\(P(X \gt s+t|X \gt s) = P(X \gt t)\)
- 正态分布
- \(X\)取实数,\(f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
- 记为\(N(\mu,\sigma^2)\)
- 对标准正态分布,\(\mu = 0, \sigma = 1\),则\(P(X \leq x) = \Phi(x)\)
- 对于一般的\(\xi\) ~ \(N(\mu,\sigma^2)\),记\(Z = \frac{\xi - \mu}{\sigma}\),则\(Z\) ~ \(N(0,1)\), \(P(\xi \leq x) = \Phi(\frac{x-\mu}{\sigma})\)
- 均匀分布
一般随机变量¶
example
\(P(X=0) = \frac{1}{2}\)
\(P(X>x) = \frac{1}{2} e^{-x}, x \geq 0\)
随机向量¶
给定概率空间\((\Omega, \mathcal{F}, P)\),定义在其上的随机向量\(\xi = (\xi_1,\xi_2,\cdots,\xi_n)\),其中\(\xi_i\)是定义在\((\Omega, \mathcal{F}, P)\)上的随机变量。
离散型随机向量¶
假定\(X\)取值为\(x_1,x_2,\cdots,x_n\),\(Y\)取值为\(y_1,y_2,\cdots,y_m\),则记\(P(X=x_i,Y=y_j) = p_{ij}, i,j = 1,2...\)。
有\(\Sigma p_{ij} = 1\),\(p_{ij} \geq 0\)。
联合分布¶
\(P(X<x,Y<y) = \Sigma_{i:x_i<x,j:y_j<y}p_{ij}\)
边际分布¶
\(X,Y\)的分布可由\(p_{ij}\)得到。
\(P(X=x_i) = p_{i\cdot} = \Sigma_{j=1}^{\infty}p_{ij}\),且\(\Sigma p_{i\cdot} = 1\)
类似可得Y
联合分布与边际分布
- 联合分布:\(P(X=x_i,Y=y_j) = p_{ij}\)
- 边际分布:\(P(X=x_i) = p_{i\cdot}\)
- 边际分布由联合分布唯一确定,但边际分布不能唯一决定联合分布。
条件分布¶
给定\(X=x_i\)的情况下,\(Y\)可取值\(y_1,y_2,\cdots\)
概率为\(P(Y=y_j|X=x_i) = \frac{P(X=x_i,Y=y_j)}{P(X=x_i)} = \frac{p_{ij}}{p_{i\cdot}}\)
条件分布列\(Y|X = x_i ~ \begin{cases} y_1 & y_2 & \cdots \\ \frac{p_{i1}}{p_{i\cdot}} & \frac{p_{i2}}{p_{i\cdot}} & \cdots \end{cases}\)
类似可得\(X|Y = y_j\)
独立性¶
假设\((X,Y)\)是如上所述的独立性随机向量,若\(\forall i,j\)有\(P(X=x_i,Y=y_j) = P(X=x_i)P(Y=y_j)\),则称\((X,Y)\)是独立的。
连续型随机向量¶
给定概率空间\((\Omega, \mathcal{F}, P)\),\((X,Y)\)是定义在其上的随机向量,若存在\(p(x,y) \ge 0\)使得\(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}p(x,y)dxdy = 1\),且对于任何Borel集\(A,B\)有\(P(X \in A, Y \in B) = \int_{A}\int_{B}p(x,y)dxdy\),则称\((X,Y)\)是连续型随机向量,具有密度函数\(p(x,y)\)。
特别的,对任意\(x,y \in R\),\(P(X<x,Y<y) = \int_{-\infty}^{x}\int_{-\infty}^{y}p(u,v)dudv\)。
边际分布¶
显然,若\((X,Y)\)是连续型随机向量,则\(X,Y\)也是连续型随机变量,其边际分布为\(p_X(x) = \int_{-\infty}^{+\infty}p(x,y)dy\),\(p_Y(y) = \int_{-\infty}^{+\infty}p(x,y)dx\)。
同样也有,联合分布唯一决定边际分布,但边际分布不能唯一决定联合分布。
例
- 矩形上的均匀分布
- 假设矩形\((a,b) \times (c,d)\),如果随机向量\((X,Y)\)具有密度函数\(p(x,y) = \begin{cases} \frac{1}{(b-a)(d-c)} & a \leq x \leq b, c \leq y \leq d \\ 0 & \text{其他} \end{cases}\),则称\((X,Y)\)在矩形上服从均匀分布。
- 于是有\(P(X<x) = P(X<x,Y<\infty) = \int_{-\infty}^{x}\int_{-\infty}^{+\infty}p(u,v)dudv = \int_{a}^{x}\int_{c}^{d}\frac{1}{(b-a)(d-c)}dudv = \begin{cases} 0 & x \leq a \\ \frac{x-a}{b-a} & a \leq x \leq b \\ 1 & x \geq b \end{cases}\)
- 因此\(X\)是\((a,b)\)上的均匀分布,\(Y\)是\((c,d)\)上的均匀分布。
- 联合正态分布
- 若\((X,Y)\)具有密度函数\(p(x,y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}\),则称\((X,Y)\)服从联合正态分布。\((X,Y)\)~\(N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)
- 边际分布:经过计算,\(X\)~\(p_X(x) = \int_{-\infty}^{+\infty}p(x,y)dy = \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\),\(Y\)同理。
条件分布¶
TBD
随机向量的计算与变换¶
TBD
极值随机变量¶
假设\(X_1,X_2,\cdots,X_n\)是随机变量,对\(\omega \in \Omega\),将\(X_1(\omega),X_2(\omega),\cdots,X_n(\omega)\)进行排序,得到\(X_{(1)}(\omega) \leq X_{(2)}(\omega) \leq \cdots \leq X_{(n)}(\omega)\),则称\(X_{(1)},X_{(2)},\cdots,X_{(n)}\)是次序随机变量,其中\(X_{(1)}\)称为极小值,\(X_{(n)}\)称为极大值,\(X_{(k)}\)称为第k小值。
极值分布¶
数学期望¶
- 离散型随机变量:\(E(X) = \sum_{i=1}^{\infty}x_i P(X=x_i)\)
- 退化分布:\(E(X) = x_0\)
- 两点分布:\(E(X) = p\)
- 二项分布:\(E(X) = np\)
- Possion分布:\(E(X) = \lambda\)
- 几何分布(\(P(X=k) = p(1-p)^{k-1}\)):\(E(X) = \frac{1}{p}\)