概率论（H）¶

约 1130 个字 4 张图片预计阅读时间 3 分钟

任课教师：苏中根

成绩组成

点名+作业：20%
期中：20%
期末：60%

几何概型¶

样本空间\(\Omega\)含有不可数个基本事件的结果，每个事件的概率为0。同时\(\Omega\)是\(R^n\)的可测区域，事件\(A\)是\(\Omega\)的可测子集。

\(P(A)= \frac{m(A)}{m(\Omega)}\)，其中\(m(A)\)是\(A\)的测度。

Buffon 投针

一根长度为\(l\)的针，投在一张画满间距为\(d\)的平行线的平面上（\(l<d\)）。求针与线相交的概率。
- 以针的任意位置为样本点，该点可由针的中点与最接近的线的距离\(x\)，以及针的倾斜角\(\theta\)确定。
- 样本空间\(\Omega = \{(x,\theta)|0\leq x\leq \frac{d}{2},0\leq \theta \leq \pi\}\)为一矩形。
- 其中，与线相交的事件\(A = \{(x,\theta)|x\leq \frac{l}{2}\sin\theta\}\)。
- 则\(P(A) = \frac{2l}{\pi d}\)。（面积比）

概率空间¶

\(P(\bigcup_{i=1}^{m}A_i) \leq \sum_{i=1}^{m}P(A_i)\)

\(LHS = \sum_{i=1}^{m}P(A_i) - \sum_{i \ne j}^{m}P(A_i \cap A_j)+\cdots + (-1)^{m-1}P(\bigcap_{i=1}^{m}A_i)\)

全概率公式

若\(B_1,B_2,\cdots,B_n\)是样本空间\(\Omega\)的一个划分，即\(B_i \cap B_j = \emptyset\)，\(\bigcup_{i=1}^{n}B_i = \Omega\)，则对任意事件\(A\)有\(P(A) = \sum_{i=1}^{n}P(A|B_i)P(B_i)\)。

贝叶斯公式

若\(B_1,B_2,\cdots,B_n\)是样本空间\(\Omega\)的一个划分，即\(B_i \cap B_j = \emptyset\)，\(\bigcup_{i=1}^{n}B_i = \Omega\)，则对任意事件\(A\)有\(P(B_i|A) = \frac{P(A|B_i)P(B_i)}{\sum_{j=1}^{n}P(A|B_j)P(B_j)}\)。

随机变量¶

离散型随机变量¶

Possion分布
- \(X\)取非负整数，\(P(X=k) = \frac{\lambda^k}{k!}e^{-\lambda}\)
- 用于描述单位时间内某事件发生的次数
二项分布
- \(X\)取非负整数，\(P(X=k) = C_n^k p^k(1-p)^{n-k}\)
- 用于描述\(n\)次独立重复试验中成功次数的分布

连续型随机变量¶

分布列\(X\)的概率密度函数\(f(x)\)满足：

\(f(x) \geq 0\)
\(\int_{-\infty}^{+\infty}f(x)dx = 1\)
\(P(X \in B) = \int_{B}f(x)dx\)

分布函数

称 \(F(x) = P(\xi \leq x)\) 为随机变量\(\xi(\omega)\)的分布函数。

具有以下性质：
- \(P(a \leq \xi \leq b) = F(b) - F(a)\)
- 单调不减性：\(a \leq b \Rightarrow F(a) \leq F(b)\)
- \(F(-\infty) = 0, F(+\infty) = 1\)
- 右连续性：\(\lim_{x \to x_0^+}F(x) = F(x_0)\)
- \(F(x)=\int_{-\infty}^{x}f(t)dt\)

example

在三角形\(ABC\)内任取一点\(P\)，\(P\)到\(BC\)的距离为\(\xi\)，求\(\xi\)的分布函数。
- 设BC边上高为\(h\)，\(x \leq 0\)时，\(F(x) = 0\)；\(0 \leq x \leq h\)时，在三角形内作平行于BC的DE，其与BC的距离为\(x\)，则\(\{\xi \leq x\}\)表示点P落在梯形DECB内。
- \(P(\xi \leq x) = \frac{S_{DECB}}{S_{ABC}} = 1 - (1-\frac{x}{h})^2\)
- \(x \geq h\)时，\(F(x) = 1\)
- 则\(F(x) = \begin{cases} 0 & x \leq 0 \\ 1-(1-\frac{x}{h})^2 & 0 \leq x \leq h \\ 1 & x \geq h \end{cases}\)

常见的连续型随机变量：
- 均匀分布
  - 向\((a,b)\)区间内随机取点
  - 每一点是等可能的，即\(P(X = x) = 0\)
  - 则\(P(X \in A) = \frac{m(A)}{m(\Omega)} = \frac{|A|}{b-a}\)
- 指数分布
  - \(X\)取非负实数，\(f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0 \\ 0 & x < 0 \end{cases}\)
  - \(P(X \gt x) = e^{-\lambda x}\)
  - 通常用于描述使用寿命等（使用寿命大于x的概率是\(e^{-\lambda x}\)）
  - 无记忆性：\(P(X \gt s+t|X \gt s) = P(X \gt t)\)
- 正态分布
  - \(X\)取实数，\(f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
  - 记为\(N(\mu,\sigma^2)\)
  - 对标准正态分布，\(\mu = 0, \sigma = 1\)，则\(P(X \leq x) = \Phi(x)\)
  - 对于一般的\(\xi\) ~ \(N(\mu,\sigma^2)\)，记\(Z = \frac{\xi - \mu}{\sigma}\)，则\(Z\) ~ \(N(0,1)\), \(P(\xi \leq x) = \Phi(\frac{x-\mu}{\sigma})\)

一般随机变量¶

example

\(P(X=0) = \frac{1}{2}\)
\(P(X>x) = \frac{1}{2} e^{-x}, x \geq 0\)

随机向量¶

给定概率空间\((\Omega, \mathcal{F}, P)\)，定义在其上的随机向量\(\xi = (\xi_1,\xi_2,\cdots,\xi_n)\)，其中\(\xi_i\)是定义在\((\Omega, \mathcal{F}, P)\)上的随机变量。

离散型随机向量¶

假定\(X\)取值为\(x_1,x_2,\cdots,x_n\)，\(Y\)取值为\(y_1,y_2,\cdots,y_m\)，则记\(P(X=x_i,Y=y_j) = p_{ij}, i,j = 1,2...\)。

有\(\Sigma p_{ij} = 1\)，\(p_{ij} \geq 0\)。

联合分布¶

\(P(X<x,Y<y) = \Sigma_{i:x_i<x,j:y_j<y}p_{ij}\)

边际分布¶

\(X,Y\)的分布可由\(p_{ij}\)得到。

\(P(X=x_i) = p_{i\cdot} = \Sigma_{j=1}^{\infty}p_{ij}\)，且\(\Sigma p_{i\cdot} = 1\)

类似可得Y

联合分布与边际分布

联合分布：\(P(X=x_i,Y=y_j) = p_{ij}\)
边际分布：\(P(X=x_i) = p_{i\cdot}\)
边际分布由联合分布唯一确定，但边际分布不能唯一决定联合分布。

条件分布¶

给定\(X=x_i\)的情况下，\(Y\)可取值\(y_1,y_2,\cdots\)

概率为\(P(Y=y_j|X=x_i) = \frac{P(X=x_i,Y=y_j)}{P(X=x_i)} = \frac{p_{ij}}{p_{i\cdot}}\)

条件分布列\(Y|X = x_i ~ \begin{cases} y_1 & y_2 & \cdots \\ \frac{p_{i1}}{p_{i\cdot}} & \frac{p_{i2}}{p_{i\cdot}} & \cdots \end{cases}\)

类似可得\(X|Y = y_j\)

独立性¶

假设\((X,Y)\)是如上所述的独立性随机向量，若\(\forall i,j\)有\(P(X=x_i,Y=y_j) = P(X=x_i)P(Y=y_j)\)，则称\((X,Y)\)是独立的。

连续型随机向量¶

给定概率空间\((\Omega, \mathcal{F}, P)\)，\((X,Y)\)是定义在其上的随机向量，若存在\(p(x,y) \ge 0\)使得\(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}p(x,y)dxdy = 1\)，且对于任何Borel集\(A,B\)有\(P(X \in A, Y \in B) = \int_{A}\int_{B}p(x,y)dxdy\)，则称\((X,Y)\)是连续型随机向量，具有密度函数\(p(x,y)\)。

特别的，对任意\(x,y \in R\)，\(P(X<x,Y<y) = \int_{-\infty}^{x}\int_{-\infty}^{y}p(u,v)dudv\)。

边际分布¶

显然，若\((X,Y)\)是连续型随机向量，则\(X,Y\)也是连续型随机变量，其边际分布为\(p_X(x) = \int_{-\infty}^{+\infty}p(x,y)dy\)，\(p_Y(y) = \int_{-\infty}^{+\infty}p(x,y)dx\)。

同样也有，联合分布唯一决定边际分布，但边际分布不能唯一决定联合分布。

例

矩形上的均匀分布
- 假设矩形\((a,b) \times (c,d)\)，如果随机向量\((X,Y)\)具有密度函数\(p(x,y) = \begin{cases} \frac{1}{(b-a)(d-c)} & a \leq x \leq b, c \leq y \leq d \\ 0 & \text{其他} \end{cases}\)，则称\((X,Y)\)在矩形上服从均匀分布。
- 于是有\(P(X<x) = P(X<x,Y<\infty) = \int_{-\infty}^{x}\int_{-\infty}^{+\infty}p(u,v)dudv = \int_{a}^{x}\int_{c}^{d}\frac{1}{(b-a)(d-c)}dudv = \begin{cases} 0 & x \leq a \\ \frac{x-a}{b-a} & a \leq x \leq b \\ 1 & x \geq b \end{cases}\)
- 因此\(X\)是\((a,b)\)上的均匀分布，\(Y\)是\((c,d)\)上的均匀分布。
联合正态分布
- 若\((X,Y)\)具有密度函数\(p(x,y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}\)，则称\((X,Y)\)服从联合正态分布。\((X,Y)\)~\(N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)
- 边际分布：经过计算，\(X\)~\(p_X(x) = \int_{-\infty}^{+\infty}p(x,y)dy = \frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\)，\(Y\)同理。

条件分布¶

TBD

随机向量的计算与变换¶

TBD

极值随机变量¶

假设\(X_1,X_2,\cdots,X_n\)是随机变量，对\(\omega \in \Omega\)，将\(X_1(\omega),X_2(\omega),\cdots,X_n(\omega)\)进行排序，得到\(X_{(1)}(\omega) \leq X_{(2)}(\omega) \leq \cdots \leq X_{(n)}(\omega)\)，则称\(X_{(1)},X_{(2)},\cdots,X_{(n)}\)是次序随机变量，其中\(X_{(1)}\)称为极小值，\(X_{(n)}\)称为极大值，\(X_{(k)}\)称为第k小值。

极值分布¶

数学期望¶

离散型随机变量：\(E(X) = \sum_{i=1}^{\infty}x_i P(X=x_i)\)
- 退化分布：\(E(X) = x_0\)
- 两点分布：\(E(X) = p\)
- 二项分布：\(E(X) = np\)
- Possion分布：\(E(X) = \lambda\)
- 几何分布(\(P(X=k) = p(1-p)^{k-1}\))：\(E(X) = \frac{1}{p}\)

概率论（H）¶

几何概型¶

概率空间¶

随机变量¶

离散型随机变量¶

连续型随机变量¶

一般随机变量¶

随机向量¶

离散型随机向量¶

联合分布¶

边际分布¶

条件分布¶

独立性¶

连续型随机向量¶

边际分布¶

条件分布¶

随机向量的计算与变换¶

极值随机变量¶

极值分布¶

数学期望¶

方差¶

协方差¶

矩¶

特征函数¶

评论