本文记录《概率论》学习
在做数据分析时,发现有好多概率论
的知识需要掌握,因此记录相关学习。
基础
- 基本事件:不能再分(不必再分);
- 符合事件:由基本事件复合;
- 必然事件:一定发生
Ω
。 - 不可能事件:一定不发生。
- 样本空间:所有基本事件的集合
- 样本点:样本空间的元素。
- 包含于:A
包含于
B,则A是B的子集 - 包含:B
包含
A,则A是B的子集。 - 无限可列个:按某种规律排成一个序列。
- 概率:事件可能性发生的大小,
P(A)
,任意事件发生的概率=0<=P(a)<=1
古典概率模型
满足条件:(1)样本空间有有限个样本点;(2)
等可能性
:所有样本点出现的可能性相等。
$$
P(A)=\frac{A的有利样本点}{\Omega中样本点总数}=\frac{A中包含的基本事件数}{基本事件总数}
$$
不重复排列
$$
P^m_n=n(n-1)(n-1)…(n-m+1)=\frac{(n-m)!}{n!}
$$
重复排列,从n个不同元素中取出m个,元素可以放回。
$$
\underbrace{nn\cdots*n} = n^m
$$
组合:从n个不同元素取出m个不同元素,相当于先按照排列取出m个元素,这种情况有n!/(n-m)!
种,对于组合而言,这m个元素是不需要再排序的,那么前面的n!/(n-m)!
其实是这m个元素排序的结果,m个元素排序有m!
种情况。所以根据不重复排列的总数除以m的阶乘个重复情况,就是组合的结果
$$
C^m_n=\frac{P^m_n}{m!}=C^{n-m}_n
$$
古典概率性质:非定性、规范性、有限可加。缺点:(1)有限个结果;(2)每种结果必须是等可能性。
几何概率模型
线段、平面、立体
$$
P(A)=\frac{\mu(G)}{\mu(\Omega)}
$$
公理
- 非负性:事件的概率大于等于0,小于等于1;
- 规范性:必然事件的概率等于1;
- 可加性:完全可加性,如果A1,A2…互不相容,则:
P(A1+A2+...)=P(A1)+P(A2)+...
全概率公式
通过基本事件的概率,算出某个事件或集合发生的概率。A1,A2,···,An是E的完备事件组,且P(Ai)>0,则有:
$$
P(B)=\sum_{i=1}^{n}P(A_i)P(B|A_i)
$$
贝叶斯公式
通过结果,推算是由某个基本事件引起的概率。
假设A1,A2,…,An完备,P(Ai)>0,P(B)>0
$$
P(A_k|B)=\frac{P(A_k)P(B|A_k)}{\sum_{i=1}^{n}P(A_i)P(B|A_i)}=\frac{P(A_kB)}{P(B)}
$$
伯努利模型
结果只有两种,每次实验都是独立的。
假设在伯努利模型中,A发生的概率为P,计算n次伯努利实验中A发生K次的概率,
$$
P_n(K)=C_n^kP^k(1-P)^{n-k}
$$
二项概率公式
泊松分布
$$
P{X=K}=\frac{\lambda^k}{K!}*e^{-\lambda}
$$
二项式分布:n>=100,np<=10
的时候用泊松分布近似计算,此时$\lambda=np$
均匀分布
频率密度函数
$$
f(x)=\begin{cases}
\frac{1}{a-b},,,a\leq{x}\leq{b}\
0,,, else
\end{cases}
$$
指数分布
指数分布频率密度函数,用例:(各种物品或动物的寿命)
$$
f(x)=\begin{cases}
\lambda{e^{-\lambda{x}}},,,x>0\
0,,,x\leq{0}
\end{cases}
$$
正态分布
密度函数
$$
\phi(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}
$$
$\mu$:变量输出值的加权平均值,$\sigma$:方差
常用于测量误差、波浪起伏,人的身高体重
。
一般正态分布化为标准分布
重要
$$
\phi(x)=\frac{1}{\sigma}\phi_0(\frac{x-\mu}{\sigma})
$$
三$\sigma$准则
随机变量函数分布
已知分布,构造分布函数。
离散型数据变量
多维随机变量及其分布
联合分布确定可唯一确定边缘分布。
边缘分布不能确定联合分布。如果多维随机变量相互独立,则由边缘分布可以确定联合分布。
如果二维随机变量是正态分布,边缘分布也是正态分布;两边缘分布是正态分布,二维随机变量不一定是正态分布。
条件分布:比如限制身高,看体重分布情况。