跳到主要内容

知识概览

常见导数

(ex)=ex(e^{-x})'=-e^{-x}

(ex)=ex(-e^{-x})'=e^{-x}

(arctanx)=11+x2(\arctan x)'=\dfrac{1}{1+x^2}

img

常见函数公式

(eax)=aeax(e^{ax}){'}=ae^{ax}

ex=(ex)1=1exe^{-x}=(e^x)^{-1}=\dfrac{1}{e^x}

f(x)dx=df(x)f'(x)\mathrm dx=\mathrm df(x)

xadx=xa+1a+1+C∫x^a\mathrm dx=\dfrac{x^{a+1}}{a+1}+C

ln(ab)=ln(a)+ln(b)\ln(ab)=\ln(a)+\ln(b)

lnax=xlna\ln a^x=x\ln a

ln1=0,lne=1\ln1=0, \ln e=1

ln1e=ln1e1=ln1+lne1=0+1lne=1\ln\dfrac{1}{e}=\ln1e^{-1}=\ln1+\ln e^{-1}=0+-1\ln e=-1

ln1a=lna\ln\dfrac{1}{a}=-\ln a

等比数列

Sn=a1(1qn)1qS_n=\dfrac{a_1(1-q^n)}{1-q}

S=a11q(q<1,n)S_\infty=\dfrac{a_1}{1-q}(\vert q\vert <1,n→\infty)

常见积分

分部积分法

uvdx=uvuvdx∫uv'\mathrm dx = uv - ∫u'v \mathrm dx(u/v为x的函数)

abuvdx=(uv)ababuvdx∫_a^buv'\mathrm dx=(uv)\vert _a^b-∫_a^bu'v\mathrm dx

基本概念

AB=BA,AB=BAA∪B=B∪A, AB=BA

0=P()0=P(\varnothing)

1=P(A)+P(Aˉ)1=P(A)+P(\bar A)

1=P(AB)+P(AˉB)1=P(A\vert B)+P(\bar A\vert B)

P:事件概率 FX(x)=P{X<x},abfX(x)dx=P{aX<b}F_X(x)=P\{X < x \}, \int_a^b f_X(x)\mathrm dx=P\{a\leq X < b \}

f:(概率)密度函数 fX(x)=dFX(x)dxf_X(x)=\dfrac{\mathrm d F_X(x)}{\mathrm d x}

F:(累积)分布函数 FX(x)=xfX(x)dxF_X(x)=\int_{-∞}^x f_X(x) \mathrm dx

全集: Ω=\Omega = \overline \varnothing

联合(累积)分布函数:F(x,y)F(x,y)

联合(概率)密度函数:f(x,y)f(x,y)

边缘密度函数:fX(x)=+f(x,y)dyf_X(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm dy ,X取固定值时Y的所有概率的和

X,YX,Y独立:fX(x)fY(y)=fX,Y(x,y)f_X(x)·f_Y(y)=f_{X,Y}(x,y)FX(x)FY(y)=FX,Y(x,y)F_X(x)·F_Y(y)=F_{X,Y}(x,y)

一言第一定理/全概率:P(A)=P(AB)+P(ABˉ)P(A)=P(AB)+P(A\bar B)

条件概率:P(AB)=P(AB)P(B)P(A\vert B)=\dfrac{P(AB)}{P(B)}

条件概率密度:fYX(yx)=f(x,y)fX(x)f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}

AB事件独立:P(AB)=P(A)P(B)P(AB)=P(A)P(B)

容斥原理:P(A+B)=P(A)+P(B)P(AB)P(A+B)=P(A)+P(B)-P(AB)

德摩根律/对偶律:AˉBˉ=AB,AˉBˉ=AB\bar A∪\bar B=\overline {AB},\:\bar A\bar B=\overline {A∪B}

贝叶斯公式:P(AB)=P(BA)P(A)P(B)P(A\vert B)=\dfrac{P(B\vert A)P(A)}{P(B)}

泰勒展开:ex=1+x11!+x22!+e^x=1+\dfrac{x^1}{1!}+\dfrac{x^2}{2!}+···

切比雪夫不等式:ε0,P{XEX<ε}1DXε2\varepsilon\geq 0,P\{\vert X-EX\vert < \varepsilon \}\geq1-\dfrac{DX}{\varepsilon^2}

卷积公式:fX+Y=+f(x,zx)dxf_{X+Y}=\int_{-\infin}^{+\infin}f(x,z-x)\mathrm dx

中心极限定理

和趋于正态分布

limnP(Xinμnσ<x)=12πxet22=ϕ(x)\lim_{n→\infin}P(\dfrac{\sum X_i-n\mu}{\sqrt{n}\sigma}<x)=\dfrac{1}{\sqrt{2\pi}}∫_{-\infin}^xe^{-\tfrac{t^2}{2}}=\phi(x)

全概率公式 advanced

前提:B1/B2/BiB_1/B_2/B_i互不相交且和为Ω\Omega

P(A)=P(AB1)P(B1)+P(AB2)P(B2)++P(ABi)P(Bi)P(A)=P(A\vert B_1)P(B_1)+P(A\vert B_2)P(B_2)+···+P(A\vert B_i)P(B_i)

P(A)=P(AB1)+P(AB2)++P(ABi)P(A)=P(AB_1)+P(AB_2)+···+P(AB_i)

矩(描述数据特征的东西)

中心矩:中心化的矩

把X中心化:XEXX-EX

p阶(原点)矩:E(Xp)E(X^p)

p阶中心矩:E((XEX)p)E((X-EX)^p)

数学期望(一阶原点矩)

p(x)为X的概率密度函数

离散型随机变量 EX=x(xp(x))EX=\sum_x(xp(x))

连续型随机变量 EX=+xp(x)dxEX=∫_{-∞}^{+∞} xp(x)\mathrm dx

Eg(X)=+g(x)p(x)dxEg(X)=∫_{-∞}^{+∞} g(x)p(x)\mathrm dx

Eg(X,Y)=g(x,y)f(x,y)dxdyEg(X,Y)=∫∫g(x,y)f(x,y)\mathrm dx\mathrm dy

E(X+Y)=EX+EYE(X+Y)=EX+EY

E(aX)=aEXE(aX)=aEX

X,YX,Y独立:E(XY)=(EX)(EY)E(XY)=(EX)(EY)

方差D()/Var()D()/Var()(二阶中心矩)

DX=E((XEX)2)=E(X2)(EX)2DX=E((X-EX)^2)=E(X^2)-(EX)^2

D(X+Y)=D(X)+2Cov(X,Y)+D(Y)D(X+Y)=D(X)+2Cov(X,Y)+D(Y)

D(XY)=D(X)2Cov(X,Y)+D(Y)D(X-Y)=D(X)-2Cov(X,Y)+D(Y)

D(cX)=c2DXD(cX)=c^2DX

协方差(二阶交叉中心矩)

X,YX,Y独立:Cov(X,Y)=0Cov(X,Y)=0

Cov(X,Y)=E((XEX)(YEY))=E(XY)(EX)(EY)Cov(X,Y)=E((X-EX)(Y-EY))=E(XY)-(EX)(EY)

Cov(X+Z,Y)=Cov(X,Y)+Cov(Z,Y)Cov(X+Z,Y)=Cov(X,Y)+Cov(Z,Y)

Cov(X,Y+Z)=Cov(X,Y)+Cov(X,Z)Cov(X,Y+Z)=Cov(X,Y)+Cov(X,Z)

Cov(aX,Y)=aCov(X,Y)Cov(aX, Y)=aCov(X, Y)

Cov(X,aY)=aCov(X,Y)Cov(X, aY)=aCov(X, Y)

相关系数:ρXY=Cov(X,Y)D12(X)D12(Y)\rho_{XY}=\dfrac{Cov(X,Y)}{D^{\frac{1}{2}}(X)D^{\frac{1}{2}}(Y)}

参数估计

X\overline X:样本均值

s2s^2:样本方差

样本(无偏)方差 s2=(XiXˉ)2n1s^2=\dfrac{\sum(X_i-\bar X)^2}{n-1}

样本一阶矩:X=Xin\overline X=\dfrac{\sum X_i}{n}

样本p阶矩:Xipn\dfrac{\sum X_i^p}{n}

点估计

矩估计

思想:用样本矩代替总体矩

  1. 找到需要估计的总体矩
  2. 用样本生成相同的矩
极大似然估计

求出最容易得出这个样本的参数

似然函数L()\mathcal L():每个样本对应概率密度的乘积

求出L()\mathcal L()的最大值

def L(参数组合) -> 样本概率
max(L())

例:练习册 第7章 第2题

L(λ)=i=1n(eλλxixi!)=i=1neλi=1nλxii=1n1xi!=enλλi=1nxii=1n1xi!\begin{aligned} \mathcal L(\lambda)&=\prod_{i=1}^n \left(e^{-\lambda} \cdot \frac{\lambda^{x_i}}{x_i!}\right)\\ &=\prod_{i=1}^ne^{-\lambda} \cdot \prod_{i=1}^n \lambda^{x_i} \cdot \prod_{i=1}^n \frac{1}{x_i!}\\ &=e^{-n\lambda}\cdot \lambda^{\sum_{i=1}^n x_i}\cdot \prod_{i=1}^n \frac{1}{x_i!} \end{aligned}

(λ)=ln(enλλi=1nxii=1n1xi!)=lnenλ+lnλi=1nxi+lni=1n1xi!=nλ+i=1nxilnλi=1nlnxi!\begin{aligned} \ell(\lambda)&=\ln\left(e^{-n\lambda}\cdot \lambda^{\sum_{i=1}^n x_i}\cdot \prod_{i=1}^n \frac{1}{x_i!}\right)\\ &=\ln e^{-n\lambda}+\ln \lambda^{\sum_{i=1}^n x_i}+\ln \prod_{i=1}^n \frac{1}{x_i!}\\ &=-n\lambda +\sum_{i=1}^n x_i\cdot \ln \lambda -\sum_{i=1}^n\ln x_i! \end{aligned}

(λ)λ=n+i=1nxi1λ=0\dfrac{\partial \ell(\lambda)}{\partial \lambda}=-n+\sum_{i=1}^n x_i\cdot \dfrac{1}{\lambda}=0

λ=1ni=1nxi=xˉ\lambda=\frac{1}{n}\sum_{i=1}^n x_i=\bar x

置信区间/(正态分布的)区间估计

用矩估计或极大似然估计对总体均值做估计是不准确的

这个估计值与总体真实值很难完全相等

因此引入区间估计,区间估计可以估计出一个范围,使得总体均值落在这个区间的概率是比方说95%

def 区间估计(样本值, 置信度: 1-α) -> 置信区间

要使得 EXaDXEX+aDXEX-a\sqrt{DX}→EX+a\sqrt{DX}区间的概率为95%

a=?a= ?

Φ(a)0.5=0.952Φ(a)-0.5=\dfrac{0.95}{2}

Φ值表

假设检验/显著性检验

> 你猜猜我喝奶茶的时候能不能分辨出它做的时候是先放的奶再放的茶还是先放的茶后放的奶?

< 不能

> 是,Fisher就是偷听奶茶店对话提出了假设检验

奶茶:MT 茶奶:TM

你现在有10杯配好的饮料,给我喝

然后我说是MT还是TM

假设我具备分辨MT与TM的能力

那我对这10杯的判断应该全对ncorrect=10n_{correct} = 10

各种分布

二项分布(伯努利分布) B(n,p)B(n,p)

两点分布(0-1分布) B(n=1,p)B(n=1,p)

EX=npEX=np

DX=np(1p)DX=np(1-p)

XB(n1,p),YB(n2,p)X\sim B(n_1,p),Y\sim B(n_2,p)且独立,X+YB(n1+n2,p)X+Y\sim B(n_1+n_2,p)

均匀分布 U(a,b)U(a,b)

F(x)=xaba,axbF(x)=\dfrac{x-a}{b-a},a \le x \le b

f(x)=1ba,a<x<bf(x)=\dfrac{1}{b-a},a<x<b

EX=a+b2EX=\dfrac{a+b}{2}

DX=(ab)212DX=\dfrac{(a-b)^2}{12}

指数分布 Exp(θ)Exp(\theta)

f(x)=1θexθ,x>0f(x)=\dfrac{1}{\theta}e^{-\tfrac{x}{\theta}},x>0

F(x)=1exθ,x>0F(x)=1-e^{-\tfrac{x}{\theta}},x>0

正态分布 Norma(μ,σ2)Norma(\mu,\sigma^2)

标准正态分布Z=N(0,1)Z=N(0,1)

N(μ,σ2)+c=N(μ+c,σ2)N(μ,σ^2)+c=N(μ+c,σ^2)

cN(μ,σ2)=N(cμ,c2σ2)cN(μ, σ^2) = N(cμ, c^2σ^2)

XN(a,b2)<=>XabN(0,1)X\sim N(a,b^2)<=>\dfrac{X-a}{b}\sim N(0,1)

f(x)=12πσe(xμ)22σ2f(x)=\dfrac{1}{\sqrt {2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}}

独立即可加:N (μ1,σ12)+N(μ2,σ22)=N(μ1+μ2,σ12+σ22)N~(\mu_1,\sigma_1^2)+N(\mu_2,\sigma^2_2)=N(\mu_1+\mu_2,\sigma_1^2+\sigma^2_2)

Fisher定理:正态分布的样本均值和样本方差相互独立

正态分布样本均值的分布:XN(μ,σ2n)\overline X\sim N(\mu,\dfrac{\sigma^2}{n})

正态分布样本方差的分布:(n1)s2σ2χ2(n1)\dfrac{(n-1)s^2}{σ^2} \sim χ^2(n-1)

ϕ(?)\phi(?):正态曲线从-\infin积分到μ+?\mu+?的值

泊松分布 Poi(λ)Poi(λ)

P{X=k}=λkk!eλ,k=0,1,2P\{X=k\}=\dfrac{λ^k}{k!}e^{-\lambda},k=0,1,2\cdots

EX=DX=λEX=DX=λ

卡方分布 χ2(n:χ^2(n: 自由度))

n个标准正态分布N(0,1)N(0,1)的平方之和的分布

数学语言:

Z1,Z2,,ZnZ1, Z2, \cdots, Zn 互相独立且服从 N(0,1)N(0, 1)

则称随机变量X=Z12+Z22++Zn2X = Z_1^2 + Z_2^2 + \cdots + Z_n^2

服从自由度为 n 的卡方分布, 记作 Xχ2(n)X\simχ^2(n)

Z12+Z22++Zn2χ2(n)Z_1^2+Z_2^2+\cdots+Z_n^2\sim \chi^2(n)

均方:平方和除以n

F分布 F(n,m)F(n,m)

F(n,m)=χ2(n)/nχ2(m)/mF(n,m)=\dfrac{χ^2(n)/n}{χ^2(m)/m}

标准正态分布平方m个标准正态分布均方=F(1,m)\dfrac{\text{标准正态分布平方}}{\text{m个标准正态分布均方}}=F(1, m)

Z12+Z22++Zn2n/W12+W22++Wm2mF(n,m)whereZi,WiN(0,1)i.i.d\dfrac{Z_1^2+Z_2^2+\cdots+Z_n^2}{n}\Big/\dfrac{W_1^2+W_2^2+\cdots+W_m^2}{m}\sim F(n,m) where Z_i, W_i \sim N(0, 1) i.i.d

t分布

Z/W12+W22++Wn2nt(n)Z\Big/\sqrt{\frac{W_1^2+W_2^2+\cdots+W_n^2}{n}}\sim t(n)