【PRML】分类

发布于:2025-08-13 ⋅ 阅读:(12) ⋅ 点赞:(0)

1-parametric(参数方法) 和 nonparametric(非参数方法)

parametric:圈定一个假设空间,一个有限参数显式模型,比如高斯,下面直接拟合模型的参数即可,用训练或者观测的数据;

比如:线性回归、逻辑回归(假设概率分布是 Sigmoid 映射)、高斯分布建模(只需要均值 μ 和方差 σ² 两个参数)、高斯混合模型(GMM,假设成多个高斯分布的加权和

不过一旦模型不对,偏差极大

Nonparametric:不对数据的分布形式做固定假设,允许模型复杂度随数据量增加而增加. 让数据自己决定模型形状,模型的“参数量”可能无限增长

K 近邻(KNN)分类、核密度估计(KDE)、决策树 / 随机森林

2-生成式模型 Generative Models

2.1-思想

考虑两分类模型:
p ( C 1 ∣ x ) = p ( x ∣ C 1 )   p ( C 1 ) p ( x ) = p ( x ∣ C 1 )   p ( C 1 ) p ( x ∣ C 1 )   p ( C 1 ) + p ( x ∣ C 2 )   p ( C 2 ) . \begin{equation} p(\mathcal{C}_1\mid\mathbf{x}) =\frac{p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1)} {p(\mathbf{x})} =\frac{p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1)} {p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1)+p(\mathbf{x}\mid\mathcal{C}_2)\,p(\mathcal{C}_2)}.\end{equation} p(C1x)=p(x)p(xC1)p(C1)=p(xC1)p(C1)+p(xC2)p(C2)p(xC1)p(C1).把分子和分母同时除以 p ( x ∣ C 1 )   p ( C 1 ) p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1) p(xC1)p(C1)
p ( C 1 ∣ x ) = 1 1 + p ( x ∣ C 2 )   p ( C 2 ) p ( x ∣ C 1 )   p ( C 1 ) . \begin{equation} p(\mathcal{C}_1\mid\mathbf{x}) =\frac{1}{1+\dfrac{p(\mathbf{x}\mid\mathcal{C}_2)\,p(\mathcal{C}_2)} {p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1)}}.\end{equation} p(C1x)=1+p(xC1)p(C1)p(xC2)p(C2)1.此时分母是一个似然比检验,令 a    =    ln ⁡ p ( x ∣ C 1 )   p ( C 1 ) p ( x ∣ C 2 )   p ( C 2 ) a \;=\; \ln\frac{p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1)} {p(\mathbf{x}\mid\mathcal{C}_2)\,p(\mathcal{C}_2)} a=lnp(xC2)p(C2)p(xC1)p(C1),则 p ( x ∣ C 2 )   p ( C 2 ) p ( x ∣ C 1 )   p ( C 1 ) = e − a \frac{p(\mathbf{x}\mid\mathcal{C}_2)\,p(\mathcal{C}_2)} {p(\mathbf{x}\mid\mathcal{C}_1)\,p(\mathcal{C}_1)} = e^{-a} p(xC1)p(C1)p(xC2)p(C


网站公告

今日签到

点亮在社区的每一天
去签到