混合密度模型GMM的似然函数（二）

发布于：2025-06-29 ⋅ 阅读:(47) ⋅ 点赞:(0)

设 $\varTheta= \{ \pi_k, \boldsymbol {\theta}_k \}_{k=1}^{K}$ 为参数向量， $\mathcal {X} = \{ {\bm x}_1, \cdots, {\bm x}_n \}$ 为观测数据，给定数据点的独立性，似然函数可以写成：
$L(\varTheta) = p(\mathcal {X} \mid {\varTheta})= p(\mathcal {X} | \{ \pi_k, {\bm \theta}_k \}_{i=1}^{K}) \\= \prod_{i=1}^{n} p(\boldsymbol{x}_i | \{ \pi_k, {\bm \theta}_k \}_{i=1}^{K}) = \prod_{i=1}^{n} \left( \sum_{k=1}^{K} \pi_k p(\boldsymbol{x}_i | {\bm \theta}_k) \right) \tag{10}$

因此，对数似然函数为：

$L(\varTheta;\mathcal {X}) = \ln p(\mathcal {X} \mid {\varTheta}) = \ln p(\mathcal {X} | \{ \pi_k, {\bm \theta}_k \}_{i=1}^{K}) \\=\ln \prod_{i=1}^{n} p(\boldsymbol{x}_i \mid \{ \pi_k, {\bm \theta}_k \}_{i=1}^{K}) =\sum\limits_{i=1}^{n} \ln \left( \sum\limits_{k=1}^{K} \pi_k p( \boldsymbol{x}_i \mid \boldsymbol {\theta}_k) \right) \tag{11}$

求梯度

$\nabla_{\bm{\theta}_k} L = \sum_{i=1}^{n} \frac{1}{p(\bm{x}_i|\boldsymbol{\varTheta})} \nabla_{\bm{\theta}_k} \left[ \sum_{k=1}^{K} \pi_kp(\bm{x}_i|\boldsymbol{\theta}_k) \right]$
式中
$p(\boldsymbol{x}_i \mid \varTheta) = \sum_{k=1}^{K} \pi_k p(\boldsymbol{x}_i \mid \boldsymbol{\theta}_k), \tag{12}$

最大似然参数估计由下式决定：
$\{ \hat{\pi}_k, \hat{\bm \theta}_k \}_{i=1}^{K} = \arg \max_{\{ \pi_k, {\bm \theta}_k \}_{i=1}^{K}} \sum_{i=1}^{n} \ln \left( \sum_{k=1}^{K} \pi_k p(\boldsymbol{x}_i | {\bm \theta}_k) \right) \tag{13}$

在单个高斯函数 ( $K = 1$ ) 的情况下，这种最大化可以以解析形式实现，从而得到常用的样本均值和样本协方差矩阵估计量（ $\pi_1 = 1$ 且没有混合系数可估计）。然而，对于 $\geqslant 2$ ，最大参数的解析表达式是未知的，并且最大化必须以数值形式进行。
这是因为式 (11) 中对数内存在求和，而非乘积，无法直接对（高斯）密度求对数，这使得 $L(\varTheta;\mathcal {X})$ 的最大化变得复杂，难以求解。

在下一节中，将介绍一个著名的数值方法——期望-最大化算法来解决最大似然问题。

在这里插入图片描述

混合密度模型GMM的似然函数（二）

网站公告

今日签到

热门文章

最新发布