ICA学习（2）-EW帮帮网

1.公式推导

1.1两个问题

ICA算法会带来2个不确定性：

幅值不确定性和顺序不确定性。

1.2 推导

观测数据 x 是盲源 s 的线性混合：x = As (1)

此时，W矩阵是未知的，ICA算法的目的便是找到一个最优的矩阵W，实现对矩阵S^的求解。如果直接采用线性代数的方法对(2)式进行求解，显然是不可行的。因此需要增加额外的条件让(2)式更容易求解。

ICA算法通过假设Si 为两两相互独立的随机变量，由矩阵A变换后，成为两两非相互独立的随机变量Xi从而进行求解。这个条件也限制了Xi中最多只能有一个呈高斯分布的随机变量，否则，就不能满足Xi之间两两非相互独立的条件。

上文解释：

当独立的源信号 Si 被混合矩阵 A 线性组合后，得到的观测信号 Xi 会失去独立性，变成 “两两非相互独立”。ICA 的求解逻辑就是 “源信号 Si 独立 → 混合后 Xi 非独立”，进行反向操作：

从观测信号 X（非独立）出发，假设它由 “独立源 S 混合” 而来；
通过算法寻找一个 “解混矩阵 W”（即你提到的 W 矩阵），使得 W⋅X 的结果尽可能接近 “独立的源信号 S”；
最终，当 W⋅X 恢复出 “两两独立” 的特性时，就认为找到了源信号 S 的近似解 S^。

为什么限制 “最多一个高斯分布”？

如果源信号 Si 中有两个或以上是高斯分布，混合后的观测信号 Xi 会因 “高斯分布的线性组合仍为高斯分布”，导致 Xi 之间的 “非独立性” 无法区分（数学上，多个独立高斯信号混合后，无法通过统计方法唯一解混）。因此，ICA 要求源信号 Si 中最多一个是高斯分布，才能保证混合后的 Xi 有 “可解混” 的非独立性。

限制一个高斯分布的证明过程：

已知高斯分布的概率密度函数是：

假设混合信号x1，x2都满足高斯分布，其联合概率分布函数可以写成：

根据概率论中对相互独立的定义，x1，x2相互独立，从而无法满足ICA算法中，混合信号xi之间两两非相互独立的要求。

继续证明：

ICA 算法的目的是得到两两相互独立的Si，因此需要对求解结果之间的独立性进行评结，评估的方式是对结果的非高斯性进行量化评估。

根据 (3) 式，X由多独立成分混合成的，为了简化问题，假设这些独立成分有相同的分布。现在考虑其中一个独立成分的求解。

此时，y 可以视为 Si 的线性组合。根据中心极限定理 (多个独立随机变量的线性组合/或均值，其分布会随着组合项数的增加，逐渐趋近于高斯分布)，y 比任何一个 Si 都更加接近高斯分布。通过寻找一个 w，让 wT·x 的高斯性尽可能的低，从而让 y 接近某个 Si，这是 ICA 算法的核心思路。最理想的情况是向量中只有一个非零值，此时，y 就等价于某个 s。

对随机变量的非高斯性进行量化评价通常有以下几种方法，假设随机变量 y 的期望为 0，方差为 1。