独立成分分析 Independent Component Analysis
正如任何能在其他地方看到的 ICA 教程一样,我们首先用鸡尾酒会问题来介绍独立成分分析这一概念。
假设在一个鸡尾酒会上,有
通过 ICA 算法,我们可以在仅知道可观测信号
Identifiability
从直觉上讲,想从混合信号
因此在 ICA 中,我们只能得到一个相对更弱的结论。我们定义 Componentwise Identifiability 如下:
考虑一个源
和生成混合信号的过程 ,以及一个估计值 和其生成过程 。Componentwise Identifiability 即表示,当真实过程和估计过程得到的观测信号分布相同时,则估计的生成过程 至多是真实生成过程 经过一个排列变换 和一个 component-wise 的可逆变换 之后的结果,即:
同时我们还能得到如下等价推论:
当 Componentwise Identifiability 成立时,若前件满足,则估计值
至多是真实值 经过一个排列变换和一个 component-wise 的可逆变换之后的结果。
证明如下:
Linear ICA
定理:对于未知的独立非高斯源信号
和已知混合信号 ,假设他们满足未知线性关系 ,如果存在矩阵 使得 其中
均可逆, 且 各分量独立,则生成过程是 Componentwise Identifiable 的,且 可以从 通过排列变换 和 component-wise 线性变换 得到。
以下给出证明:
考虑从真实生成过程
根据等价推论,要证明 identifibility,即要证
其中
方便起见,我们令
由概率分布变换公式,有
取对数,有
由于
两边同时对任意不同下标的
上式第一项分子没有关于
使用链式法则展开,有
又因为
同时,由
当
因此
又因为
于是我们得到了
Identifiability 得证。
Nonlinear ICA
定理:对于未知的独立非高斯源信号
和已知混合信号 ,假设他们满足未知非线性关系 ,如果存在函数 使得 其中
均可逆, 且 各分量独立。若存在 个域 ,且满足 个差分方程 线性无关,其中 则生成过程是 Component-wise Identifiable 的,且
可以从 通过排列变换 和 component-wise 非线性变换 得到。
以下给出证明:
考虑从真实生成过程
根据等价推论,要证明 identifibility,即要证
其中
方便起见,我们令
由概率分布变换公式,有
取对数,有
由于
两边同时对任意不同下标的
上式第一项分子没有关于
使用链式法则展开,有
不同于 Linear ICA,在 nonlinear 情形下,Jacobi 行列式
对于任意
于是我们有差分矩阵
及目标向量
则差分方程组可以改写为矩阵形式
当
因此任意
又因为
于是我们得到了
Identifiability 得证。