Factor Analysis Model
background
$x \in \mathbb{R}^n$, $S = {x^1, \ldots, x^m}$,当 $n » m$时,用高斯分布很难拟合
$\Sigma$是奇异矩阵
- 不对 $\Sigma$做限制,并且希望协方差阵不是奇异的,需要 $m \ge n + 1$
- 限制 $\Sigma$为对角矩阵,那么每一维是独立的, $\Sigma_{jj}$就是jth-维度数据方差,拟合非奇异协方差阵需要 $m \ge 2$
准备知识
假设 $x = \begin{bmatrix} x_1 \ x_2 \end{bmatrix}$, $\mu = \begin{bmatrix} \mu_1 \ \mu_2 \end{bmatrix}$, $\Sigma = \begin{bmatrix} \Sigma_{11} & \Sigma_{12} \ \Sigma_{21} & \Sigma_{22} \end{bmatrix}$. 其中 $x_1 \;and\; \mu_1 \in \mathbb{R}^r$, $x_2 \;and\; \mu_2\in \mathbb{R}^s$, $x \;and\; \mu \in \mathbb{R}^{r+s}$, $\Sigma_{11} \in \mathbb{R}^{r \times r}$, $\Sigma_{12} \in \mathbb{R}^{r \times s}$, 并且 $x \sim N(\mu, \Sigma)$,由于协方差阵是对称阵,因此 $\Sigma_{21} = \Sigma_{21}^T$
$x_1, x_2$的联合分布服从多元高斯分布,多元正态分布的性质
- 正态随机向量的任意线性组合仍为正态分布
- 多元正态分布的边缘分布仍为正态分布(上一条性质的推论)
- 其子向量的条件分布仍为正态分布
Factor Analysis Model
- 隐变量 $z \sim N(0, I)$, $z \in \mathbb{R}^d \;(d < n)$
- $x \mid z \sim N(\mu+\Lambda z, \Psi)$
等价地,
- $x = \mu + \Lambda z + \epsilon$
- $z \sim N(0,I)$
- $\epsilon \sim N(0, \Psi)$, $\Psi$是对角阵
- $z$和 $\epsilon$是独立的 ($\Rightarrow E[z\epsilon] = E[z]E[\epsilon]$)
在上述假设下( $p(x,z) = p(z)p(x\mid z)$ 高斯分布相乘是高斯),
由于
因此
由于
因此 $\Sigma = \begin{bmatrix}
I & \Lambda^T
\Lambda & \Lambda^T\Lambda + \Psi
\end{bmatrix}$
因此 $x \sim N(\mu, \Lambda\Lambda^T + \Psi)$
对似然函数关于参数求偏导,没有闭式解,因此我们采用EM算法解决
EM:
E-step:
由准备知识得:
其中
因此我们选取
M-step:
关于参数最大化
相当于最大化
???