ML

Machine Learning笔记(9)

Factor Analysis Model

Posted by mtt on October 5, 2018

Factor Analysis Model

background

$x \in \mathbb{R}^n$, $S = {x^1, \ldots, x^m}$,当 $n » m$时,用高斯分布很难拟合


$\Sigma$是奇异矩阵

  1. 不对 $\Sigma$做限制,并且希望协方差阵不是奇异的,需要 $m \ge n + 1$
  2. 限制 $\Sigma$为对角矩阵,那么每一维是独立的, $\Sigma_{jj}$就是jth-维度数据方差,拟合非奇异协方差阵需要 $m \ge 2$
准备知识

假设 $x = \begin{bmatrix} x_1 \ x_2 \end{bmatrix}$, $\mu = \begin{bmatrix} \mu_1 \ \mu_2 \end{bmatrix}$, $\Sigma = \begin{bmatrix} \Sigma_{11} & \Sigma_{12} \ \Sigma_{21} & \Sigma_{22} \end{bmatrix}$. 其中 $x_1 \;and\; \mu_1 \in \mathbb{R}^r$, $x_2 \;and\; \mu_2\in \mathbb{R}^s$, $x \;and\; \mu \in \mathbb{R}^{r+s}$, $\Sigma_{11} \in \mathbb{R}^{r \times r}$, $\Sigma_{12} \in \mathbb{R}^{r \times s}$, 并且 $x \sim N(\mu, \Sigma)$,由于协方差阵是对称阵,因此 $\Sigma_{21} = \Sigma_{21}^T$
$x_1, x_2$的联合分布服从多元高斯分布,多元正态分布的性质

  • 正态随机向量的任意线性组合仍为正态分布
  • 多元正态分布的边缘分布仍为正态分布(上一条性质的推论)
  • 其子向量的条件分布仍为正态分布






Factor Analysis Model
  • 隐变量 $z \sim N(0, I)$, $z \in \mathbb{R}^d \;(d < n)$
  • $x \mid z \sim N(\mu+\Lambda z, \Psi)$

等价地,

  • $x = \mu + \Lambda z + \epsilon$
  • $z \sim N(0,I)$
  • $\epsilon \sim N(0, \Psi)$, $\Psi$是对角阵
  • $z$和 $\epsilon$是独立的 ($\Rightarrow E[z\epsilon] = E[z]E[\epsilon]$)

在上述假设下( $p(x,z) = p(z)p(x\mid z)$ 高斯分布相乘是高斯),

由于


因此

由于



因此 $\Sigma = \begin{bmatrix} I & \Lambda^T
\Lambda & \Lambda^T\Lambda + \Psi \end{bmatrix}$
因此 $x \sim N(\mu, \Lambda\Lambda^T + \Psi)$

对似然函数关于参数求偏导,没有闭式解,因此我们采用EM算法解决

EM:
E-step:

由准备知识得:

其中


因此我们选取

M-step:
关于参数最大化

相当于最大化

???