分散 / 共分散の式変形を丁寧に追ってみた。

初見でわからなかった共分散の式変形がわかったので丁寧にメモしておく。

まず大前提として平均は以下で表す。

\begin{align} E(x) = \bar{x} = \dfrac{1}{n} \sum x \end{align}

まずは分散の式変形は以下でできる。

\begin{align} s = V[x] = E[(x - \bar{x}) ^2 ] &= \dfrac{1}{n} \sum (x - \bar{x}) ^2 \\ &= \dfrac{1}{n} \sum (x ^2 - 2x\bar{x} + \bar{x} ^2) \\ &= \dfrac{1}{n} \sum x ^2 - 2\bar{x} \dfrac{1}{n} x + \bar{x} ^2 \\ &= \bar{x ^2} - 2\bar{x} ^2 + \bar{x} ^2 \\ &= \bar{ x ^2} - \bar{x} ^2 \\ &= E[x ^2] - E[x] ^2 \end{align}

次に共分散の式変形は以下でできる。

\begin{align} s_{xy} = E[(x - \bar{x})(y - \bar{y})] &= \dfrac{1}{n} \sum (x - \bar{x})(y - \bar{y}) \\ &= \dfrac{1}{n} \sum (xy - x\bar{y} - \bar{x}y + \bar{x}\bar{y}) \\ &= \dfrac{1}{n} \sum xy - \bar{y} \dfrac{1}{n} x - \bar{x} \dfrac{1}{n} y + \bar{x} \bar{y} \\ &= E[xy] - \bar{y}\bar{x} - \bar{x}\bar{y} + \bar{x} \bar{y} \\ &= E[xy] - \bar{x}\bar{y} \\ &= E[xy] - E[x]E[y] \\ \end{align}

わかると大したことはないんだが、 Eとバーとシグマとか表現が色々ありすぎて最初混乱したというのはありそう。 以下の表現は嫌だった。

\begin{align} E[(x - E[x])(y - E[y])] \end{align}