中心極限定理の概略(outline of central limit theorem)

中心極限定理を簡略化して説明

$n$個の確率変数があります:$X_1,X_2,…,X_n$

それらの条件は

このとき、$n$が大きくなるとそれらの『平均』もしくは『総和』は

\[\bar{X} = \dfrac{1}{n}\sum_{i=1}^{n}X_i \sim N(\mu, \sigma^2/n)\] \[Xの総和 = \sum_{i=1}^{n}X_i \sim N(n\mu, n\sigma^2)\]

と考えてよい、という法則です。

独立な確率変数の

これらは、「サンプルサイズが十分に大きければ」正規分布に近似するとみなしてよいというところが要点です。

「元の分布が正規分布に従うと述べているわけではない」ことに留意する必要があります。近似するのは『平均』か『総和』です。

標本平均の平均と分散

以下の公式を用いて示します。

\[\begin{aligned} & E(X+Y) = E(X) + E(Y)\\ & V(X+Y) = V(X) + V(Y) + 2C(X,Y)\\ & (独立であるなら)V(X+Y) = V(X) + V(Y) \end{aligned}\]

$\bar{X}$の平均は?

\[\begin{aligned} E(\bar{X}) &= E\left( \dfrac{1}{n}\sum_{i=1}^{n}X_i \right)\\ &= \dfrac{1}{n} E\left( \sum_{i=1}^{n}X_i \right)\\ &= \dfrac{1}{n} E\left( X_1 + X_2 + ... + X_n \right)\\ \end{aligned}\]

公式を繰り返し適用することにより

\[\begin{aligned} & \dfrac{1}{n} \left[ E(X_1) + E(X_2) + ... + E(X_n) \right] \end{aligned}\]

独立同一分布より$E(X_i)=E(X)$となるので

\[\begin{aligned} &\quad~ \dfrac{1}{n} \left[ E(X) + E(X) + ... + E(X) \right]\\ &= \dfrac{1}{n} nE(X)\\ &= E(X)\\ &= \mu \end{aligned}\]

$\bar{X}$の期待値は$\mu$であることがわかりました。

$\bar{X}$の分散は?

\[\begin{aligned} V(\bar{X}) &= V\left( \dfrac{1}{n}\sum_{i=1}^{n}X_i \right)\\ &= \dfrac{1}{n^2} V\left( \sum_{i=1}^{n}X_i \right)\\ &= \dfrac{1}{n^2} V\left( X_1 + X_2 + ... + X_n \right)\\ \end{aligned}\]

公式を繰り返し適用することにより

\[\begin{aligned} & \dfrac{1}{n^2} \left[ V(X_1) + V(X_2) + ... + V(X_n) \right] \end{aligned}\]

独立同一分布より$V(X_i)=V(X)$となるので

\[\begin{aligned} &\quad~ \dfrac{1}{n^2} \left[ V(X) + V(X) + ... + V(X) \right]\\ &= \dfrac{1}{n^2} nV(X)\\ &= \dfrac{V(X)}{n}\\ &= \dfrac{\sigma^2}{n} \end{aligned}\]

$\bar{X}$の分散は$\dfrac{\sigma^2}{n}$であることがわかりました。

したがって、下記の平均と分散が示されたことになります。

\[\bar{X} = \dfrac{1}{n}\sum_{i=1}^{n}X_i \sim N(\mu, \sigma^2/n)\]

Xの総和は

\[E(Xの総和) = E\left( \sum_{i=1}^{n}X_i \right)\]

であり $\bar{X}$ の場合から $\dfrac{1}{n}$ が消えたかたちのものだとわかります。

\[cf.~ E(\bar{X}) = E\left( \dfrac{1}{n}\sum_{i=1}^{n}X_i \right)\]

したがって、$\bar{X}$ の場合と見比べますと、期待値から $\dfrac{1}{n}$ 、分散から $\dfrac{1}{n^2}$ が消えたものだとわかります。

$\bar{X}$ のときと同様の計算を行うことで期待値 $n\mu$ 、分散 $n\sigma^2$ が得られ、

\[Xの総和 = \sum_{i=1}^{n}X_i \sim N(n\mu, n\sigma^2)\]

が示されました。

正規分布の再生性

独立に正規分布に従う2つの確率変数があるとき

\[\begin{aligned} & X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) \end{aligned}\]

(執筆中)

参考文献