あるコインを$2500$回投げたとき、表が$1300$回出た。このコインは偏っているか?

$ \newcommand{\SETL}{\bigl\{} \newcommand{\SETM}{\bigm|} \newcommand{\SETR}{\bigr\}} \newcommand{\NATURAL}{{\mathbb N}} \newcommand{\REAL}{{\mathbb R}} \newcommand{\PRIME}{{\mathbb P}} \newcommand{\COMPLEX}{{\mathbb C}} \newcommand{\ZEE}{{\mathbb Z}} \newcommand{\QUE}{{\mathbb Q}} \newcommand{\LAND}{\,\land\,} \newcommand{\LOR}{\,\lor\,} \newcommand{\LNOT}{\lnot} $



(以上の文章は、黒木先生のツイートを読んで、結城が自分の理解のために書いたものです。誤りがありましたらお知らせください)

あるコインを$2500$回投げたとき、表が$1300$回出た。このコインは偏っているか?

「偏りのないコインを$n$回投げる」という試行を行ったとき、表が出る回数を表す確率変数を$X$とする。すると、$X = k$となる確率は、
$$
\textrm{Pr}[X=k] = \binom{n}{k}\frac1{2^n}
$$
となる。

$X$の確率分布は平均$\mu = \frac{n}{2}$で分散$\sigma^2 = \frac{n}{4}$の二項分布になる。

(一般に、確率が$p$である二項分布の平均は$np$で分散は$np(1-p)$である。)

分散$\sigma^2 = \frac{n}{4}$だから、標準偏差$\sigma = \frac{\sqrt{n}}{2}$である。

$$
2\sigma = \sqrt{n}
$$

十分に$n$が大きいとき、表が出る回数が平均$\mu = \frac{n}{2}$から$2\sigma$以内のずれに収まる確率は約$95$%である。
$$
\textrm{Pr}\left[\left|\frac{n}{2} - X\right| \leq 2\sigma \right] = \text{約$0.95$}
$$

たとえば、$n = 2500$であるとしよう。

「偏りのないコインを$2500$回投げる」という試行を行ったとき、$n = 2500, \mu = \frac{n}{2} = 1250, 2\sigma = \sqrt{n} = \sqrt{2500} = 50$となる。

すなわち、偏りのないコインを$2500$回投げたとき、表が出る回数$X$が$1250-50 \leq X \leq 1250+50$になる確率は約$95$%である。

あるコインを$2500$回投げたとき、表が$1300$回出たとしよう。もしもそのコインが偏りのないコインだとしても、表が$1200$回から$1300$回の間に入る確率は約$95$%である。


Tweet

『数学ガール』作者。毎週火曜日は結城メルマガ。毎週金曜日はWeb連載「数学ガールの秘密ノート」。文章書きとプログラミングが好きなクリスチャン。

— 結城浩 (@hyuki) 2015年5月17日