二項分布とポアソン分布

シェアする

  • このエントリーをはてなブックマークに追加

こんばんは、連続更新ですね。

本日、「甘々と稲妻」というアニメの1話をニコニコ動画で見たのですが、とても良いアニメですね。1話だけで判断すると、良アニメの気配を感じます。はやみん大好き。

読売テレビではMANPA枠で本日2話放送ですね。録画します。

タイムトラベル少女(マリワカ)もかなり好きです。一昔前のNHK教育アニメ感が良い。面白くて為になる。あとマリちゃんかわいい。

マリワカは第一話・最新話無料です。現在(7/18)第二話まで配信中。

さて、今回は二項分布からポアソン分布を導出してみます。

二項分布とは

「確率pで成功、確率1-pで失敗」という試行を「ベルヌーイ試行」と言います。

コイントスがその代表ですね。サイコロでも「3の倍数が出たら成功、それ以外は失敗」というように、2通りに分類することでベルヌーイ試行にできます。

別に成功、失敗という分類でなくても大丈夫です。2通りのどちらかが一定の確率で決まるような試行です。

成功確率pのベルヌーイ試行に対して「成功したら1、失敗したら0」という値を取るような確率変数を考えた時、この確率変数が従う確率分布を「ベルヌーイ分布」の呼び、Ber(p)などと書きます。

さらに、独立にBer(p)に従うn個の確率変数X_1~X_nの和が従う分布を「二項分布」と呼び、B(n,p)と書きます。

B(n,p)は「成功確率pの試行をn回行ったときの成功回数が従う分布」ですね。

二項分布は離散確率分布であり、確率関数は

となります。nCxは二項係数ですね。組合せのやつです。もちろんxは区間[0,n]の整数に限ります。また、pは閉区間[0, 1]に属する実数です。

二項分布は、平均がnp、分散がnp(1-p)になります。超重要なので覚えておきましょう。導出もできるようにならないといけません。E[X]とE[X(X-1)]を求めるのが鉄板です。二項係数に階乗が出てくるので、階乗モーメントを計算するのが楽なんですね。

この分布を用いて、ポアソン分布を導出します。

ポアソン分布とは

前回の記事でも書きましたが、ポアソン分布とは、「一定時間内に平均λ回起こる出来事が、一定時間内にx回起こる確率」の分布です。λは正の実数です。

例えば、「一カ月に交通事故が平均10件起こる地域で、来月に交通事故がx回起こる確率」などがλ=10のポアソン分布に従います。

ポアソン分布は以下の確率関数を持ちます。

ポアソン分布の平均、分散はともにλになります。覚えやすい。

二項分布は離散時間、ポアソン分布は連続時間での生起回数の確率分布と考えることができます。

二項分布でのベルヌーイ試行を一定時間間隔で行うと考えて、間隔を短くしていくとポアソン分布に近づいていきます。

では、確かめてみましょう。

二項分布からポアソン分布へ

一定時間当たりに平均λ回起こる事象を考えます。

この一定時間をn等分(nはλより十分大きい)した区間を「1区間」とすると、n区間でλ回起こるのだから、ある1区間に事象が起こる確率は λ/n だと考えられます(nは十分大きいものとすると、1区間は十分短くなるので、1区間に事象が2回起こる確率は非常に小さくなり、無視できると考えられます)。

従って、n区間で事象がx回起こる確率は、二項分布より

となります。ここで、n→∞の極限を取ると(1区間の長さを限りなく0に近づけると)

となり、ポアソン分布の確率関数が得られます。

最後の部分で、λとxを有限の値に固定したまま n→∞ とするので、分数の分子は各要素が(1-0)に収束するので積が1になり、最後の指数要素では

を利用しています(この等式でnの代わりに n/(-λ) を用いると、n→+∞のとき n/(-λ)→ -∞ になります)。

また、指数は (λx/n-λ) → -λ になります。

結局これは、二項分布B(n,p)において、np=λ を一定にしながら(p=λ/nとして)nを無限大に飛ばしたものであり、その平均は np=λ、分散は np(1-p)=λ(1-λ/n)→λ になります。

以上が、二項分布からのポアソン分布の導出でした。

確率分布どうしは関連があるものが多いので、相関図みたいなものを作ってみると楽しいですよ。

幾何分布と負の二項分布の話とか、指数分布とガンマ分布の話とかもしたいなあ。

では。

スポンサーリンク
レクタングル(大)
レクタングル(大)

シェアする

  • このエントリーをはてなブックマークに追加

フォローする