0章 はじめに


2012年晩秋の現在、確率を扱う本が増えてきたような気がしています。

少し前から、ベイズという確率の考え方が検索エンジンなどに実装され成果を上げている、などの話題も耳にするようになりました。

新しいキーワードの拡がりと共に確率への興味も高まっているように思えます。


ところで、みなさんは普段から確率に接していますか。


自動車や火災などの損害保険や生命保険には加入されている方も多いと思います。

筆者も、非常に小さい確率であるが起こった場合は大変な事になると思うので入っています。

それがどの程度なのか数字として把握している訳ではなくて、漠然としたリスク対応としてですね。


あまりに負け続けて人気になった馬もいましたが、競馬のオッズは掛け金の配当率だけで決まってます。

ジャンボ宝くじなどは、4等の10万円でInftyProject、3等の100万円でInftyProjectだそうですが、0.0001と0.00001です。

どっちも誤差なような数字に見えてしまい、「万が一当たればラッキー」としか思わず、浮いたお金がある時に数枚買う程度です。

よく考えればInftyProjectは100×100マスでInftyProjectは316×316マスぐらいなので、確率としてもイメージできそうなものですが、売れ残った宝クジに当たりがあった場合など公表されてない要素もあり、あまりリアリティを感じられません。

ですから、仕事でもなければ数字として接している確率は降水確率ぐらいです。


みなさんは、どうでしょうか。


確率はある事象が生起する割合です。

これから起こるであろう事柄に対処する為に、極めて重要な数字です。


ギャンブルなどと違い、意思決定の影響が大きくなるほど確率の重要性も高まっていきます。


例えば故障率0.5%と0.1%では誤差程度の気もしますが、1日100万人が使う機械だとしたら、5,000人と1,000人の差になってしまいます。


あるメーカーの資料を読んでいたら、自動改札機の追従方式と言う新しい人の検知方式だと、通行検知漏れが0.09%で、逆に過剰に検知してしまうことは0%だそうです。


ラッシュ時の電車は、1車両に300人ぐらい乗ってるそうですから、11両編成の山手線なら300×11×0.0009=2.97となりますので、大体電車1本に3人ぐらいの計算になります。

こうした数字を元にして、サポート要員どうしようか?などのような話にも発展できるわけです。


意思決定する立場の人、最近はディシジョンメーカーなどという言い方もするそうですが、そういった方々は、レポートなどに挙がっている数字を見て判断しています。


もちろん一般の消費者の方も立派なディシジョンメーカーです。

「何人中何人に効果あり」、「これで何%の人が合格」などのように宣伝文句としての確率は毎日のように見ています。

こうした確率は、普段は気にしないまでも、時には鵜呑みに出来ない場面も出てきます。


事故や渋滞の確率から道路行政なども計画されますし、薬効なども、人によって効果や副作用など程度差があり確率的に見られる事もあります。


行政が発行している白書やインターネットなどでも、何を根拠にそのような判断になっているのかを学術的な数字をあげて説明しているレポートを見る事が出来ます。


その数字が妥当なのか、どうやって出されたのか、必要な時には理解できるに越した事はありません。

このコラムでは、身近にあるようなないような、分っているようなないような、そんな確率について取り上げてみたいと思います。


例えばサイコロが1つあるとします。

仕掛けをしていない普通のサイコロであれば、1の目が出る確率は言うまでもなくInftyProjectですね。

それなら6回サイコロを振れば1回は1の目が出るかといえば、そんなこともありません。

6回振って1の目が1回以上出る確率は66.5%ぐらいです。


サイコロを振ったりコインを投げたり確率的な実験を試行と言いますが、この試行を何十回何百回と繰り返し行うと大数の法則というものが効いてきて、理論値であるInftyProjectに近づきますが、普通はそんなに振りませんよね。


大数の法則に基いて確率を考えていいのは送り手側、つまり胴元です。

受け手の立場では違う見方をしないといけません。


6回サイコロを振って1の目が出ることを考えた場合、どんな結果が考えられるでしょうか。

{1の目が1回だけ出る、1の目が2回出る、3回出る...6回出る、1回も出ない}の7パターンが考えられます。

この7パターンはそれぞれ起こる確率が違います。

これらを全部計算して足すと、1の目が1回以上出る確率になります。

あえて式を書くとInftyProjectとなります。

InftyProject という記号は、「0から1づつ増やして6まで足し合わせる」という意味になります。

InftyProjectは、組み合わせ(Combination)の事です。

nに0~6を代入して7回計算したものを足し合わせると、これの答えである0.665が求まります。

因みに何かをゼロ乗すると1になります。


数式にすると何だかメンドクサイ感じになってきますね。


この公式は確率計算をする上では重要なものですので、後の章でまた説明します。

別な考え方で、6回振って1回も1の目が出ない確率を求めInftyProject と計算しても66.5%は得られます。

大切なのは確率に対する考え方なので、計算式はなんとなく眺めるだけで読み進めても大丈夫です。


もしみなさんが胴元でないのであれば、InftyProjectより66.5%という確率の方が役に立つはずです。

ですが、大数の法則の理屈が通用する送り手側より受け手側の確率計算の方が遥かに大変なのです。


確率計算とは大体こんな感じという話を、もう少し続けます。


誕生日のパラドックスという有名な話がありますが、これは23人居れば同じ誕生日の人が居る確率が50%程度になるという話です。

誕生日が重ならない確率はInftyProject×InftyProject×InftyProject...ですので、重なる確率は1から重ならない確率を引いた値になります。

これを順番に計算すると23人目で50%を超える事になります。

Rという言語でプラグラムを組むとこんな感じで計算できます。

#誕生日のパラドックス

#30人が居るとして、23人目に同じ誕生日になる確率が50を超える事を確かめるプログラム

tmp<-1

count<-30   #30人分を計算。最大365人まで計算可能。

for( i in 1:count){

  tmp = ((365-(i-1))/365) * tmp

  cat(sprintf("%d人の時%f\n",i,1-tmp))

}


誕生日のパラドックスの他にもモンティ・ホールという有名な確率の話があります。


3枚の扉があり、そのうちの1枚には車が、残り2枚にはヤギが入っているとします。

あなたはどれか一枚を選びます。

このとき車の入った扉を選ぶ確率はInftyProjectですね。

残りの2枚の扉は、相手のものになります。


相手の2枚の扉のどちらかにはヤギが居て、あなたが扉を選んだ後に、このヤギの扉が必ず開かれます。


車の扉は、あなたが選んだ1枚の扉か、相手の残った方の1枚の扉かの、どちらかになりました。


ここで、あなたは扉を交換してもらう事が出来ます。

さて、交換したほうが得か否か?というのがモンティ・ホール問題です。


どちらが得だとおもいますか。


答えは、交換した方が得です。


相手の2枚の扉は{車、ヤギ}{ヤギ、車}{ヤギ、ヤギ}の3通りです。

扉を開けようが開けまいがヤギが相手に渡るのは始めから判っていることです。

相手が2枚のうちからヤギの扉を1枚だけ開いても、相手に車が渡っている確率はInftyProjectのままですよね。


モンティ・ホール問題に興味がある方は検索するとすぐに出てくると思います。


この問題はアメリカのゲーム番組に端を発しています。

最もIQを有してる人物としてギネスブックに認定されてる人が、「これは交換した方が得ですよ」と雑誌にコラムを載せたのが始まりだそうで、それに対して数学者も混じって議論になった事で有名になっています。

直感的にはInftyProjectに見える確率が、実は違うんじゃない?というパラドックス的な問題として有名で、数学的に確率を解説をしているサイトも多く見受けられます。


筆者の主観ですが、この問題は無理に計算式で解くというよりそれ以前の、問題の捉え方だと思います。

モンティホールのミソは、クイズ番組では司会者になりますが、相手が答えを知っていてハズレを必ず開けるというところにあります。


扉を100枚に増やして、あなたが1枚選んだ後、相手は残りの99枚をもらうとします。

相手が98枚のヤギの扉を開いたとしましょう。


あなたの1枚の扉と、相手に残った1枚の扉。

これなら、相手の扉に車が入っている確率が遥かに高い感じがしませんか。


ところが、あなたも相手も、どちらの扉も開けずに2枚を残したままにするとします。

次に、何も知らない別の人を2人呼んできて、1枚づつ選ばせるとします。


そうすると確率はどうなるでしょう。


問題の条件を変えてしまっていますので別な問題になってしまいすが、見方を変えると随分違ってくると思いませんか。


モンティホール問題は、条件が確率を決定付けているので、条件付確率というもので解くのが模範解答となっています。

条件付確率については別の章で紹介します。




確率は0~1までの間の数字です。

0%~100%の間しかありませんし、細かく計算しても丸められる事がよくあります。

降水確率などは10%刻みですし、当たりがInftyProjectのくじでも、外れてしまうこともあります。

0.0001と0.00001の違いに意味があるのかないのか、実感し難いこともままあると思います。

それだけに、ルーズな数字がそのまま素通りしてしまっている場面も目にします。

送り手側の数字を、受け手側が自分の数字として見てしまってる事も少なくないと思います。

そこへ今度はベイズという新手も登場してきました。


そんな訳で、身近にありながら、意外と知らないことも多いであろう確率についてご紹介したいと思います。


数字を無条件に信用してもいけませんし、悪戯に理屈を振りまわしてもいけません。

模擬テストを受け合格率80%ならやはり80%と受け取るべきだと思います。

あれっ、送り手と受け手の話はどうなっちゃったの?と思われる方もいらっしゃると思いますが、何故のそうなのか、それについては次章で説明します。

また確率計算に不可欠な割り算の見直しも行います。



 次章へ

メインメニュー