すぐに実践できる検定

実社会でスグに役立つ統計手法に「検定」というものがあります。
間単に言うと各グループの間で差があるか否かを調べるものです。
例えば、ある新薬をAのグループに与えて、与えないBのグループと比較して効果が認められるか、 効果の有無を判定するのは責任も重く難しいものですが、 このような場合に、客観的で普遍性のある判断方法として「検定」が活躍します。
検定の手法にもいろいろあり、調べる対象によって変わってきます。
臨床試験などの場合は実験計画法と言われる少し難しいやり方をしますし、 「店舗の改装の前後で、お客様の平均滞在時間に変化があったと言えるか」のような場合は、 表計算にもあるt検定などの手法が使えます。
システムのリニューアルやキャンペーンの効果測定にも応用できます。

検定のやり方

当たり前ですが、検定は先ずデータが必要になります。
例えば店舗の改装前後で、お客様の平均滞在時間に変化があったことを調べるには、 改装前後で、出来るだけ同じ条件のデータが必要になります。
改装前が4月~6月のデータで、改装後が7月~9月では、季節的な要因で分かれてしまいます。
このような偏りはバイアスと呼ばれています。 データ収集に手間を掛けられ無い時ほど、こうしたバイアスが掛かり易くなるので、 どんな偏り要因がどの程度入り込んでいるか把握しておきましょう。

デーがあれば、どんな分析手法に掛けるか選択します。
データが、曜日やアンケートの回答時に選択してもらう番号のようなコード型の質的なものか、 滞在時間のように量的なものか、もしくは混在しているかで先ず分かれます。
量的なデータの場合、さらに正規分布しているか否で選べる手法が絞られてきます。
滞在時間の場合は、量的データでかつ正規分布すると思われますのでt検定が選択できます。

検定結果の見方 p値

あとは分析ソフトに掛けるだけで、あっという間に検定が出来てしまいます。
分析結果は、平均やp値、統計量tなど沢山出てくると思いますが、 すぐに出来る検定としては、p値だけを見て下さい。
p値が0.05より小さければ、「2つのグループの平均には差がある」と言えます。 統計的な言い方としては、「0.05%の有意水準で2つのグループの平均が同じとは言えない」というような 表現になります。統計は確率的に推測するものなので決定するような表現を避けてします。

p値というのは、帰無仮説をOKとした時に、間違える確率のようなものです。
ここでp値が0.05であった場合、「2つのグループの平均には差がある」と言ってしまうと、 100回のうち5回は間違いになるというような意味です。

検定結果の見方 帰無仮説

帰無仮説ですが、必ず「○○と△△はイコールである」として立てられます。
t検定の場合は、平均の差を検定するものなので、「2つのグループの平均は同じ」が 帰無仮説になります。

その他 検定の注意点

データ数が少な過ぎると、差があるように見えても差がないとの判定を受けたりします。
また、t検定は正規分布している事が条件になります。 正規分布していない場合は、マンホイットニーなどの分析手法を適宜選んで下さい。

メインメニュー