統計的検定について

統計学には、様々な「検定」の方法があり、
例えば、t検定やf検定、カイ二乗検定なんてのがあります。
そもそも「検定」って何?と思われる方もいると思いますので、検定を端的に言いますと、

検定とは、仮説を検証するために利用するもの です。

仮説を検証をする際に、確率の計算をするのですが、
その際にt分布を検定方法で利用すれば、それをt検定と言い、
f分布を検定方法で利用すれば、f検定と言います。
要するに検定は、仮説を検証するために確率を使わなければならないので、そのためのツールと言うことになります。

次ぎに統計学で、仮説を検証する方法ですが、その方法は数学の「 背理法 」と同じアプローチを取ります。
ハイリハイリフレハイリホー大きくなれYOのハイリホウではありません・・・)
「背理法」って何だっけ?と忘れちゃった方のために
例えば、A君とB君がいます。
両者は、真逆のことを言っていおり、A君の主張の方を正しい(正確にはB君よりは否定できない)ことを証明したい場合。
まずB君の主張に着目し、「うんうん」と聞いてあげます。
全部聞き終わったあとに、B君の主張はレアケースの主張なので、「だめー」ってことにして、A君の主張を正しいとする方法です。

どうしてこんなまどろっこしい方法を取るのかと言いますと、仮説を肯定することの方が、めちゃくちゃ大変だからです。
なぜなら、ある仮説を肯定するためにバッチリ論理展開出来たとします。
しかし誰かが、その仮説に対して、たった1つの例外のケースを突きつけて、それに答えられなければアウトと言うことになってしまうからです。

画像の出典:日本テレビ ガキの使い 笑ってはいけないシリーズより

 したがって統計学では、ある仮説を証明した場合、
ある仮説の逆の意見の仮説を作り、そっちサイドの確率を算出し、こんなに低い確率になったので、これはレアケースなのでNG!と言う証明パターンをとることにしています。

次ぎに、言葉の話になりますが、
ある仮説の「証明したい方の仮説(正しいとしたい方)」を「 対立仮説  」。
ある仮説の「証明したい方の逆の仮説」を「 帰無仮説  」と言い。
基準とする確率を「 有意水準  」。
NG!だった場合を「 棄却する 」。
と言います。

他にも「棄却する」の反対は、「採択する」
「危険度」「信頼度」と言う言葉も出てきます。

「有意水準」をもう少し詳しく言いますと、帰無仮説を棄却するための上限の確率を言います。
上限の確率とは、「正規分布とその利用法」のところで書きました、「95%信頼区間」、「99%信頼区間」の考え方を使います。
「有意水準」を5%とした場合、帰無仮説の確率が、「95%信頼区間」外の確率になった場合、この帰無仮説は、こんなに低い確率なので、棄却(NG)する。となります。

また「有意水準」を5%とした場合の「5%を危険度」、「95%を信頼度」と言います。

したがって、統計学で、仮説を検証するためには、帰無仮説の確率が計算できることが条件となります。

この統計的仮説で、一番ややっこしいところは、証明したいほうの仮説を「対立仮説」と呼ぶところです。
逆じゃない?と思われるかもしれませんが、何度も書いている通り、統計の仮説検証の方法は帰無仮説を否定することをベースに考えられているので、アメトーークの  じゃない方芸人 ではないですが、帰無仮説(ベース)じゃない方なので、そう呼ばれてしまうのです。

またこの仮説の証明では、「肯定はしていない」と言う部分も留意してください。
あくまでも「否定できない」とすっごくグレーな表現なのです。
まぁ推測統計自体、あくまでも推測の域までなので、仕方がないんですけどね…

本日のまとめ
・仮説を検証するためには、帰無仮説の確率が計算できることが条件
・帰無仮説の有意水準を設定し、帰無仮説を棄却することで、対立仮説が採択される。

コメント

タイトルとURLをコピーしました