統計学における推定とは、「未知の母集団の性質(平均・分散など)を標本の性質に基づいて推測すること」を指します。
もし今、未知の母集団の母平均が µ、未知の母分散が σ²だとしたとき、このµ や σ² の値を推測しようとするのが「推定」です。
例えば、あるネジの平均的な重量を調べるために、サンプルを100 個選んで調べた結果に基づいて推測するとします。
このとき、過去から未来へと次々と作り出される全ての製品が母集団となり、その平均が µ となります。n = 100の標本から標本平均と標本分散を算出することができますが、これら値は、与えられた標本の特徴をまとめたものに過ぎず、母集団の真の平均を示すものではありません。
この標本の大きさや性質、標本が母集団から抽出された条件、母集団の分布についての情報などを用いて、標本平均 X を元に、母平均の値を推測していくのが「推定」です。
統計的推定は大きく「点推定」と「区間推定」の2つに分けることができます。
点推定・・・点推定とは、母数を1個の数値で定めようとする方法で、推定量に実際の観測値を入れて計算します。
区間推定・・・真の母平均 µ を推定するにあたり、1つの数値で定めるのではなく母平均 µが入りそうな区間を推定する方法が、 区間推定です。たくさんの標本をとったとき、その母数(母平均)が 95 %の確率で入る推定された区間を、95 %信頼区間 (confidence interval) と言います。つまり区間推定とは、この信頼区間の下限と上限の値を求めることだと言えます。
不偏性・・・何回も同じ母集団からの異なる標本を用いて推定を繰り返したときに平均的に偏りなく推定しているとき、すなわち、推定量の期待値が母数に一致するとき、推定量は不偏性を持つと言います。
一致性 ・・・観測個数が大きくなるにつれて母数のまわりに集中していく性質を一致性といいます。 X が母数 µ から c 以上外れる 確率 P(|X −µ|≥ c) は、観測個数が無限大に増えれば 0 に収束するので、X は µ の一致推定量であると言えます。
効率性・・・推定値が母数からブレることが少ない性質。推定値のぶれは、大抵分散で評価されます。標本平均 X は不偏推定量の中で最も分散が少ないことが知られ、最小分散不偏推定量と呼ばれます。
安定性・・・なにかの手違いやエラーで標本の中に異常値などが含まれてしまっても、それに大きく影響されることなく母数に近い値を推定する性質。メディアンや四分位範囲などは、平均や分散などに比べ、安定性が高いと言えます。
次は実際に平均の区間推定をやっていきたいと思います。
ちなみに、統計学についてしっかり勉強するのであれば、↓の本が分かりやすく説明していてオススメです!
コメント