正規分布とt分布
t分布と正規分布の違い
母平均の推定・検定でどのように使い分けるか
データの平均値を推定したり検定したりするときには、正規分布を用いた方法と、t分布を用いた方法があります。
問題の状況によって、正規分布を使うか、t分布を使うか、が決まります
t分布と正規分布を使い分ける基準
t分布と正規分布を使い分ける基準は、母分散がわかっているかどうかで判断します。
母分散がわかっているときは正規分布を使用し、母分散がわかっていないときはt分布を使用します。
次節以降で、その理由と具体的な例を解説します。
t分布と正規分布を使い分ける理由
さきほどは、母分散が既知か未知かで使い分けることを説明しました。
実は、母分散が既知の場合でもt分布を使用することができます。
つまり、以下の表のように、t分布は母分散の既知・未知にかかわらず使うことができるのです。
母分散 | 正規分布を使った推定・検定 | t分布を使った推定・検定 |
---|---|---|
既知 | 〇 | 〇 |
未知 | × | 〇 |
では、なぜ母分散が既知のときには正規分布を使うかというと、正規分布を使った方が推定・検定の精度がよいからです。
正規分布はt分布よりも尖った形状をしているので、同じ区間の幅が小さくなります。(下図)
よって、母分散が既知のときには、推測の精度を上げるために正規分布を使う方がよいです。
母分散が既知のときの比較の例
母分散が既知のとき、正規分布を使った場合と、t分布を使った場合とで、推定結果にどのような違いがあるのかを例題で確認してみましょう。
母分散がわかっていますので、正規分布を用いても、t分布を用いても解くことができます。
比較のために、両方で計算してみましょう。
正規分布の場合
6 個のデータの平均値は 20.5 ですので、母平均の 95% 信頼区間は、
母分散が 1.9 なので、σ=1.9−−−√ を代入して計算すると、
となります。
t分布の場合
6 個のデータの平均値は 20.5、不偏分散は 1.9 なので、95%信頼区間は、
不偏分散の値 s=1.9−−−√ を代入して
結果を見比べてみましょう。
母平均の 95%信頼区間は、
- 正規分布
[19.4,21.6] - t分布
[19.1,21.9]
正規分布の方が信頼区間の幅が小さく、推定には都合のよいことが分かります。
このように、母分散がわかっているときは正規分布を使うようにします
まとめ
結論としては、
- 母分散がわかっている(母分散既知)
正規分布を使う - 母分散がわかっていない(母分散未知)
t分布を使う
2024年8月30日 | カテゴリー:基礎知識/物理学、統計学、有機化学、数学、英語 |