« 2009年03月 | メイン | 2009年06月 »
2009年04月21日
データ分布は正規分布にしたがっているか

データ分布が正規分布に従っているかどうかは、グラフ(例えば度数分布表)により確認するのが基本ですが、歪度(わいど)と尖度(せんど)を一定の指標として、検討することができます。
歪度・尖度ともに0に近いときには、そのデータは正規分布に従っている可能性が高くなります(正規分布は歪度・尖度ともに0ですが、歪度・尖度0だからといって、必ずしも正規分布に従っているわけではないので、必ず、グラフで確認して下さい)。
歪度
歪度と分布の形状には以下の関係があります。
歪度>0のとき 山が左より
歪度<0のとき 山が右より
例えば、 歪度<0であると、分布は下のグラフのようになります。
歪度は次の式で求めます。
個別データを X1,X2,…,XN とし、これらの平均をμ、標準偏差をσとするとき、
γ1=Σ(Xi-μ)~3/(Nσ~3)
※ Σはiについて1からNまで合計する意味。
尖度
尖度は山のとがり具合を表す指標ですが、外れ値の検出に利用されます。外れ値があると大きな値を示します。5以上で要注意、10以上になると確実に外れ値があることが、経験的に知られています。
尖度は次の式で求めます。
個別データを X1,X2,…,XN とし、これらの平均をμ、標準偏差をσとするとき、
γ2=Σ(Xi-μ)~4/(Nσ~4)-3
※ Σはiについて1からNまで合計する意味。
ブログランキングに参加しています。
この記事はお役に立ちましたでしょうか?
をクリックして下さるとランクアップ!
いつも応援ありがとうございます。
投稿者: 松波 竜太 [2009 04 21 50] の記事へ
