« 2009年03月 | メイン | 2009年06月 »

2009年04月21日

データ分布は正規分布にしたがっているか

seikibunpu.jpg

データ分布が正規分布に従っているかどうかは、グラフ(例えば度数分布表)により確認するのが基本ですが、歪度(わいど)と尖度(せんど)を一定の指標として、検討することができます。

歪度・尖度ともに0に近いときには、そのデータは正規分布に従っている可能性が高くなります(正規分布は歪度・尖度ともに0ですが、歪度・尖度0だからといって、必ずしも正規分布に従っているわけではないので、必ず、グラフで確認して下さい)。

 

歪度

歪度と分布の形状には以下の関係があります。

歪度>0のとき 山が左より
歪度<0のとき 山が右より

例えば、 歪度<0であると、分布は下のグラフのようになります。
sendo0ika.jpg
歪度は次の式で求めます。

個別データを X1,X2,…,XN とし、これらの平均をμ、標準偏差をσとするとき、
γ1=Σ(Xi-μ)~3/(Nσ~3)
 ※ Σはiについて1からNまで合計する意味。

 

尖度

尖度は山のとがり具合を表す指標ですが、外れ値の検出に利用されます。外れ値があると大きな値を示します。5以上で要注意、10以上になると確実に外れ値があることが、経験的に知られています。

尖度は次の式で求めます。

個別データを X1,X2,…,XN とし、これらの平均をμ、標準偏差をσとするとき、
γ2=Σ(Xi-μ)~4/(Nσ~4)-3
 ※ Σはiについて1からNまで合計する意味。

続きを読む "データ分布は正規分布にしたがっているか"

 

 

arrow_tenmetsu_d_r.gifをクリックするとtwitterでこの記事をつぶやくことができます!
Twitterに投稿♪

ブログランキングに参加しています。
この記事はお役に立ちましたでしょうか?
arrow_tenmetsu_d_r.gifをクリックして下さるとランクアップ!
いつも応援ありがとうございます。

banner_13.gif

投稿者: 松波 竜太

2009年04月の記事一覧