Hatena::ブログ(Diary)

捨てる神あれば拾う神あり

2010-10-26

ワイブル分布

統計学入門(東京大学出版会)のワイブル分布に関する演習問題を解いていたら、分散の値に誤植があることを見つけた。ということでついでにワイブル分布の分布関数、期待値、分散の導出過程を書いておく。

分布関数

密度関数は本に従い

f(x)=¥frac{bx^{b-1}}{a^b}¥exp ¥left( -¥frac{x^b}{a^b} ¥right)¥qquad (x¥ge 0)

とする。

F(x)=P(X¥le x)

 ¥qquad =¥int_0^x¥frac{y^{b-1}}{a^{b-1}}¥,¥frac{b}{a}¥, ¥exp ¥left( -¥frac{y^b}{a^b} ¥right)dy

であり、

¥left( ¥frac{y}{a} ¥right)^b =uとおく。積分範囲は0から¥left(¥frac{x}{a}¥right)^bとなることと、¥frac{du}{dy}=b¥, ¥left(¥frac{y}{a}¥right)^{b-1}¥, ¥frac{1}{a}に気をつけると

¥int_0^x¥frac{y^{b-1}}{a^{b-1}}¥,¥frac{b}{a}¥, ¥exp ¥left( -¥frac{y^b}{a^b} ¥right)dy

=¥int_0^{¥left(¥frac{x}{a}¥right)^b}¥, ¥frac{y^{b-1}}{a^{b-1}}¥,¥frac{b}{a}¥, ¥exp(-u)¥, ¥frac{1}{b}¥,¥left(¥frac{a}{y}¥right)^{b-1}¥, a¥, du

=¥int_0^{¥left(¥frac{x}{a}¥right)^b}¥, ¥exp(-u)¥, du

=1-¥exp¥left(¥left(-¥frac{x}{a}¥right)^b¥right)

となる。

期待値

まず、ガンマ関数

¥Gamma(¥alpha)=¥int_0^¥infty x^{¥alpha -1}¥,e^{-x}¥,dx   ¥qquad (¥alpha >0)

であることに注意する。

E¥[X¥]=¥int_0^¥infty x¥, ¥frac{x^{b-1}}{a^{b-1}}¥,¥frac{b}{a}¥, ¥exp ¥left( -¥frac{x^b}{a^b} ¥right)dx

で、先程と同じように¥left( ¥frac{x}{a} ¥right)^b =u変数変換をすると、

¥int_0^¥infty x¥, ¥frac{x^{b-1}}{a^{b-1}}¥,¥frac{b}{a}¥, ¥exp ¥left( -¥frac{x^b}{a^b} ¥right)dx

=¥int_0^¥infty¥, u¥,b¥,¥exp(-u)¥,¥frac{1}{b}¥,¥left(¥frac{a}{x}¥right)^{b-1}¥,a¥,du

=a¥int_0^¥infty¥, u¥,¥exp(-u)¥,u^{-¥frac{b-1}{b}}¥, du

=a¥int_0^¥infty¥, u^{¥frac{1}{b}}¥,¥exp(-u)¥,du

=a¥Gamma ¥left(1+¥frac{1}{b}¥right)

分散

E¥[X^2¥]=¥int_0^¥infty x^2¥, ¥frac{x^{b-1}}{a^{b-1}}¥,¥frac{b}{a}¥, ¥exp ¥left( -¥frac{x^b}{a^b} ¥right)dx

=¥int_0^¥infty ¥frac{x^{b+1}}{a^{b+1}}¥, a¥, b¥, ¥exp ¥left( -¥frac{x^b}{a^b} ¥right)dx

で、先程と同じように¥left( ¥frac{x}{a} ¥right)^b =u変数変換をすると、

=¥int_0^¥infty u^{¥frac{b+1}{b}}a¥, b¥, ¥exp(-u)¥, ¥frac{1}{b}¥, u^{-¥frac{b-1}{b}}¥,a¥,du

=a^2¥, ¥int_0^¥infty u^{¥frac{2}{b}}¥, ¥exp(-u)¥, du

より、

V(X)=a^2¥, ¥left{ ¥Gamma(1+(2/b))-{¥Gamma(1+(1/b))}^2 ¥right}

補足

ワイブルの原論文のアイディアはWeibull distributionが分かりやすいです。

これは私の推測なんだけど、たぶんワイブルは初期故障や摩耗での故障がパラメータがひとつの指数分布では表現しきれないと感じたのだと思う。というか、そういうデータが出てきていて、それをなんとかしたかった。だから指数分布の分布関数パラメータの部分を違う形で書くことにして、なんとかデータとの整合性を取りたかった。そこで工学的条件を満たすような関数を見つけたのがワイブル分布として後世に残っている、と。パラメータが2つあるのは、たぶんワイブルが必要と感じたからだろう。

なんというか、先人の試行錯誤と知恵の結晶を感じますね。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/dora_the_kid/20101026/1288071060