「二項分布・ポアソン分布・正規分布」において、
高次のモーメントを直接確率密度関数から導出するのは、
煩雑になるので、モーメント母関数を利用した方がよい、と述べた。
ここでは、最初に、モーメント(積率)やモーメント母関数(積率母関数)の
定義について述べるが、テキストによって表記が異なるので、
まずは、オリジナルの記号を用いて、これらを再定義することにする。
そして、モーメント母関数を用いても、高次のモーメントを
導出するのが煩雑な場合に、数式処理ソフト「Maxima」を利用して、
これらを計算する為のコマンドラインを載せてみた。
また、モーメント母関数(積率母関数)は、連続型の分布においては、
ある意味において、一種のラプラス変換である、とみなせる。
一方、モーメント母関数(積率母関数)M(θ)の定義式で、
虚数単位iを用いて、変数θをiξに形式的に置き換えた、
特性関数M(ξ)は、連続な確率密度関数f(x)のフーリエ変換になっている。
そして、キュムラント母関数には、モーメント母関数(積率母関数)M(θ)の
対数として定義される場合と、特性関数M(ξ)の対数として定義される場合
の二通りの定義が存在することについても述べる。
そもそも、期待値とは何か、というところから始めることにする。
ある任意の関数φ(x)の「期待値」とは、
その独立変数xの分布が、確率密度関数f(x)に従うとき、
で定義されるものであるとする。上は離散的な分布の場合、
下は連続的な分布の場合である。ここで、記号Eは、
期待値(expectation value)の頭文字に由来しているが、
テキストにより、鍵括弧の場合と丸括弧の場合があるようだ。
ここでは、鍵括弧の方が見やすいと思うので、こちらを利用する。
また、離散分布の場合は、確率密度関数f(x)は、
単に確率(probability)と呼び、p(x)と表記している文献もある。
次に、本題である、「モーメント(積率)」とは何か。
実は、これには主に「原点周りのモーメント」と「平均値周りのモーメント」の
二通りの場合があり、混乱を招く可能性がある。
先に、前者の「原点周りのモーメント」の方から説明することにする。
先程の期待値の定義において、任意の関数φ(x)が、
冪乗の関数:xnであるとき、その期待値は、
E[xn]と表記できる筈であるが、
これを「原点周りのn次のモーメント(積率)」と呼ぶ。
ここでは、本サイト独自の記号Enを用いて、
と定義する。先程と同様、上は離散的な分布の場合、
下は連続的な分布の場合である。ここで、E0は全確率の総和なので、
勿論 1 であり、E1は相加平均値のことに他ならない。
だが、平均値に関しては、文献によって、
等と様々な表記がある。ギリシア文字の「μ」は、
平均値(mean)の頭文字である、ローマ字の「m」に対応しているので、
そのことに因んでいるようだ。離散的な分布の平均値は、
変数の上にバーを付けて表し、連続的な分布の平均値は、
山括弧で変数を括る形で区別しているテキストもあるようだが、
ここでは、E1に統一することにしたい。
続いて、後者の「平均値周りのモーメント」について説明する。
一般的なテキストでは、単にn次のモーメントといった場合、
暗にこちらを指すことが多く、mn等と表記するが、
ここでは、本サイト独自の記号Vnを用いる(理由は後述)。
前述の通り、平均値はE1(これも本サイト独自の記号)
であるので、これを用いて、
と定義する。これまでと同様、
上は離散的な分布の場合、下は連続的な分布の場合である。
ここで、V0は、確率密度関数f(x)に
係る係数が 1 となる為、結局E0と同じであり、
V1は、偏差、或いは、残差の総和に相当するので、0である。
V2は、分散であるが、これも文献によって、
等の様々な表記がある。ローマ字の「s」とギリシア文字の「σ」は、
対応関係にある。これらはどちらも、
標準偏差(standard deviation) の頭文字に因んでおり、
分散が、標準偏差の2乗であることを意味している。また、記号Vを用いたのは、
分散(variance)の頭文字に由来しているからである。
平均値周りの3次のモーメントm3を
標準偏差の3乗σ3で割ったものは、
歪度(skewness)と呼ばれ、分布の左右対称性の目安としてよく使われる。
即ち、歪度:a3は、
と、本サイト独自の記号を用いて表せる。σ3で割る理由は、
分子もσ3のオーダーなので、こうすれば単位によらない
無次元の値になるからである。
また、平均値周りの4次のモーメントm4と
2次のモーメントm2の2乗との比を尖度(kurtosis)という。
即ち、尖度:a4もまた、
と、本サイト独自の記号を用いて表せる。
モーメント母関数(積率母関数)は、
で定義される。上は離散的な分布の場合、下は連続的な分布の場合である。
E[eθx]とは、eθxの
期待値という意味である。また、連続型の分布においては、
ある意味において、一種のラプラス変換である、とみなせる。
実際、通常の片側ラプラス変換の積分範囲は、半開区間[0,∞)で、
指数部の符号はマイナスだが、連続な確率密度関数をf(x)に対して、
M(-θ)とすれば、これは、f(x)の
「両側ラプラス変換」である。
このモーメント母関数を原点の周りでテイラー展開(マクローリン展開)すると、
となって、θに関する展開の係数として、
次々に原点周りのn次のモーメント:Enを
生み出す(generate)ので、母関数(generating function)と呼ばれるのである。
即ち、このM(θ)をθでn回微分して、
θ=0を代入することで、機械的に、原点周りのモーメント:
が得られることを意味している。
平均値周りのモーメントは、それらを用いて、
V2=E2
-2E1・E1
+E12・E0
V3=E3
-3E1・E2
+3E12・E1
-E13・E0
V4=E4
-4E1・E3
+6E12・E2
-4E13・E1
+E14・E0
と計算すればよい。
二項分布(ベルヌーイ分布)の確率密度関数をf(x)は、
f(x) ≡ nCx
px(1-p)n-x
=nCx px qn-x
であったが、変数の種類が増えると煩雑になるので、pだけで式変形し、
qは、最後まで温存しておき、必要に応じて代入する方が望ましいだろう。
一応注意しておくと、このnは試行回数であって、モーメントの次数ではない。
紛らわしい場合は、どちらかの変数の文字を適宜変更した方がよいだろう。
モーメント母関数の定義と二項定理により、二項定理のモーメント母関数:
を得る。総和は、
E0=M(0)
=(pe0+q)n
=(p+q)n=1n=1
であり、平均は、
であり、二乗の平均は、
であるから、これらを代入して、分散:
V2=E2
-2E1・E1
+E12・E0
=E2-E12
=n(n-1)p2+np
-n2p2
=-np2+np
=np(1-p)=npq
を得る。
モーメント母関数を用いても、二項分布(ベルヌーイ分布)の
3次以上のモーメントを導出するのは、煩雑である。
そこで、数式処理ソフト「Maxima」を利用して、
これらを計算する為のコマンドラインを以下に示す。
ここでは、θの代わりにtを用いた。
binomial : taylor((p*exp(t)+(1-p))^n,t,0,4); E0 : coeff(binomial, t, 0)*0!; E1 : coeff(binomial, t, 1)*1!; E2 : coeff(binomial, t, 2)*2!; E3 : coeff(binomial, t, 3)*3!; E4 : coeff(binomial, t, 4)*4!; V2 : E2-2*E1*E1+E1^2*E0; V3 : E3-3*E1*E2+3*E1^2*E1-E1^3*E0; V4 : E4-4*E1*E3+6*E1^2*E2-4*E1^3*E1+E1^4*E0; SKEW : V3/(sqrt(V2)^3); KURT : V4/V2^2; |
二項分布 | 原点周り | 平均値周り |
---|---|---|
0次のモーメント | 1 | 1 |
1次のモーメント | np | 0 |
2次のモーメント | n(n-1)p2+np | np(1-p) |
3次のモーメント | n(n-1)(n-2)p3 +3n(n-1)p2+np |
np(1-p)(1-2p) |
4次のモーメント | n(n-1)(n-2)(n-3)p4 +6n(n-1)(n-2)p3 +7n(n-1)p2+np |
np(1-p){1+3(n-2)p(1-p)} |
ポアソン分布の確率密度関数をf(x)は、
であったので、これをモーメント母関数の定義式に代入すると、
指数関数のマクローリン展開より、
を得る。総和は、
E0=M(0)
=e-λ・eλ=1
であり、平均は、
であり、二乗の平均は、
であるから、これらを代入して、分散:
V2=E2
-2E1・E1
+E12・E0
=E2-E12
=λ2+λ-λ2=λ
を得る。
モーメント母関数を用いても、ポアソン分布の
3次以上のモーメントを導出するのは、煩雑である。
そこで、数式処理ソフト「Maxima」を利用して、
これらを計算する為のコマンドラインを以下に示す。
ここでは、θの代わりにt、λの代わりにuを用いた。
poisson : taylor(exp(-u)*exp(u*exp(t)),t,0,4); E0 : coeff(poisson, t, 0)*0!; E1 : coeff(poisson, t, 1)*1!; E2 : coeff(poisson, t, 2)*2!; E3 : coeff(poisson, t, 3)*3!; E4 : coeff(poisson, t, 4)*4!; V2 : E2-2*E1*E1+E1^2*E0; V3 : E3-3*E1*E2+3*E1^2*E1-E1^3*E0; V4 : E4-4*E1*E3+6*E1^2*E2-4*E1^3*E1+E1^4*E0; SKEW : V3/(sqrt(V2)^3); KURT : V4/V2^2; |
ポアソン分布 | 原点周り | 平均値周り |
---|---|---|
0次のモーメント | 1 | 1 |
1次のモーメント | λ | 0 |
2次のモーメント | λ2+λ | λ |
3次のモーメント | λ3+3λ2+λ | λ |
4次のモーメント | λ4+6λ3+7λ2+λ | 3λ2+λ |
正規分布(ガウス分布)の確率密度関数は、
であったので、これをモーメント母関数の定義式に代入すると、
を得る。指数部分を式変形して平方完成し、
xに依らない部分を分離すると、
となる。ここで、
と置くと、ガウス積分の公式より、
を得る。総和は、
E0=M(0)
=e0+0=1
であり、平均は、
であり、二乗の平均は、
であるから、これらを代入して、分散:
V2=E2
-2E1・E1
+E12・E0
=E2-E12
=(σ2+μ2)
-μ2=σ2
を得る。
モーメント母関数を用いても、正規分布(ガウス分布)の
3次以上のモーメントを導出するのは、煩雑である。
そこで、数式処理ソフト「Maxima」を利用して、
これらを計算する為のコマンドラインを以下に示す。
ここでは、θの代わりにt、μの代わりにm、
σの代わりにsを用いた。
normal : taylor((exp(m*t+(s^2)*(t^2)/2)),t,0,4); E0 : coeff(normal, t, 0)*0!; E1 : coeff(normal, t, 1)*1!; E2 : coeff(normal, t, 2)*2!; E3 : coeff(normal, t, 3)*3!; E4 : coeff(normal, t, 4)*4!; V2 : E2-2*E1*E1+E1^2*E0; V3 : E3-3*E1*E2+3*E1^2*E1-E1^3*E0; V4 : E4-4*E1*E3+6*E1^2*E2-4*E1^3*E1+E1^4*E0; SKEW : V3/(sqrt(V2)^3); KURT : V4/V2^2; |
正規分布 | 原点周り | 平均値周り |
---|---|---|
0次のモーメント | 1 | 1 |
1次のモーメント | μ | 0 |
2次のモーメント | μ2+σ2 | σ2 |
3次のモーメント | μ3+3σ2μ | 0 |
4次のモーメント | μ4 +6σ2μ2+3σ4 | 3σ4 |
標準正規分布:
のモーメント母関数もまた、
正規分布のモーメント母関数において、
平均値μ=0、分散σ2=1とすることで、
M(θ)=eθ2/2
が得られる。
「特性関数(characteristic function)」とは、モーメント母関数(積率母関数)M(θ)の定義式で、
虚数単位iを用いて、変数θをiξに形式的に置き換えたもの:
である。即ち、特性関数M(ξ)は、連続な確率密度関数f(x)の
「フーリエ変換」になっている。
この特性関数も原点の周りでテイラー展開(マクローリン展開)すると、
となって、ξに関する展開の係数として、
次々に原点周りのn次のモーメント:Enを生み出す。
即ち、このM(ξ)をξでn回微分して、ξ=0を代入しても、
機械的に、原点周りのモーメントが得られる。
二項分布(ベルヌーイ分布)、ポアソン分布、正規分布(ガウス分布)の
各分布のモーメント母関数(積率母関数)において、それぞれ、
変数θをiξに形式的に置き換えることによって、
二項分布(ベルヌーイ分布)の特性関数:
M(ξ)=
(peiξ+q)n
ポアソン分布の特性関数:
M(ξ)=
eλ(eiξ-1)
正規分布(ガウス分布)の特性関数:
が得られる。
「キュムラント母関数(cumulant generating function)」には、モーメント母関数(積率母関数)M(θ)の
対数として定義される場合(こちらを以降「定義1」と呼ぶ)K(θ):
と、特性関数M(ξ)の対数として定義される場合(こちらを以降「定義2」と呼ぶ)K(ξ):
の二通りの定義が存在する。Wikipediaによると、「定義2」のキュムラント母関数は、
「第2キュムラント母関数(second characteristic function)」と呼ばれることもあるようだ。
このキュムラント母関数を原点の周りでテイラー展開(マクローリン展開)したとき、
展開の係数κnをn次のキュムラント(cumulant)という。
記号expは、指数関数(exponential)のことで、eの肩が長いときによく用いられる。
特に、ポアソン分布や正規分布(ガウス分布)の様に、
モーメント母関数(積率母関数)M(θ)や
特性関数M(ξ)が、指数関数の形で表されるとき、
キュムラントとキュムラント母関数を考えると良いことがある(後述)。
ポアソン分布のキュムラント母関数(定義1):
或いは、ポアソン分布のキュムラント母関数(定義2):
より、
κn=λ (n=1, 2, 3, …)
となって、「ポアソン分布では、全てのキュムラントがλに等しい」ことが分かる。
また、正規分布(ガウス分布)のキュムラント母関数(定義1):
:
或いは、正規分布(ガウス分布)のキュムラント母関数(定義2):
より、
κ1=μ,
κ2=σ2,
κn=0 (n ≥ 3)
となって、「正規分布(ガウス分布)は、
3次以上のキュムラントが0となる分布である」ということが分かる。
|