フィッシャー情報量 – Wikipedia

フィッシャー情報量(フィッシャーじょうほうりょう、英: Fisher information

IX(θ){displaystyle {mathcal {I}}_{X}(theta )}

は、統計学や情報理論で登場する量で、確率変数

X{displaystyle X}

が母数

θ{displaystyle theta }

に関して持つ「情報」の量を表す。統計学者のロナルド・フィッシャーに因んで名付けられた。

θ{displaystyle theta }

を母数とし、

X{displaystyle X}

を確率密度関数が

f(x|θ){displaystyle f(x|theta )}

で表される確率変数とする。
このとき、

θ{displaystyle theta }

尤度関数

L(θ|x){displaystyle L(theta |x)}

で定義され、スコア関数は対数尤度関数の微分

により定義される。このとき、フィッシャー情報量

IX(θ){displaystyle {mathcal {I}}_{X}(theta )}

はスコア関数の2次のモーメント

により定義される。紛れがなければ添え字の

X{displaystyle X}

を省略し、

I(θ){displaystyle {mathcal {I}}(theta )}

とも表記する。なお、

X{displaystyle X}

に関しては期待値が取られている為、フィッシャー情報量は

X{displaystyle X}

の従う確率密度関数

f(x|θ){displaystyle f(x|theta )}

のみに依存して決まる。よって

X{displaystyle X}

Y{displaystyle Y}

が同じ確率密度関数を持てば、それらのフィッシャー情報量は同一である。

スコア関数は

を満たす事が知られているので、

が成立する。ここで

var{displaystyle mathrm {var} }

は分散を表す。

また

lnf(x|θ){displaystyle ln f(x|theta )}

が二回微分可能で以下の標準化条件

を満たすなら、フィッシャー情報量は以下のように書き換えることができる。

このとき、フィッシャー情報量は、

f{displaystyle f}

の対数の

θ{displaystyle theta }

についての2次の導関数にマイナスを付けたものになる。フィッシャー情報量は、

θ{displaystyle theta }

についての最尤推定量付近のサポート曲線の「鋭さ」としてもとらえることができる。例えば、「鈍い」(つまり、浅い最大値を持つ)サポート曲線は、2次の導関数として小さな値を持つため、フィッシャー情報量としても小さな値を持つことになるし、鋭いサポート曲線は、2次導関数として大きな値を持つため、フィッシャー情報量も大きな値になる。

フィッシャー情報行列[編集]

パラメータがN個の場合、つまり、

θ{displaystyle mathbf {theta } }

N次のベクトル

θ=(θ1,θ2,,θN)T{displaystyle theta =(theta _{1},theta _{2},cdots ,theta _{N})^{T}}

であるとき、フィッシャー情報量は、以下で定義されるNxN 行列に拡張される。

これを、フィッシャー情報行列(FIM, Fisher information matrix)と呼ぶ。成分表示すれば、以下のようになる。

フィッシャー情報行列は、NxN の正定値対称行列であり、その成分は、N次のパラメータ空間からなるフィッシャー情報距離を定義する。

p{displaystyle p}

個のパラメータによる尤度があるとき、フィッシャー情報行列のi番目の行と、j番目の列の要素がゼロであるなら、2つのパラメータ、

θi{displaystyle theta _{i}}

θj{displaystyle theta _{j}}

は直交である。パラメータが直交であるとき、最尤推定量が独立になり、別々に計算することができるため、扱いやすくなる。このため、研究者が何らかの研究上の問題を扱うとき、その問題に関わる確率密度が直交になるようにパラメーター化する方法を探すのに一定の時間を費やすのが普通である。

基本的性質[編集]

フィッシャー情報量は

を満たす。

また

X{displaystyle X}

Y{displaystyle Y}

が独立な確率変数であれば、

が成立する。すなわち、「

(X,Y){displaystyle (X,Y)}

θ{displaystyle theta }

に関して持つ情報の量」は

X{displaystyle X}

θ{displaystyle theta }

に関して持つ情報の量」と

Y{displaystyle Y}

θ{displaystyle theta }

に関して持つ情報の量」の和である。

よって特に、無作為に取られたn個の標本が持つフィッシャー情報量は、1つの標本が持つフィッシャー情報量のn倍である(観察が独立である場合)。

Cramér–Raoの不等式[編集]

θ{displaystyle theta }

の任意の不偏推定量

θ^{displaystyle {hat {theta }}}

は以下のCramér–Rao(クラメール-ラオ)の不等式を満たす:

この不等式の直観的意味を説明する為、両辺の逆数を取った上で確率変数

X{displaystyle X}

への依存関係を明示すると、

となる。一般に推定量はその分散が小さいほど(よって分散の逆数が大きいほど)母数

θ{displaystyle theta }

に近い値を出しやすいので、「よい」推定量であると言える。

θ{displaystyle theta }

を「推定する」という行為は、「よい」推定量

θ^(X){displaystyle {hat {theta }}(X)}

を使って

θ{displaystyle theta }

を可能な限り復元する行為に他ならないが、上の不等式は

X{displaystyle X}

から算出されたどんな不偏推定量であっても

X{displaystyle X}

が元々持っている「情報」以上に「よい」推定量にはなりえない事を意味する。

十分統計量との関係[編集]

一般に

T=t(X){displaystyle T=t(X)}

が統計量であるならば、

が成立する。すなわち、「

X{displaystyle X}

から計算される値

T=t(X){displaystyle T=t(X)}

が持っている

θ{displaystyle theta }

の情報」は「

X{displaystyle X}

自身が持っている

θ{displaystyle theta }

の情報」よりも大きくない。

上式で等号成立する必要十分条件は

T{displaystyle T}

が十分統計量であること。
これは

T(X){displaystyle T(X)}

θ{displaystyle theta }

に対して十分統計量であるならば、ある関数

f{displaystyle f}

および

g{displaystyle g}

が存在して

が成り立つ(ネイマン分解基準)事を使って証明できる。

カルバック・ライブラー情報量との関係[編集]

Xθ{displaystyle X_{theta }}

を母数

θ=(θ1,,θn){displaystyle {vec {theta }}=(theta _{1},ldots ,theta _{n})}

を持つ確率変数とすると、カルバック・ライブラー情報量

DKL{displaystyle D_{mathrm {KL} }}

とフィッシャー情報行列は以下の関係が成り立つ。

すなわちフィッシャー情報行列はカルバック・ライブラー情報量をテイラー展開したときの2次の項として登場する。(0次、1次の項は0)。

ベルヌーイ分布[編集]

ベルヌーイ分布は、確率θ でもたらされる「成功」と、それ以外の場合に起きる「失敗」という2つの結果をもたらす確率変数が従う分布である(ベルヌーイ試行)。例えば、表が出る確率がθ、裏が出る確率が1 – θであるような、コインの投げ上げを考えれば良い。

n回の独立なベルヌーイ試行が含むフィッシャー情報量は、以下のようにして求められる。なお、以下の式中で、A は成功の回数、B は失敗の回数、n =A +B は試行の合計回数を示している。対数尤度関数の2階導関数は、

であるから、

となる。但し、Aの期待値はn θB の期待値はn (1-θ )であることを用いた 。

つまり、最終的な結果は、

である。これは、n回のベルヌーイ試行の成功数の平均の分散の逆数に等しい。

ガンマ分布[編集]

形状パラメータα、尺度パラメータβのガンマ分布において、フィッシャー情報行列は

で与えられる。但し、ψ(α)はディガンマ関数を表す。

正規分布[編集]

平均μ、分散σ2の正規分布N(μ, σ2)において、フィッシャー情報行列は

で与えられる。

多変量正規分布[編集]

N個の変数の多変量正規分布についてのフィッシャー情報行列は、特別な形式を持つ。

であるとし、

Σ(θ){displaystyle Sigma (theta )}

μ(θ){displaystyle mu (theta )}

の共分散行列であるとするなら、

X{displaystyle X}

N(μ(θ),Σ(θ)){displaystyle N(mu (theta ),Sigma (theta ))}

のフィッシャー情報行列、

Im,n(0;m,n<N){displaystyle {mathcal {I}}_{m,n},(0leq ;m,n

の成分は以下の式で与えられる。

ここで、

(..){displaystyle (..)^{top }}

はベクトルの転置を示す記号であり、

tr(..){displaystyle mathrm {tr} (..)}

は、平方行列のトレースを表す記号である。また、微分は以下のように定義される。

関連項目[編集]