カプラン=マイヤー推定量 – Wikipedia

患者の生存に関連する2つの条件についてのカプラン=マイヤープロットの一例。

カプラン=マイヤー推定量(英: Kaplan-Meier estimator)は[1][2]積極限推定量(英: product limit estimator)とも呼ばれ、生存データから生存関数を推定するために用いられるノンパラメトリック統計量である。医学研究では、治療後に一定期間生存している患者の割合を測定するためによく使われる。他の分野では、カプラン=マイヤー推定量を用いて、失業後に人々が失業している期間の長さや[3]、機械部品の故障までの時間や、果実食動物英語版に食べられてしまうまでの肉果の残存期間を測定することができる。この推定量は、Edward L. KaplanPaul Meierが米国統計学会誌(Journal of the American Statistical Association)に別々に原稿を提出したことにちなんで命名された[4]。ジャーナル編集者のJohn Tukeyは、彼らの研究を1つの論文にまとめるよう説得した。この論文は1958年に発表されて以来、約61,000回も引用されている[5][6]

その生存関数

S(t){displaystyle S(t)}

(寿命が

t{displaystyle t}

より長くなる確率)の推定量は次の式で与えられる。

ここに、

ti{displaystyle t_{i}}

は少なくとも1つのイベントが発生した時刻、

di{displaystyle d_{i}}

は時刻

ti{displaystyle t_{i}}

発生したイベントの数(たとえば、死亡)、そして

ni{displaystyle n_{i}}

は時刻

ti{displaystyle t_{i}}

まで生存していることが分かっている(まだイベントが発生していないか、打ち切られていない)個体の数である。

基本的な考え方[編集]

カプラン=マイヤー推定量のプロットは、一連の減少する水平ステップの系列であり、十分に大きな標本サイズの時に、その母集団の真の生存関数に近づく。連続する別個のサンプリングされた観測値(カチッと音がする)間の生存関数の値は一定であると仮定される。

カプラン=マイヤー曲線の重要な利点は、この手法がいくつかのタイプの打ち切りデータ、特に患者が研究から離脱した場合、またはフォローアップに失敗した場合、またはイベントなしで生存している場合に発生する「右側打ち切り」(right-censoring)を考慮に入れることができることである。プロット上では、小さな縦の目盛りが、生存時間が右側打ち切りされた個々の患者を示している。切り捨てや打ち切りが行われない場合、カプラン=マイヤー曲線は、経験分布関数英語版の補集合である。

医学統計学英語版では、一般的な応用例として、たとえば遺伝子Aプロファイルを持つ患者と遺伝子Bプロファイルを持つ患者のように、患者をカテゴリーに分類することがある。このグラフでは、遺伝子Bを持つ患者は、遺伝子Aを持つ患者よりも早く死亡する。2年後の生存率は、遺伝子Aの患者では約80%だが、遺伝子Bの患者では半分未満である。

カプラン=マイヤー推定量を作成するには、各患者(または各被験者)について、少なくとも2個のデータが必要である。それらは、最後の観察時の状態(イベント発生または右側打ち切り)と、イベント発生までの時間(または打ち切りまでの時間)の対からなる。2つ以上のグループ間の生存関数を比較する場合、3番目のデータが必要で、それは各被験者のグループ割り当てである[7]

問題の定義[編集]

確率変数

τ{displaystyle tau }

(タウ)を、関心のあるイベントが起こるまでの時間と考えよう(ただし、

τ0{displaystyle tau geq 0}

である)。上に示したように、目的は、

τ{displaystyle tau }

の潜在的な生存関数

S{displaystyle S}

を推定することである。この関数は、

ckt{displaystyle c_{k}geq t}

となるような

k{displaystyle k}

があるとしよう。上記の命題から、

が成り立つ。

Xk=I(τ~kt){displaystyle X_{k}=mathbb {I} ({tilde {tau }}_{k}geq t)}

とし、

kC(t):={1kn:ckt}{displaystyle kin C(t):={1leq kleq n,:,c_{k}geq t}}

のものだけ、つまり時刻

t{displaystyle t}

以前に結果が打ち切られなかった事象を考えよう。

m(t)=|C(t)|{displaystyle m(t)=|C(t)|}

C(t){displaystyle C(t)}

の要素の数としよう。なお、集合

C(t){displaystyle C(t)}

は確率的ではないので、

m(t){displaystyle m(t)}

も確率的ではないことに注意を要する。さらに、

(Xk)kC(t){displaystyle (X_{k})_{kin C(t)}}

は、共通パラメータ

S(t1)=Prob(τt){displaystyle S(t-1)=operatorname {Prob} (tau geq t)}

を持つ独立同分布のベルヌーイ確率変数の列である。

m(t)>0{displaystyle m(t)>0}

S^naive(t1)=1m(t)k:cktXk=|{1kn:τ~kt}||{1kn:ckt}|=|{1kn:τ~kt}|m(t),{displaystyle {hat {S}}_{text{naive}}(t-1)={frac {1}{m(t)}}sum _{k:c_{k}geq t}X_{k}={frac {|{1leq kleq n,:,{tilde {tau }}_{k}geq t}|}{|{1leq kleq n,:,c_{k}geq t}|}}={frac {|{1leq kleq n,:,{tilde {tau }}_{k}geq t}|}{m(t)}},}

を用いて

S(t1){displaystyle S(t-1)}

を推定することになる。ここで、

τ~kt{displaystyle {tilde {tau }}_{k}geq t}

ckt{displaystyle c_{k}geq t}

を意味するため、2番目の等式が続く。最後の等式は単に表記法の変更である。

この推定量の質は、

m(t){displaystyle m(t)}

の大きさによって決まる。これは、

m(t){displaystyle m(t)}

が小さい場合に問題となる、これは定義上、多くのイベントが打ち切られた場合に起こる。この推定量の特に不快な特性は、おそらくそれが「最良」の推定量ではないことを示唆しており、それは打ち切り時間が

t{displaystyle t}

より前のすべての観測を無視することである。直感的には、これらの観測はまだ

S(t){displaystyle S(t)}

に関する情報を含んでいる。たとえば、

ck<t{displaystyle c_{k}

の多くのイベントで、

τ~k<ck{displaystyle {tilde {tau }}_{k}

も成り立つ場合、イベントが早期に起こることが多いと推測できる。これは、

Prob(τt){displaystyle operatorname {Prob} (tau leq t)}

が大きいことを意味し、

S(t)=1Prob(τt){displaystyle S(t)=1-operatorname {Prob} (tau leq t)}

を介して、

S(t){displaystyle S(t)}

は小さくなければならないことを意味する。ただし、このナイーブ推定法では、この情報は無視される。そこで問題となるのは、すべてのデータをより有効に利用できる推定量が存在するかどうかである。これを実現したのが、カプラン=マイヤー推定量である。なお、打ち切りが行われていない場合には、ナイーブ推定量を改善することはできないので注意を要する。したがって、改善できるかどうかは打ち切りが行われているかどうかに決定的に依存する。

プラグインアプローチ[編集]

基本的な計算によって、