Youdens J-Statistik – Wikipedia

Index, der die Leistung eines dichotomen diagnostischen Tests beschreibt

Youdens J-Statistik (auch genannt Youdens Index) ist eine einzelne Statistik, die die Leistung eines dichotomen diagnostischen Tests erfasst. Informiertheit ist seine Verallgemeinerung auf den Mehrklassenfall und schätzt die Wahrscheinlichkeit einer informierten Entscheidung.

Definition[edit]

Youdens J Statistik ist

J=Empfindlichkeit+Spezifität−1{displaystyle J={text{Empfindlichkeit}}+{text{Spezifität}}-1}

wobei die beiden rechten Größen Sensitivität und Spezifität sind. Somit lautet die erweiterte Formel:

J=wahre positivewahre positive+falsch negativ+wahre negativewahre negative+Fehlalarm−1{displaystyle J={frac {text{wahre positive Werte}}{{text{wahre positive Werte}}+{text{falsche negative Werte}}}}+{frac {text{wahre negative Werte}}{{ text{wahre Negative}}+{text{falsche Positive}}}}-1}

Der Index wurde 1950 von WJ Youden vorgeschlagen [1] um die Leistung eines diagnostischen Tests zusammenzufassen. Der Wert reicht von 0 bis 1 (einschließlich),[1] und hat einen Nullwert, wenn ein diagnostischer Test für Gruppen mit und ohne Krankheit den gleichen Anteil positiver Ergebnisse liefert, dh der Test ist nutzlos. Ein Wert von 1 bedeutet, dass keine falsch positiven oder falsch negativen Ergebnisse vorliegen, dh der Test ist perfekt. Der Index gewichtet falsch-positive und falsch-negative Werte gleich, sodass alle Tests mit demselben Indexwert denselben Anteil an den falsch klassifizierten Gesamtergebnissen ergeben. Während es technisch möglich ist, aus dieser Gleichung einen Wert von weniger als Null zu erhalten, z. B. ergibt die Klassifizierung nur Falsch-Positive und Falsch-Negative, ein Wert von weniger als Null zeigt nur an, dass die positiven und negativen Labels vertauscht wurden. Nach dem Korrigieren der Labels liegt das Ergebnis dann im Bereich von 0 bis 1.

Beispiel einer Betriebskennlinie eines Empfängers. Durchgehend rot: ROC-Kurve; Gestrichelte Linie: Chance-Level; Vertikale Linie (J) Maximalwert des Youden-Index für die ROC-Kurve

Der Youden-Index wird oft in Verbindung mit der Receiver Operating Characteristic (ROC)-Analyse verwendet.[2] Der Index wird für alle Punkte einer ROC-Kurve definiert, und der Maximalwert des Index kann als Kriterium für die Auswahl des optimalen Cut-Off-Punkts verwendet werden, wenn ein diagnostischer Test ein numerisches statt ein dichotomes Ergebnis liefert. Der Index wird grafisch als Höhe über der Zufallslinie dargestellt und entspricht auch der Fläche unter der Kurve, die von einem einzelnen Arbeitspunkt begrenzt wird.[3]

Der Youden-Index ist auch als deltaP . bekannt [4] und verallgemeinert vom dichotomen zum Mehrklassenfall als Informiertheit.[3]

Die Verwendung eines einzigen Index sei “generell nicht zu empfehlen”,[5] aber Informiertheit oder Youden-Index ist die Wahrscheinlichkeit einer informierten Entscheidung (im Gegensatz zu einer zufälligen Schätzung) und berücksichtigt alle Vorhersagen.[3]

Eine nicht verwandte, aber häufig verwendete Kombination grundlegender Statistiken aus der Informationsbeschaffung ist der F-Score, ein (möglicherweise gewichteter) harmonischer Mittelwert von Erinnerung und Präzision, wobei Erinnerung = Sensitivität = wahre positive Rate, aber Spezifität und Präzision sind völlig unterschiedliche Maße. Der F-Score berücksichtigt wie Recall und Precision nur die sogenannten positiven Vorhersagen, wobei Recall die Wahrscheinlichkeit ist, nur die positive Klasse vorherzusagen, Precision die Wahrscheinlichkeit, dass eine positive Vorhersage richtig ist, und F-Score gleicht diese Wahrscheinlichkeiten unter dem effektive Annahme, dass die positiven Labels und die positiven Vorhersagen die gleiche Verteilung und Prävalenz haben sollten,[3] ähnlich der Annahme von Fleiss’ kappa. Youdens J, Informedness, Recall, Precision und F-Score sind intrinsisch ungerichtet und zielen darauf ab, die deduktive Wirksamkeit von Vorhersagen in der von einer Regel, Theorie oder einem Klassifikator vorgeschlagenen Richtung zu bewerten. Markiertheit (deltaP) ist Youdens J, das verwendet wird, um die umgekehrte oder abduktive Richtung zu beurteilen,[3][6] und passt gut zum menschlichen Erlernen von Assoziationen; Regeln und Aberglauben, wie wir mögliche Ursachen modellieren;[4] während Korrelation und Kappa bidirektional auswerten.

Der Matthews-Korrelationskoeffizient ist das geometrische Mittel des Regressionskoeffizienten des Problems und seines Duals, wobei die Komponentenregressionskoeffizienten des Matthews-Korrelationskoeffizienten Markedness (Inverse von Youdens J oder deltaP) und Informiertheit (Youdens J oder deltaP’) sind. Kappa-Statistiken wie Fleiss’ Kappa und Cohen’s Kappa sind Methoden zur Berechnung der Inter-Rater-Reliabilität basierend auf unterschiedlichen Annahmen über die Rand- oder Prior-Verteilungen und werden zunehmend als Zufall korrigiert Alternativen zur Genauigkeit in anderen Kontexten. Fleiss’ Kappa geht wie der F-Score davon aus, dass beide Variablen aus derselben Verteilung stammen und somit dieselbe erwartete Prävalenz aufweisen, während Cohens Kappa davon ausgeht, dass die Variablen aus unterschiedlichen Verteilungen stammen und auf ein Erwartungsmodell bezogen werden, das davon ausgeht, dass die Prävalenzen unabhängig.[6]

Wenn die wahren Prävalenzen für die beiden positiven Variablen gleich sind, wie in Fleiss Kappa und F-Score angenommen, d. h. die Anzahl der positiven Vorhersagen stimmt mit der Anzahl der positiven Klassen im dichotomen (zwei Klassen) Fall überein, die unterschiedlichen Kappa- und Korrelationsmaße kollabieren um sich mit Youdens J zu identifizieren, und Erinnerung, Präzision und F-Score sind in ähnlicher Weise mit der Genauigkeit identisch.[3][6]

Verweise[edit]

  1. ^ ein B Youden, WJ (1950). “Index zur Bewertung diagnostischer Tests”. Krebs. 3: 32–35. mach:10.1002/1097-0142(1950)3:1<32::aid-cncr2820030106>3.0.co;2-3. PMID 15405679.
  2. ^ Schistermann, EF; Perkins, NJ; Liu, A.; Bondell, H. (2005). „Optimaler Cut-Point und der entsprechende Youden-Index zur Unterscheidung von Personen mit gepoolten Blutproben“. Epidemiologie. 16 (1): 73–81. mach:10.1097/01.ede.0000147512.81966.ba. PMID 15613948.
  3. ^ ein B C D e F Kräfte, David MW (2011). „Evaluation: Von Präzision, Recall und F-Score zu ROC, Informedness, Markedness & Correlation“. Zeitschrift für maschinelle Lerntechnologien. 2 (1): 37–63. hdl:2328/27165.
  4. ^ ein B Perruchet, P.; Peereman, R. (2004). „Die Ausnutzung von Verteilungsinformationen bei der Silbenverarbeitung“. J. Neurolinguistik. 17 (2–3): 97–119. mach:10.1016/s0911-6044(03)00059-9.
  5. ^ Everitt BS (2002) Das Cambridge Dictionary of Statistics. TASSE ISBN 0-521-81099-X
  6. ^ ein B C Kräfte, David MW (2012). Das Problem mit Kappa. Konferenz des European Chapter der Association for Computational Linguistics. S. 345–355. hdl:2328/27160.