Pearsons Chi-Quadrat-Test – Wikipedia

before-content-x4

bewertet, wie wahrscheinlich es ist, dass ein Unterschied zwischen Datensätzen zufällig entstanden ist

Pearsons Chi-Quadrat-Test ((

χ2{ displaystyle chi ^ {2}}

) ist ein statistischer Test, der auf Sätze kategorialer Daten angewendet wird, um zu bewerten, wie wahrscheinlich es ist, dass ein beobachteter Unterschied zwischen den Sätzen zufällig aufgetreten ist. Es ist das am weitesten verbreitete von vielen Chi-Quadrat-Tests (z. B. Yates, Wahrscheinlichkeitsverhältnis, Portmanteau-Test in Zeitreihen usw.) – statistische Verfahren, deren Ergebnisse anhand der Chi-Quadrat-Verteilung bewertet werden. Seine Eigenschaften wurden erstmals 1900 von Karl Pearson untersucht.[1] In Kontexten, in denen es wichtig ist, die Unterscheidung zwischen der Teststatistik und ihrer Verteilung zu verbessern, werden ähnliche Namen verwendet Pearson χ-Quadrat Test oder Statistik werden verwendet.

Es wird eine Nullhypothese getestet, die besagt, dass die Häufigkeitsverteilung bestimmter in einer Stichprobe beobachteter Ereignisse mit einer bestimmten theoretischen Verteilung übereinstimmt. Die berücksichtigten Ereignisse müssen sich gegenseitig ausschließen und die Gesamtwahrscheinlichkeit 1 haben. Ein häufiger Fall hierfür ist, dass die Ereignisse jeweils ein Ergebnis einer kategorialen Variablen abdecken. Ein einfaches Beispiel ist die Hypothese, dass ein gewöhnlicher sechsseitiger Würfel ist “Messe” (d.h. alle sechs Ergebnisse treten gleich wahrscheinlich auf.)

Definition[edit]

Der Pearson-Chi-Quadrat-Test wird verwendet, um drei Arten von Vergleichen zu bewerten: Anpassungsgüte, Homogenität und Unabhängigkeit.

  • Ein Test der Anpassungsgüte stellt fest, ob sich eine beobachtete Häufigkeitsverteilung von einer theoretischen Verteilung unterscheidet.
  • Ein Homogenitätstest vergleicht die Verteilung der Zählungen für zwei oder mehr Gruppen unter Verwendung derselben kategorialen Variablen (z. B. Wahl der Aktivität – Hochschule, Militär, Beschäftigung, Reisen) von Absolventen einer High School, die ein Jahr nach dem Abschluss gemeldet wurden, sortiert nach Abschlussjahr. um festzustellen, ob sich die Anzahl der Absolventen, die eine bestimmte Aktivität auswählen, von Klasse zu Klasse oder von Jahrzehnt zu Jahrzehnt geändert hat).[2]
  • Bei einem Unabhängigkeitstest wird bewertet, ob Beobachtungen, die aus Maßnahmen zu zwei Variablen bestehen, die in einer Kontingenztabelle ausgedrückt werden, unabhängig voneinander sind (z. B. Umfrageantworten von Personen unterschiedlicher Nationalität, um festzustellen, ob die Nationalität mit der Antwort zusammenhängt).

Für alle drei Tests umfasst das Berechnungsverfahren die folgenden Schritte:

  1. Berechnen Sie die Chi-Quadrat-Teststatistik. χ², was einer normalisierten Summe quadratischer Abweichungen zwischen beobachteten und theoretischen Frequenzen ähnelt (siehe unten).
  2. Bestimmen Sie die Freiheitsgrade, dfdieser Statistik.
    1. Für einen Test der Passgenauigkeit df = Katzen – Parms, wo Katzen ist die Anzahl der vom Modell erkannten Beobachtungskategorien und Parms ist die Anzahl der Parameter im Modell, die angepasst wurden, damit das Modell am besten zu den Beobachtungen passt: Die Anzahl der Kategorien, die um die Anzahl der angepassten Parameter in der Verteilung reduziert wurden.
    2. Zum Testen der Homogenität df = (Zeilen – 1) × (Spalten – 1), wo Reihen entspricht der Anzahl der Kategorien (dh Zeilen in der zugehörigen Kontingenztabelle) und Cols entspricht der Anzahl unabhängiger Gruppen (dh Spalten in der zugehörigen Kontingenztabelle).[2]
    3. Zum Test der Unabhängigkeit df = (Zeilen – 1) × (Spalten – 1), wo in diesem Fall Reihen entspricht der Anzahl der Kategorien in einer Variablen und Cols entspricht der Anzahl der Kategorien in der zweiten Variablen.[2]
  3. Wählen Sie ein gewünschtes Vertrauensniveau (Signifikanzniveau, p-Wert oder das entsprechende Alpha-Niveau) für das Testergebnis.
  4. Vergleichen Sie
  5. Halten Sie die Nullhypothese aufrecht oder lehnen Sie sie ab, dass die beobachtete Häufigkeitsverteilung mit der theoretischen Verteilung übereinstimmt, basierend darauf, ob die Teststatistik den kritischen Wert von überschreitet

Test auf Passform einer Verteilung[edit]

Diskrete Gleichverteilung[edit]

In diesem Fall

N.{ displaystyle N}

Beobachtungen werden unter aufgeteilt

n{ displaystyle n}

Zellen. Eine einfache Anwendung besteht darin, die Hypothese zu testen, dass in der Allgemeinbevölkerung Werte in jeder Zelle mit gleicher Häufigkeit auftreten würden. Das “theoretische Frequenz” für jede Zelle (unter der Nullhypothese einer diskreten Gleichverteilung) wird somit berechnet als

und die Verringerung der Freiheitsgrade ist

p=1{ displaystyle p = 1}

, fiktiv weil die beobachteten Frequenzen

Öich{ displaystyle O_ {i}}

sind gezwungen zu summieren

N.{ displaystyle N}

.

Ein spezifisches Beispiel für seine Anwendung wäre die Anwendung für den Log-Rank-Test.

Andere Distributionen[edit]

Beim Testen, ob Beobachtungen Zufallsvariablen sind, deren Verteilung zu einer bestimmten Verteilungsfamilie gehört, wird die “theoretische Frequenzen” werden unter Verwendung einer Verteilung aus dieser Familie berechnet, die auf eine Standardweise angepasst ist. Die Verringerung der Freiheitsgrade wird berechnet als

p=s+1{ displaystyle p = s + 1}

, wo

s{ displaystyle s}

ist die Anzahl der Co-Variablen, die zur Anpassung der Verteilung verwendet werden. Wenn Sie beispielsweise eine Weibull-Verteilung mit drei Variationen überprüfen,

p=4{ displaystyle p = 4}

und bei der Überprüfung einer Normalverteilung (wobei die Parameter Mittelwert und Standardabweichung sind),

p=3{ displaystyle p = 3}

und beim Überprüfen einer Poisson-Verteilung (wobei der Parameter der erwartete Wert ist),

p=2{ displaystyle p = 2}

. So wird es sein

n– –p{ displaystyle np}

Freiheitsgrade, wo

n{ displaystyle n}

ist die Anzahl der Kategorien.

Die Freiheitsgrade basieren nicht auf der Anzahl der Beobachtungen wie bei der t- oder F-Verteilung eines Schülers. Wenn Sie beispielsweise auf einen fairen, sechsseitigen Würfel testen, gibt es fünf Freiheitsgrade, da es sechs Kategorien / Parameter (jede Zahl) gibt. Die Häufigkeit, mit der die Würfel gewürfelt werden, hat keinen Einfluss auf die Anzahl der Freiheitsgrade.

Berechnung der Teststatistik[edit]

Der Wert der Teststatistik ist

wo

Die Chi-Quadrat-Statistik kann dann verwendet werden, um einen p-Wert zu berechnen, indem der Wert der Statistik mit einer Chi-Quadrat-Verteilung verglichen wird. Die Anzahl der Freiheitsgrade entspricht der Anzahl der Zellen

n{ displaystyle n}

abzüglich der Verringerung der Freiheitsgrade,

p{ displaystyle p}

.

Das Ergebnis über die Anzahl der Freiheitsgrade ist gültig, wenn die Originaldaten multinomial sind und daher die geschätzten Parameter zur Minimierung der Chi-Quadrat-Statistik effizient sind. Allgemeiner jedoch liegt die Verteilung irgendwo zwischen einer Chi-Quadrat-Verteilung mit, wenn die Schätzung der maximalen Wahrscheinlichkeit nicht mit der Schätzung des minimalen Chi-Quadrats übereinstimmt

n– –1– –p{ displaystyle n-1-p}

und

n– –1{ displaystyle n-1}

Freiheitsgrade (siehe zum Beispiel Chernoff und Lehmann, 1954).

Bayesianische Methode[edit]

In der Bayes’schen Statistik würde man stattdessen eine Dirichlet-Verteilung als konjugiertes Prior verwenden. Wenn man zuvor eine einheitliche Schätzung vorgenommen hat, ist die maximale Wahrscheinlichkeitsschätzung für die Bevölkerungswahrscheinlichkeit die beobachtete Wahrscheinlichkeit, und man kann eine glaubwürdige Region um diese oder eine andere Schätzung berechnen.

Prüfung auf statistische Unabhängigkeit[edit]

In diesem Fall ein “Überwachung” besteht aus den Werten zweier Ergebnisse und die Nullhypothese lautet, dass das Auftreten dieser Ergebnisse statistisch unabhängig ist. Jede Beobachtung wird einer Zelle eines zweidimensionalen Arrays von Zellen (als Kontingenztabelle bezeichnet) gemäß den Werten der beiden Ergebnisse zugeordnet. Wenn es gibt r Zeilen und c Spalten in der Tabelle, die “theoretische Frequenz” für eine Zelle ist angesichts der Hypothese der Unabhängigkeit

wo

N.{ displaystyle N}

ist die Gesamtstichprobengröße (die Summe aller Zellen in der Tabelle) und

ist der Bruchteil der Beobachtungen vom Typ ich Ignorieren des Spaltenattributs (Bruchteil der Zeilensummen) und

ist der Bruchteil der Beobachtungen vom Typ j Ignorieren des Zeilenattributs (Bruchteil der Spaltensummen). Der Begriff “Frequenzen” bezieht sich eher auf absolute Zahlen als auf bereits normalisierte Werte.

Der Wert der Teststatistik ist

Beachten Sie, dass

χ2{ displaystyle chi ^ {2}}

ist genau dann 0, wenn

Öich,j=E.ich,jich,j{ displaystyle O_ {i, j} = E_ {i, j} forall i, j}

dh nur, wenn die erwartete und die wahre Anzahl von Beobachtungen in allen Zellen gleich sind.

Passend zum Modell von “Unabhängigkeit” reduziert die Anzahl der Freiheitsgrade um p = r + c – 1. Die Anzahl der Freiheitsgrade entspricht der Anzahl der Zellen rcabzüglich der Verringerung der Freiheitsgrade, p, was sich auf (r – 1) (c – 1).

Für den Test der Unabhängigkeit, auch als Homogenitätstest bekannt, wird eine Chi-Quadrat-Wahrscheinlichkeit von weniger als oder gleich 0,05 (oder die Chi-Quadrat-Statistik liegt bei oder größer als der kritische Punkt von 0,05) von angewandten Arbeitern üblicherweise als interpretiert Begründung für die Ablehnung der Nullhypothese, dass die Zeilenvariable unabhängig von der Spaltenvariablen ist.[4]

Die alternative Hypothese entspricht den Variablen mit einer Assoziation oder Beziehung, bei denen die Struktur dieser Beziehung nicht angegeben ist.

Annahmen[edit]

Der Chi-Quadrat-Test hat, wenn er mit der Standardnäherung verwendet wird, dass eine Chi-Quadrat-Verteilung anwendbar ist, die folgenden Annahmen:[citation needed]

Einfache Zufallsstichprobe
Die Stichprobendaten sind eine Zufallsstichprobe aus einer festen Verteilung oder Population, bei der jede Sammlung von Mitgliedern der Population der angegebenen Stichprobengröße die gleiche Auswahlwahrscheinlichkeit aufweist. Testvarianten wurden für komplexe Proben entwickelt, z. B. wo die Daten gewichtet werden. Andere Formen können verwendet werden, beispielsweise eine gezielte Probenahme.[5]
Stichprobengröße (ganze Tabelle)
Eine Stichprobe mit einer ausreichend großen Größe wird angenommen. Wenn ein Chi-Quadrat-Test an einer Probe mit einer kleineren Größe durchgeführt wird, ergibt der Chi-Quadrat-Test eine ungenaue Schlussfolgerung. Durch die Verwendung des Chi-Quadrat-Tests an kleinen Proben kann der Forscher einen Fehler vom Typ II begehen.
Erwartete Zellzahl
Angemessene erwartete Zellzahlen. Einige erfordern 5 oder mehr, andere 10 oder mehr. Eine übliche Regel ist 5 oder mehr in allen Zellen einer 2-mal-2-Tabelle und 5 oder mehr in 80% der Zellen in größeren Tabellen, aber keine Zellen mit einer erwarteten Anzahl von Null. Wenn diese Annahme nicht erfüllt ist, wird die Yates-Korrektur angewendet.
Unabhängigkeit
Die Beobachtungen werden immer als unabhängig voneinander angenommen. Dies bedeutet, dass Chi-Quadrat nicht zum Testen korrelierter Daten (wie übereinstimmender Paare oder Paneldaten) verwendet werden kann. In diesen Fällen ist der McNemar-Test möglicherweise besser geeignet.

Ein Test, der auf unterschiedlichen Annahmen beruht, ist der genaue Test von Fisher. Wenn die Annahme fester Randverteilungen erfüllt ist, ist es wesentlich genauer, ein Signifikanzniveau zu erhalten, insbesondere mit wenigen Beobachtungen. In der überwiegenden Mehrheit der Anwendungen wird diese Annahme nicht erfüllt, und der genaue Test von Fisher ist zu konservativ und weist keine korrekte Abdeckung auf.[6]

Ableitung[edit]

Ableitung unter Verwendung des zentralen Grenzwertsatzes

Die Nullverteilung der Pearson-Statistik mit j Zeilen und k Spalten wird durch die Chi-Quadrat-Verteilung mit (angenähert) angenähert.k – 1) (j – 1) Freiheitsgrade.[7]

Diese Annäherung ergibt sich als wahre Verteilung unter der Nullhypothese, wenn der erwartete Wert durch eine Multinomialverteilung gegeben ist. Für große Stichprobengrößen tendiert der zentrale Grenzwertsatz dazu, dass diese Verteilung zu einer bestimmten multivariaten Normalverteilung tendiert.

Zwei Zellen[edit]

In dem speziellen Fall, in dem die Tabelle nur zwei Zellen enthält, folgen die erwarteten Werte einer Binomialverteilung.

wo

p = Wahrscheinlichkeit unter der Nullhypothese,
n = Anzahl der Beobachtungen in der Stichprobe.

Im obigen Beispiel beträgt die hypothetische Wahrscheinlichkeit einer männlichen Beobachtung 0,5 mit 100 Proben. Wir erwarten daher 50 Männer zu beobachten.

Wenn n ausreichend groß ist, kann die obige Binomialverteilung durch eine Gaußsche (Normal-) Verteilung angenähert werden, und somit nähert sich die Pearson-Teststatistik einer Chi-Quadrat-Verteilung an.

Lassen Ö1 ist die Anzahl der Beobachtungen aus der Probe, die sich in der ersten Zelle befinden. Die Pearson-Teststatistik kann ausgedrückt werden als

was wiederum ausgedrückt werden kann als

Durch die normale Annäherung an ein Binomial ist dies das Quadrat einer Standardnormalvariablen und wird daher als Chi-Quadrat mit 1 Freiheitsgrad verteilt. Beachten Sie, dass der Nenner eine Standardabweichung der Gaußschen Näherung ist und somit geschrieben werden kann

In Übereinstimmung mit der Bedeutung der Chi-Quadrat-Verteilung messen wir, wie wahrscheinlich die beobachtete Anzahl von Standardabweichungen vom Mittelwert unter der Gaußschen Näherung ist (was eine gute Näherung für große ist n).

Die Chi-Quadrat-Verteilung wird dann rechts vom Statistikwert integriert, um den P-Wert zu erhalten, der der Wahrscheinlichkeit entspricht, dass eine Statistik gleich oder größer als die beobachtete wird, wobei die Nullhypothese angenommen wird.

Zwei-mal-zwei-Kontingenztabellen[edit]

Wenn der Test auf eine Kontingenztabelle angewendet wird, die zwei Zeilen und zwei Spalten enthält, entspricht der Test einem Z-Test mit Proportionen.[citation needed]

Viele Zellen[edit]

Ähnliche Argumente wie oben führen zum gewünschten Ergebnis.[citation needed] Jede Zelle (mit Ausnahme der letzten, deren Wert vollständig von den anderen bestimmt wird) wird als unabhängige Binomialvariable behandelt, und ihre Beiträge werden summiert und jede trägt zu einem Freiheitsgrad bei.

Lassen Sie uns nun beweisen, dass sich die Verteilung tatsächlich asymptotisch der nähert

χ2{ displaystyle chi ^ {2}}

Verteilung, wenn sich die Anzahl der Beobachtungen der Unendlichkeit nähert.

Lassen

n{ displaystyle n}

sei die Anzahl der Beobachtungen,

m{ displaystyle m}

die Anzahl der Zellen und

pich{ displaystyle p_ {i}}

die Wahrscheinlichkeit, dass eine Beobachtung in die i-te Zelle fällt, z

1ichm{ displaystyle 1 leq i leq m}

. Wir bezeichnen mit

{kich}}{ displaystyle {k_ {i} }}

die Konfiguration wo für jedes i gibt es

kich{ displaystyle k_ {i}}

Beobachtungen in der i-ten Zelle. Beachten Sie, dass

Lassen

χP.2(({kich}},{pich}}){ displaystyle chi _ {P} ^ {2} ( {k_ {i} }, {p_ {i} })}

Pearsons kumulative Teststatistik für eine solche Konfiguration sein und lassen

χP.2(({pich}}){ displaystyle chi _ {P} ^ {2} ( {p_ {i} })}

die Verteilung dieser Statistik sein. Wir werden zeigen, dass sich die letztere Wahrscheinlichkeit dem nähert

χ2{ displaystyle chi ^ {2}}

Verteilung mit

m– –1{ displaystyle m-1}

Freiheitsgrade, as

n.{ displaystyle n to infty.}

Für jeden beliebigen Wert T:

Beispiele[edit]

Fairness der Würfel[edit]

Ein 6-seitiger Würfel wird 60 Mal geworfen. Die Häufigkeit, mit der es mit 1, 2, 3, 4, 5 und 6 nach oben landet, beträgt 5, 8, 9, 8, 10 bzw. 20. Ist der Würfel gemäß dem Pearson-Chi-Quadrat-Test bei einem Signifikanzniveau von 95% und / oder 99% vorgespannt?

n = 6, da es 6 mögliche Ergebnisse gibt, 1 bis 6. Die Nullhypothese lautet, dass der Würfel unverzerrt ist, daher wird erwartet, dass jede Zahl in diesem Fall gleich oft auftritt. 60/.n = 10. Die Ergebnisse können wie folgt tabelliert werden:

Die Anzahl der Freiheitsgrade ist n – 1 = 5. Die Kritische Werte der Chi-Quadrat-Verteilung im oberen Schwanz Die Tabelle gibt einen kritischen Wert von 11.070 bei einem Signifikanzniveau von 95% an:

Grad
von
Freiheit
Wahrscheinlichkeit kleiner als der kritische Wert
0,90 0,95 0,975 0,99 0,999
5 9.236 11.070 12.833 15.086 20.515

Da die Chi-Quadrat-Statistik von 13,4 diesen kritischen Wert überschreitet, lehnen wir die Nullhypothese ab und schließen daraus, dass der Würfel auf ein Signifikanzniveau von 95% vorgespannt ist.

Bei einem Signifikanzniveau von 99% beträgt der kritische Wert 15,086. Da die Chi-Quadrat-Statistik diese nicht überschreitet, lehnen wir die Nullhypothese nicht ab und schließen daraus, dass es nicht genügend Beweise gibt, um zu zeigen, dass der Würfel auf ein Signifikanzniveau von 99% verzerrt ist.

Güte der Anpassung[edit]

In diesem Zusammenhang sind die Häufigkeiten sowohl der theoretischen als auch der empirischen Verteilung nicht normalisierte Zählungen und für einen Chi-Quadrat-Test die Gesamtprobengrößen

N.{ displaystyle N}

dieser beiden Verteilungen (Summen aller Zellen der entsprechenden Kontingenztabellen) müssen gleich sein.

Um beispielsweise die Hypothese zu testen, dass eine Zufallsstichprobe von 100 Personen aus einer Population gezogen wurde, in der Männer und Frauen gleich häufig sind, würde die beobachtete Anzahl von Männern und Frauen mit den theoretischen Häufigkeiten von 50 Männern und 50 Frauen verglichen . Wenn 44 Männer in der Stichprobe und 56 Frauen waren, dann

Wenn die Nullhypothese wahr ist (dh Männer und Frauen werden mit gleicher Wahrscheinlichkeit ausgewählt), wird die Teststatistik aus einer Chi-Quadrat-Verteilung mit einem Freiheitsgrad gezogen (denn wenn die männliche Frequenz bekannt ist, ist die weibliche Frequenz entschlossen).

Die Konsultation der Chi-Quadrat-Verteilung für 1 Freiheitsgrad zeigt, dass die Wahrscheinlichkeit, diesen Unterschied (oder einen extremeren Unterschied als diesen) zu beobachten, wenn Männer und Frauen in der Bevölkerung gleich zahlreich sind, ungefähr 0,23 beträgt. Diese Wahrscheinlichkeit ist höher als herkömmliche Kriterien für die statistische Signifikanz (0,01 oder 0,05), daher würden wir normalerweise die Nullhypothese nicht ablehnen, dass die Anzahl der Männer in der Bevölkerung der Anzahl der Frauen entspricht (dh wir würden unsere Stichprobe innerhalb betrachten die Bandbreite dessen, was wir für ein Verhältnis von Männern zu Frauen von 50/50 erwarten würden.)

Probleme[edit]

Die Annäherung an die Chi-Quadrat-Verteilung bricht zusammen, wenn die erwarteten Frequenzen zu niedrig sind. Es ist normalerweise akzeptabel, solange nicht mehr als 20% der Ereignisse erwartete Frequenzen unter 5 haben. Wenn nur 1 Freiheitsgrad vorhanden ist, ist die Approximation nicht zuverlässig, wenn die erwarteten Frequenzen unter 10 liegen. In diesem Fall eine bessere Approximation kann erhalten werden, indem der Absolutwert jeder Differenz zwischen beobachteten und erwarteten Frequenzen vor dem Quadrieren um 0,5 verringert wird; Dies wird als Yates-Korrektur für die Kontinuität bezeichnet.

In Fällen, in denen der erwartete Wert E als klein befunden wird (was auf eine geringe zugrunde liegende Populationswahrscheinlichkeit und / oder eine geringe Anzahl von Beobachtungen hinweist), kann die normale Annäherung der Multinomialverteilung fehlschlagen, und in solchen Fällen wird dies festgestellt besser geeignet sein, den G-Test zu verwenden, eine auf dem Wahrscheinlichkeitsverhältnis basierende Teststatistik. Wenn die Gesamtstichprobengröße klein ist, muss ein geeigneter exakter Test verwendet werden, typischerweise entweder der Binomialtest oder (für Kontingenztabellen) der exakte Fisher-Test. Dieser Test verwendet die bedingte Verteilung der Teststatistik unter Berücksichtigung der Grenzsummen. Es wird jedoch nicht davon ausgegangen, dass die Daten aus einem Experiment generiert wurden, bei dem die Grenzsummen festgelegt sind[dubious ] und ist gültig, ob dies der Fall ist oder nicht.[dubious ][citation needed]

Es kann gezeigt werden, dass die

χ2{ displaystyle chi ^ {2}}

Test ist eine Annäherung niedriger Ordnung an die

Ψ{ displaystyle Psi}

Prüfung.[8] Die obigen Gründe für die obigen Probleme werden offensichtlich, wenn die Terme höherer Ordnung untersucht werden.

Siehe auch[edit]

  1. ^ Pearson, Karl (1900). “Nach dem Kriterium, dass ein gegebenes System von Abweichungen vom Wahrscheinlichen im Fall eines korrelierten Variablensystems so ist, dass vernünftigerweise angenommen werden kann, dass es aus einer Zufallsstichprobe entstanden ist” (PDF). Philosophisches Magazin. Serie 5. 50 (302): 157–175. doi:10.1080 / 14786440009463897.
  2. ^ ein b c David E. Bock, Paul F. Velleman und Richard D. De Veaux (2007). “Statistik, Modellierung der Welt,” S. 606-627, Pearson Addison Wesley, Boston, ISBN 0-13-187621-X
  3. ^ “1.3.6.7.4. Kritische Werte der Chi-Quadrat-Verteilung”. Abgerufen 14. Oktober 2014.
  4. ^ “Kritische Werte der Chi-Quadrat-Verteilung”. NIST / SEMATECH e-Handbuch für statistische Methoden. Nationales Institut für Standards und Technologie.
  5. ^ Sehen Field, Andy. Ermitteln von Statistiken mit SPSS. für Annahmen auf dem Chi-Platz.
  6. ^ “Eine Bayes’sche Formulierung für explorative Datenanalyse und Anpassungstests” (PDF). Internationale statistische Überprüfung. p. 375.
  7. ^ Statistiken für Anwendungen. MIT OpenCourseWare. Vorlesung 23. Pearson’s Theorem. Abgerufen am 21. März 2007.
  8. ^ Jaynes, ET (2003). Wahrscheinlichkeitstheorie: Die Logik der Wissenschaft. C. Universitätspresse. p. 298. ISBN 978-0-521-59271-0. ((Link ist zu einer fragmentarischen Ausgabe vom März 1996.)

Verweise[edit]


after-content-x4