Chi-Quadrat Verfahren
Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz von Chi-Quadrattechniken ist der Vergleich von beobachteten (ausgezählten) Häufigkeiten mit theoretisch erwarteten Häufigkeiten.
Dazu zwei Anwendungen:
1) Der Vergleich einer empirischen Verteilung mit einer theoretischen Verteilung (= Goodness-of-fit-Test)
2) 2 x 2 Felder-Tafeln
Ad 1)
Denken Sie zurück an unsere ersten Beispiele, die wir in der Statistik I im vergangenen WS behandelt haben. Wir haben gleich zu Beginn des WS kontiuierliche, intervallskalierte Daten durch Klassenbildung auf ein Nominalskalenniveau reduziert und anschließend die Häufigkeiten der verschiedenen Klassen bzw. Kategorien ausgezählt.
Nehmen wir an, in einem konkreten Fall lägen folgende Altersklassen vor: Die Klasse 1 umfasse alle 0-10 jährigen, Klasse 2 alle 11-20 jährigen, Klasse 3 alle 21 - 30 jährigen, Klasse 4 alle 31 bis 40 jährigen, Klasse 5 alle 41 bis 50 jährigen, Klasse 6 alle 51 bis 60 jährigen, Klasse 7 alle 61 bis 70 jährigen, Klasse 8 alle 71 bis alle darüber (71 oder mehr).
Für die diese Altersklassen wurden die Häufigkeiten ausgezählt:
Intervall |
Beobachtete Häufigkeiten |
0-10 Jahre |
13 |
11-20 |
7 |
21-30 |
12 |
31-40 |
17 |
41-50 |
15 |
51-60 |
13 |
61-70 |
7 |
71-darüber |
6 |
Um nun aber irgendwelche inferenzstatistische Schlüsse ziehen zu können, müssen wir diese Häufigkeiten mit nach bestimmten Kriterien erwarteten Häufigkeiten vergleichen.
So wollen wir beispielsweise wissen, ob die vorliegende Häufigkeitsverteilung einer Normalverteilung entspricht. (Dies ein spezieller Goodness-of-fit-Test)
Man vergleicht hierzu die folgenden Häufigkeiten:
Intervall |
Beobachtete Häufigkeit |
Erwartete Häufigkeit |
Erwartete Prozent |
|
|
|
(bei Normalverteilung) |
0-10 Jahre |
13 |
9,54 |
10,6% |
11-20 |
7 |
9,99 |
11,1% |
21-30 |
12 |
14,13 |
15,7% |
31-40 |
17 |
16,29 |
18,1% |
41-50 |
15 |
15,57 |
17,3% |
51-60 |
13 |
11,52 |
12,8% |
61-70 |
7 |
7,20 |
8% |
71-darüber |
6 |
5,49 |
6,1% |
Die erwarteten Häufigkeiten werden berechnet, indem man die Kategoriengrenzen z-transformiert (Mittelwert und Standardabweichung werden aus den gruppierten Daten berechnet) und die Fläche zwischen den Grenzen mit Hilfe der Standardnormalverteilungstabelle ausrechnet. So sind beispielsweise in den Grenzen von 0-10 10,6% aller Fälle, wenn die Daten normalverteilt sind. Da die Gesamthäufigkeiten gleich 90 sind, erwarten wir in diesem Intervall 10,6% von 90. Dies sind 9,54.
Einen solchen Vergleich von beobachteten und erwarteten Häufigkeiten findet man oft in der Statistik. Stellen Sie sich ein Kollektiv vor mit 20% weiblichen und 80% männlichen Studenten (beispielsweise ein Kurs in Mathematik). Nun seien in der Gesamtbevölkerung 50% weiblichen und 50% männlichen Geschlechts. Auch in diesem Beispiel können Sie die erwarteten Häufigkeiten berechnen, indem Sie einfach ausrechnen, welche Häufigkeiten Sie in Ihrem Kollektiv erwarten, wenn 50% männlich und 50% weiblich sind. Besteht der Kurs aus beispielsweise 40 Stundenten, so erwarten wir aufgrund der Bevölkerungsstatistik 20 Frauen und 20 Männer.
In jedem Falle werden bei den Chi-Quadratverfahren die Abweichungen der beobachteten von den erwarteten Häufigkeiten untersucht.
Die gesuchte Prüfgröße ist das so genannte Chi-Quadrat. Wir erhalten diese Prüfgröße, indem wir zunächst die Abweichung jeder beobachteten Häufigkeit zur erwarteten Häufigkeit berechnen, diese Abweichung quadrieren und durch die erwartete Häufigkeit dividieren. Die Summe der quadrierten und jeweils durch die erwarteten Häufigkeiten dividierten Abweichungen ist der gesuchte Chi-Quadratwert.
Sind die beobachteten Häufigkeiten mit den erwarteten Häufigkeiten identisch, so ist unser Chi-Quadrat gleich Null.
Zu unserem Beispiel: (13 – 9.54)2 / 9.54 = 1.25
(7 – 9.99)2 / 9.99 = 0.89
usw.
Dies ergibt in der Summe: 2.77
Für die Signifikanzprüfung müssen wir in der entsprechenden Chi-Quadrat-Tabelle nachschlagen. Dazu benötigen wir noch die Anzahl der Freiheitsgrade für die Prüfgröße Chi-Quadrat:
Freiheitsgrade: Die Anzahl der Summanden, die in die Berechnung des Chi-Quadrat einfließen, ist in unserem Falle gleich 8. Da die Summe der beobachteten Häufigkeiten gleich sein muss der Summe der erwarteten Häufigkeiten, steht ein Summand von vornherein fest. Die Anzahl der Freiheitsgrade reduziert sich daher um eins.
Unser spezielles Beispiel weicht aber insofern von anderen Goodness-of-Fit-Verfahren noch in zwei Hinsichten ab:
a) Da wir in diesem speziellen Falle die erwarteten Häufigkeiten über die z-Transformation gewonnen haben, sind diese erwarteten Häufigkeiten zusätzlich noch durch den Mittelwert und die Streuung der beobachteten Häufigkeiten festgelegt. Wir haben die erwarteten Häufigkeiten geschätzt, indem wir Mittelwert und Streuung der beobachteten Häufigkeiten verwendet haben. Wir müssen in diesem speziellen Falle zusätzlich noch zwei Freiheitsgrade abziehen. Das ergibt insgesamt 8 -1-2 = 5 Freiheitsgrade.
b) Die Nullhypothese besagt, dass die beobachteten Häufigkeiten sich nicht von den erwarteten Häufigkeiten unterscheiden. Bei einem Test zur Überprüfung der Normalverteilung sind wir aber gerade an der Nullhypothese interessiert. Normalerweise ist es umgekehrt: Wir sind normalerweise an der Alternativhypothese interessiert, wir wollen beispielsweise wissen, ob sich zwei Stichproben unterscheiden. Um die Entscheidung zugunsten der Alternativhypothese sozusagen 'wasserdicht' zu machen, wählen wir einen möglichst kleinen α-Fehler. (p= 0,05 oder gar 0,01) Im speziellen Falle einer Normalverteilungsüberprüfung wollen wir dahingegen umgekehrt das Risiko, fälschlicherweise die Nullhypothese beizubehalten, möglichst klein halten. Wir müssen uns also gegen den ß-Fehler absichern. Dies tun wir, indem wir eine möglichst große Irrtumswahrscheinlichkeit wählen. Beispielsweise ein Signifikanzniveau von 0,1.
Wir entnehmen bei einer Fläche von 0,90 und bei 5 Freiheitsgraden einen kritischen Chi-Quadratwert von 9,24 (siehe unten aufgelistete Tabelle).
Da unser errechneter Chi-Quadratwert weit kleiner ist als der kritische Wert, können wir die Nullhypothese nicht verwerfen. Das bedeutet im vorliegenden Falle, dass wir von einer Normalverteilung ausgehen können.
Bei allen anderen Goodness-of-Fit Verfahren gilt unser Interesse aber der Alternativhypothese. Wir wollen beispielsweise wissen, ob sich die Altersklassen in einem Sample von den Altersklassen in der Population unterscheiden. Oft werden einfach beobachtete Häufigkeiten mit vorgegebenen Prozentanteilen verglichen. (Vergleich der Verteilung des Geschlechts in einem Sample im Unterschied zur Verteilung in der Population; Vergleich der Verteilung von Altersgruppen im Unterschied zur Population etc.)
Die Freiheitsgrade sind in all diesen Fällen einfach die Anzahl der in den Chi-quadratwert eingehenden Summanden - 1.
Das Signifikanzniveau ist in diesem Falle 5% (signifikant) oder 1% (h0ch signifikant).
Handelt es sich also bei dem oben verwendeten Beispiel um einen Vergleich von Altersklassen in einem Sample mit Altersklassen in einer Population, so bestimmen wir den kritischen Chi-quadrat-Wert wie folgt:
Der Tabelle entnehmen wir bei einer Fläche von 0,95 und bei 7 Freiheitsgraden einen kritischen Chi-Quadratwert von 14,07.
Da unser errechneter Chi-quadratwert weit kleiner ist als der kritische Wert, können wir die Nullhypothese nicht verwerfen.
2) 2 x 2 Felder Tafel
Häufig werden Chi-Quadratverfahren bei so genannten zweidimensionalen Häufigkeitstabellen (auch Kreuztabellen genannt) verwendet.
Dies ist dann der Fall, wenn eine Häufigkeitsverteilung nach einem zweiten Kriterium nochmals untergliedert wird.
Betrachten wir hierzu als Beispiel eine typische 2 x 2 Feldertafel:
|
|
Geschlecht |
|
|
|
|
männlich |
|
weiblich |
|
|
Ja |
25 |
|
10 |
35 |
|
|
|
|
|
|
Brillenträger |
Nein |
35 |
|
30 |
65 |
|
|
60 |
|
40 |
100 |
|
Zur Erklärung: 35; 65; 60; 40 sind die so genannten Randsummen. Wir haben in dieser Stichprobe also 35% Brillenträger und 65 % ohne Brille. Das Geschlecht verteilt sich zu 60 % männlich und 40 % weiblich.
Die Nullhypothese lautet in diesem Falle: Das Merkmal "Geschlecht" ist in seiner Verteilung unabhängig vom Merkmal "Brillenträger".
Alternativhypothese: Die beiden Merkmale sind nicht unabhängig.
Für die Verteilung der beiden Merkmale haben wir nur unser Sample. Welche Häufigkeiten können wir also erwarten, wenn die beiden Merkmale unabhängig sind, wenn also die Nullhypothese zutrifft? Wir schätzen diese erwarteten Häufigkeiten aus den Randsummen.
Beispiel: Sind Geschlecht und
Fehlsichtigkeit voneinander unabhängig, so müssten von den insgesamt 60 %
Männern 35 % Brillenträger sein. Für die
Merkmalskombination Männlich/Brillenträger erwarten wir die relative
Häufigkeit: .
ergibt daraus dann die
erwartete Häufigkeit, also 21.
Allgemein berechnen wir die erwartete Häufigkeit nach der Formel:
Fassen wir die beobachteten und erwarteten Häufigkeiten in dem gegebenen Beispiel wie folgt zusammen:
fb |
fe |
25 |
21 |
10 |
14 |
35 |
39 |
30 |
26 |
Quadrieren wir die Differenz von beobachteten und erwarteten Häufigkeiten, dividieren sie durch die erwarteten Häufigkeiten und bilden die Summe, so erhalten wir die Prüfgröße Chi-quadrat.
Dies ist: (25 - 21)2 / 21 + (10 - 14)2 / 14 + (35-39)2 / 39 + (30-26)2 / 26 =
2.930
Zur inferenzstatistischen Absicherung dieses Chiquadrat benötigen wir die Anzahl der Freiheitsgrade. Diese bestimmen wir wie folgt:
Da die Wahrscheinlichkeiten für die
Merkmalskombinationen aus den Randsummen geschätzt werden, haben
wir Freiheitsgrade.
k und l sind die Anzahl der Ausprägungen der beiden Merkmale. Diese
Anzahl beträgt im Falle einer 4 - Felder-Tafel jeweils 2. Die
Freiheitsgrade bei einer 4 - Felder-Tafel sind demnach insgesamt 1!
Chi-quadrat kritisch auf dem 5 % Signifikanzniveau ist gemäß unten stehender Tabelle 3.84.
Das Ergebnis ist demnach nicht signifikant. Das Merkmal Brillenträger ist in der Verteilung unabhängig vom Merkmal Geschlecht.
Voraussetzungen des Tests:
Die erwarteten Häufigkeiten pro Zelle sollten mindestens gleich 5 sein.
Tabelle der Chi-Quadrat-Verteilung
From Wikibooks
Quantile der Chi-Quadrat-Verteilung nach ausgewählten Wahrscheinlichkeiten p und Freiheitsgraden |
|||||||||||
|
Wahrscheinlichkeit p |
||||||||||
Freiheitsgrade |
0,005 |
0,01 |
0,025 |
0,05 |
0,1 |
0,5 |
0,9 |
0,95 |
0,975 |
0,99 |
0,995 |
1 |
0,00 |
0,00 |
0,00 |
0,00 |
0,02 |
0,45 |
2,71 |
3,84 |
5,02 |
6,63 |
7,88 |
2 |
0,01 |
0,02 |
0,05 |
0,10 |
0,21 |
1,39 |
4,61 |
5,99 |
7,38 |
9,21 |
10,60 |
3 |
0,07 |
0,11 |
0,22 |
0,35 |
0,58 |
2,37 |
6,25 |
7,81 |
9,35 |
11,34 |
12,84 |
4 |
0,21 |
0,30 |
0,48 |
0,71 |
1,06 |
3,36 |
7,78 |
9,49 |
11,14 |
13,28 |
14,86 |
5 |
0,41 |
0,55 |
0,83 |
1,15 |
1,61 |
4,35 |
9,24 |
11,07 |
12,83 |
15,09 |
16,75 |
6 |
0,68 |
0,87 |
1,24 |
1,64 |
2,20 |
5,35 |
10,64 |
12,59 |
14,45 |
16,81 |
18,55 |
7 |
0,99 |
1,24 |
1,69 |
2,17 |
2,83 |
6,35 |
12,02 |
14,07 |
16,01 |
18,48 |
20,28 |
8 |
1,34 |
1,65 |
2,18 |
2,73 |
3,49 |
7,34 |
13,36 |
15,51 |
17,53 |
20,09 |
21,95 |
9 |
1,73 |
2,09 |
2,70 |
3,33 |
4,17 |
8,34 |
14,68 |
16,92 |
19,02 |
21,67 |
23,59 |
10 |
2,16 |
2,56 |
3,25 |
3,94 |
4,87 |
9,34 |
15,99 |
18,31 |
20,48 |
23,21 |
25,19 |
p → |
0,005 |
0,01 |
0,025 |
0,05 |
0,1 |
0,5 |
0,9 |
0,95 |
0,975 |
0,99 |
0,995 |
11 |
2,60 |
3,05 |
3,82 |
4,57 |
5,58 |
10,34 |
17,28 |
19,68 |
21,92 |
24,73 |
26,76 |
12 |
3,07 |
3,57 |
4,40 |
5,23 |
6,30 |
11,34 |
18,55 |
21,03 |
23,34 |
26,22 |
28,30 |
13 |
3,57 |
4,11 |
5,01 |
5,89 |
7,04 |
12,34 |
19,81 |
22,36 |
24,74 |
27,69 |
29,82 |
14 |
4,07 |
4,66 |
5,63 |
6,57 |
7,79 |
13,34 |
21,06 |
23,68 |
26,12 |
29,14 |
31,32 |
15 |
4,60 |
5,23 |
6,26 |
7,26 |
8,55 |
14,34 |
22,31 |
25,00 |
27,49 |
30,58 |
32,80 |
16 |
5,14 |
5,81 |
6,91 |
7,96 |
9,31 |
15,34 |
23,54 |
26,30 |
28,85 |
32,00 |
34,27 |
17 |
5,70 |
6,41 |
7,56 |
8,67 |
10,09 |
16,34 |
24,77 |
27,59 |
30,19 |
33,41 |
35,72 |
18 |
6,26 |
7,01 |
8,23 |
9,39 |
10,86 |
17,34 |
25,99 |
28,87 |
31,53 |
34,81 |
37,16 |
19 |
6,84 |
7,63 |
8,91 |
10,12 |
11,65 |
18,34 |
27,20 |
30,14 |
32,85 |
36,19 |
38,58 |
20 |
7,43 |
8,26 |
9,59 |
10,85 |
12,44 |
19,34 |
28,41 |
31,41 |
34,17 |
37,57 |
40,00 |
p → |
0,005 |
0,01 |
0,025 |
0,05 |
0,1 |
0,5 |
0,9 |
0,95 |
0,975 |
0,99 |
0,995 |
21 |
8,03 |
8,90 |
10,28 |
11,59 |
13,24 |
20,34 |
29,62 |
32,67 |
35,48 |
38,93 |
41,40 |
22 |
8,64 |
9,54 |
10,98 |
12,34 |
14,04 |
21,34 |
30,81 |
33,92 |
36,78 |
40,29 |
42,80 |
23 |
9,26 |
10,20 |
11,69 |
13,09 |
14,85 |
22,34 |
32,01 |
35,17 |
38,08 |
41,64 |
44,18 |
24 |
9,89 |
10,86 |
12,40 |
13,85 |
15,66 |
23,34 |
33,20 |
36,42 |
39,36 |
42,98 |
45,56 |
25 |
10,52 |
11,52 |
13,12 |
14,61 |
16,47 |
24,34 |
34,38 |
37,65 |
40,65 |
44,31 |
46,93 |
26 |
11,16 |
12,20 |
13,84 |
15,38 |
17,29 |
25,34 |
35,56 |
38,89 |
41,92 |
45,64 |
48,29 |
27 |
11,81 |
12,88 |
14,57 |
16,15 |
18,11 |
26,34 |
36,74 |
40,11 |
43,19 |
46,96 |
49,65 |
28 |
12,46 |
13,56 |
15,31 |
16,93 |
18,94 |
27,34 |
37,92 |
41,34 |
44,46 |
48,28 |
50,99 |
29 |
13,12 |
14,26 |
16,05 |
17,71 |
19,77 |
28,34 |
39,09 |
42,56 |
45,72 |
49,59 |
52,34 |
30 |
13,79 |
14,95 |
16,79 |
18,49 |
20,60 |
29,34 |
40,26 |
43,77 |
46,98 |
50,89 |
53,67 |