Chi-Quadrat Verfahren

 

 

Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige  Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz  von  Chi-Quadrattechniken ist der Vergleich von beobachteten (ausgezählten) Häufigkeiten mit theoretisch erwarteten Häufigkeiten.

 

Dazu zwei Anwendungen:

 

1) Der Vergleich einer empirischen Verteilung mit einer theoretischen Verteilung (= Goodness-of-fit-Test)

2) 2 x 2 Felder-Tafeln

 

Ad 1)

 

Denken  Sie zurück an unsere ersten Beispiele, die wir in der Statistik I im vergangenen WS behandelt haben.  Wir  haben gleich zu Beginn des WS  kontiuierliche, intervallskalierte  Daten  durch Klassenbildung  auf  ein Nominalskalenniveau  reduziert  und  anschließend die Häufigkeiten der verschiedenen Klassen bzw.  Kategorien ausgezählt.

Nehmen  wir an, in einem konkreten Fall  lägen folgende Altersklassen vor: Die Klasse 1 umfasse alle 0-10 jährigen, Klasse 2  alle 11-20 jährigen, Klasse 3 alle 21 - 30 jährigen, Klasse 4 alle  31 bis 40 jährigen, Klasse 5 alle 41 bis 50 jährigen, Klasse 6  alle 51  bis 60 jährigen, Klasse 7 alle 61 bis 70 jährigen,  Klasse  8 alle 71 bis alle darüber (71 oder mehr).

 

Für  die diese Altersklassen wurden die Häufigkeiten ausgezählt:

 

Intervall

Beobachtete Häufigkeiten

0-10 Jahre

13  

11-20

7

21-30

12

31-40

17

41-50

15

51-60

13

61-70

7

71-darüber

6

 

 

Um nun  aber  irgendwelche inferenzstatistische Schlüsse  ziehen zu können,  müssen  wir diese Häufigkeiten  mit  nach  bestimmten Kriterien erwarteten Häufigkeiten vergleichen.

So wollen wir beispielsweise wissen, ob  die  vorliegende Häufigkeitsverteilung einer  Normalverteilung entspricht.  (Dies ein spezieller  Goodness-of-fit-Test)

 

Man vergleicht hierzu die folgenden Häufigkeiten:

 

Intervall

Beobachtete Häufigkeit

Erwartete Häufigkeit

Erwartete Prozent

 

 

 

(bei Normalverteilung)

0-10 Jahre

13 

9,54   

10,6%

11-20

7

9,99  

11,1%

21-30 

12

14,13 

15,7%

31-40

17 

16,29

18,1%

41-50

15

15,57

17,3%

51-60

13 

11,52

12,8%

61-70 

7,20 

8%

71-darüber 

6

5,49

6,1%

 

 

Die erwarteten Häufigkeiten werden berechnet, indem man die  Kategoriengrenzen  z-transformiert (Mittelwert und Standardabweichung werden aus den gruppierten Daten berechnet) und die Fläche zwischen den  Grenzen mit  Hilfe  der Standardnormalverteilungstabelle  ausrechnet.  So sind  beispielsweise in den Grenzen von 0-10 10,6%  aller  Fälle, wenn  die  Daten normalverteilt sind. Da  die  Gesamthäufigkeiten gleich  90 sind, erwarten wir in diesem Intervall 10,6%  von  90. Dies sind 9,54.

Einen solchen Vergleich von beobachteten und erwarteten Häufigkeiten findet man oft in der Statistik. Stellen Sie sich ein Kollektiv  vor  mit 20% weiblichen und 80% männlichen  Studenten (beispielsweise ein Kurs in Mathematik). Nun seien in der Gesamtbevölkerung  50%  weiblichen und 50% männlichen Geschlechts.  Auch  in diesem Beispiel können Sie die erwarteten Häufigkeiten berechnen, indem Sie einfach ausrechnen, welche Häufigkeiten Sie in Ihrem Kollektiv erwarten, wenn  50% männlich und 50% weiblich sind. Besteht der Kurs aus beispielsweise 40 Stundenten, so erwarten  wir  aufgrund  der Bevölkerungsstatistik 20  Frauen  und  20 Männer.

In jedem Falle werden bei den Chi-Quadratverfahren die Abweichungen der beobachteten von den erwarteten Häufigkeiten untersucht.

 Die gesuchte Prüfgröße ist das so genannte Chi-Quadrat. Wir erhalten  diese  Prüfgröße, indem wir zunächst  die  Abweichung  jeder beobachteten  Häufigkeit  zur  erwarteten  Häufigkeit  berechnen, diese  Abweichung quadrieren und durch die  erwartete  Häufigkeit dividieren.  Die  Summe der quadrierten und jeweils  durch  die erwarteten Häufigkeiten dividierten Abweichungen ist der gesuchte Chi-Quadratwert.

 

 

Sind die beobachteten Häufigkeiten mit den erwarteten  Häufigkeiten identisch, so ist unser Chi-Quadrat gleich Null.

 

Zu unserem Beispiel: (13 – 9.54)2 / 9.54 = 1.25

(7 – 9.99)2 / 9.99 = 0.89

usw.

 

Dies ergibt in der Summe: 2.77

 

Für die Signifikanzprüfung müssen wir in der entsprechenden  Chi-Quadrat-Tabelle nachschlagen. Dazu benötigen wir noch die  Anzahl der Freiheitsgrade für die Prüfgröße Chi-Quadrat:

 Freiheitsgrade:  Die Anzahl der Summanden, die in die  Berechnung des Chi-Quadrat einfließen, ist in unserem Falle gleich 8. Da die Summe der beobachteten Häufigkeiten gleich sein muss der Summe der erwarteten  Häufigkeiten, steht ein Summand von vornherein  fest. Die Anzahl der Freiheitsgrade reduziert sich daher um eins.

 Unser spezielles Beispiel weicht aber insofern von anderen Goodness-of-Fit-Verfahren noch in zwei Hinsichten ab:

a) Da wir in diesem speziellen Falle die erwarteten  Häufigkeiten über  die z-Transformation gewonnen haben, sind diese  erwarteten Häufigkeiten zusätzlich noch durch den Mittelwert und die Streuung der beobachteten Häufigkeiten festgelegt. Wir haben die  erwarteten Häufigkeiten geschätzt, indem wir Mittelwert und Streuung der beobachteten  Häufigkeiten verwendet haben. Wir müssen in  diesem speziellen  Falle zusätzlich noch zwei  Freiheitsgrade  abziehen. Das ergibt insgesamt 8 -1-2 = 5 Freiheitsgrade.

b)  Die Nullhypothese besagt, dass die  beobachteten  Häufigkeiten sich  nicht  von den erwarteten Häufigkeiten  unterscheiden.  Bei einem  Test  zur Überprüfung der Normalverteilung sind  wir  aber gerade  an der Nullhypothese interessiert. Normalerweise  ist  es umgekehrt:  Wir  sind normalerweise  an  der  Alternativhypothese interessiert,  wir  wollen beispielsweise wissen,  ob  sich  zwei Stichproben  unterscheiden.  Um die  Entscheidung  zugunsten  der Alternativhypothese sozusagen 'wasserdicht' zu machen, wählen wir einen  möglichst  kleinen α-Fehler. (p= 0,05 oder  gar  0,01)  Im speziellen  Falle einer Normalverteilungsüberprüfung  wollen  wir dahingegen umgekehrt das Risiko, fälschlicherweise die  Nullhypothese beizubehalten, möglichst klein halten. Wir müssen uns  also gegen  den ß-Fehler absichern. Dies tun wir, indem wir eine  möglichst große Irrtumswahrscheinlichkeit wählen. Beispielsweise ein Signifikanzniveau von 0,1.

Wir  entnehmen bei einer Fläche von 0,90 und bei 5 Freiheitsgraden einen kritischen  Chi-Quadratwert von 9,24 (siehe unten aufgelistete Tabelle).

Da  unser  errechneter Chi-Quadratwert weit kleiner ist  als  der kritische Wert, können wir die Nullhypothese nicht verwerfen. Das bedeutet im vorliegenden Falle, dass wir von einer Normalverteilung ausgehen können.

 

Bei allen anderen Goodness-of-Fit Verfahren gilt unser  Interesse aber  der Alternativhypothese. Wir wollen beispielsweise  wissen, ob  sich die Altersklassen in einem Sample von den  Altersklassen in  der Population unterscheiden. Oft werden einfach  beobachtete Häufigkeiten  mit vorgegebenen Prozentanteilen verglichen.  (Vergleich  der Verteilung des Geschlechts in einem Sample im  Unterschied zur Verteilung in der Population; Vergleich der Verteilung von Altersgruppen im Unterschied zur Population etc.)

Die  Freiheitsgrade sind in all diesen Fällen einfach die  Anzahl der in den Chi-quadratwert eingehenden Summanden - 1.

Das Signifikanzniveau ist in diesem Falle 5% (signifikant) oder 1% (h0ch signifikant).

Handelt  es sich also bei dem oben verwendeten Beispiel um  einen Vergleich  von Altersklassen in einem Sample mit Altersklassen  in einer  Population, so bestimmen wir den  kritischen  Chi-quadrat-Wert wie folgt:

Der Tabelle entnehmen wir bei einer Fläche von 0,95 und bei 7 Freiheitsgraden einen kritischen  Chi-Quadratwert von 14,07.

Da  unser  errechneter Chi-quadratwert weit kleiner ist  als  der kritische Wert, können wir die Nullhypothese nicht verwerfen.


 

2) 2 x 2 Felder Tafel

 

Häufig werden Chi-Quadratverfahren bei so genannten  zweidimensionalen Häufigkeitstabellen (auch Kreuztabellen genannt) verwendet.

Dies  ist  dann der Fall, wenn  eine  Häufigkeitsverteilung  nach einem zweiten Kriterium nochmals untergliedert wird.

Betrachten wir hierzu als Beispiel eine typische 2 x 2  Feldertafel:

 

 

 

Geschlecht

 

 

 

 

männlich

 

weiblich

 

 

Ja

25

 

10

35

 

 

 

 

 

 

Brillenträger

Nein

35

 

30

65

 

 

60

 

40

100

 

 

                               

Zur  Erklärung: 35; 65; 60; 40 sind die so genannten Randsummen. Wir haben  in dieser  Stichprobe also 35% Brillenträger und 65 %  ohne  Brille. Das Geschlecht verteilt sich zu 60 % männlich und 40 % weiblich.

 

Die Nullhypothese lautet in diesem Falle: Das Merkmal "Geschlecht" ist in seiner  Verteilung unabhängig vom Merkmal "Brillenträger".

 Alternativhypothese: Die beiden Merkmale sind nicht unabhängig.

 

Für  die Verteilung der beiden Merkmale haben wir nur unser  Sample.  Welche  Häufigkeiten  können wir also  erwarten,  wenn  die beiden  Merkmale  unabhängig sind, wenn  also  die  Nullhypothese zutrifft?  Wir  schätzen diese erwarteten  Häufigkeiten  aus  den Randsummen.

Beispiel:  Sind Geschlecht und Fehlsichtigkeit voneinander  unabhängig, so müssten von den insgesamt 60 % Männern 35 % Brillenträger  sein.  Für  die  Merkmalskombination  Männlich/Brillenträger erwarten  wir  die relative Häufigkeit: .

 ergibt daraus dann die erwartete Häufigkeit, also 21.

 

Allgemein berechnen wir die erwartete Häufigkeit nach der Formel:

 

 

Fassen  wir die beobachteten und erwarteten Häufigkeiten  in  dem gegebenen Beispiel wie folgt zusammen:

 

fb

fe

25

21

10

14

35

39

30

26

 

 

Quadrieren  wir  die Differenz von  beobachteten  und  erwarteten Häufigkeiten,  dividieren sie durch die  erwarteten  Häufigkeiten und bilden die Summe, so erhalten wir die Prüfgröße Chi-quadrat.

Dies ist: (25 - 21)2 / 21 + (10 - 14)2 / 14  + (35-39)2 / 39 + (30-26)2 / 26 =

 2.930

 

Zur inferenzstatistischen  Absicherung dieses Chiquadrat benötigen wir die Anzahl der  Freiheitsgrade. Diese bestimmen wir wie folgt:

Da die Wahrscheinlichkeiten für die Merkmalskombinationen aus den Randsummen  geschätzt  werden, haben wir  Freiheitsgrade.  k und l sind die Anzahl der Ausprägungen der  beiden Merkmale.  Diese Anzahl beträgt im Falle einer 4 - Felder-Tafel  jeweils  2. Die Freiheitsgrade bei einer 4 - Felder-Tafel sind demnach insgesamt 1!

 

Chi-quadrat  kritisch  auf dem 5 %  Signifikanzniveau  ist  gemäß unten stehender Tabelle 3.84.

Das Ergebnis ist demnach nicht signifikant. Das Merkmal  Brillenträger ist in der Verteilung unabhängig vom Merkmal Geschlecht.

 

Voraussetzungen des Tests:

 

Die erwarteten Häufigkeiten pro Zelle sollten mindestens gleich 5 sein.

 

 

Tabelle der Chi-Quadrat-Verteilung

From Wikibooks

Quantile der Chi-Quadrat-Verteilung nach ausgewählten Wahrscheinlichkeiten p und Freiheitsgraden

 

Wahrscheinlichkeit p

Freiheitsgrade

0,005

0,01

0,025

0,05

0,1

0,5

0,9

0,95

0,975

0,99

0,995

1

0,00

0,00

0,00

0,00

0,02

0,45

2,71

3,84

5,02

6,63

7,88

2

0,01

0,02

0,05

0,10

0,21

1,39

4,61

5,99

7,38

9,21

10,60

3

0,07

0,11

0,22

0,35

0,58

2,37

6,25

7,81

9,35

11,34

12,84

4

0,21

0,30

0,48

0,71

1,06

3,36

7,78

9,49

11,14

13,28

14,86

5

0,41

0,55

0,83

1,15

1,61

4,35

9,24

11,07

12,83

15,09

16,75

6

0,68

0,87

1,24

1,64

2,20

5,35

10,64

12,59

14,45

16,81

18,55

7

0,99

1,24

1,69

2,17

2,83

6,35

12,02

14,07

16,01

18,48

20,28

8

1,34

1,65

2,18

2,73

3,49

7,34

13,36

15,51

17,53

20,09

21,95

9

1,73

2,09

2,70

3,33

4,17

8,34

14,68

16,92

19,02

21,67

23,59

10

2,16

2,56

3,25

3,94

4,87

9,34

15,99

18,31

20,48

23,21

25,19

p →

0,005

0,01

0,025

0,05

0,1

0,5

0,9

0,95

0,975

0,99

0,995

11

2,60

3,05

3,82

4,57

5,58

10,34

17,28

19,68

21,92

24,73

26,76

12

3,07

3,57

4,40

5,23

6,30

11,34

18,55

21,03

23,34

26,22

28,30

13

3,57

4,11

5,01

5,89

7,04

12,34

19,81

22,36

24,74

27,69

29,82

14

4,07

4,66

5,63

6,57

7,79

13,34

21,06

23,68

26,12

29,14

31,32

15

4,60

5,23

6,26

7,26

8,55

14,34

22,31

25,00

27,49

30,58

32,80

16

5,14

5,81

6,91

7,96

9,31

15,34

23,54

26,30

28,85

32,00

34,27

17

5,70

6,41

7,56

8,67

10,09

16,34

24,77

27,59

30,19

33,41

35,72

18

6,26

7,01

8,23

9,39

10,86

17,34

25,99

28,87

31,53

34,81

37,16

19

6,84

7,63

8,91

10,12

11,65

18,34

27,20

30,14

32,85

36,19

38,58

20

7,43

8,26

9,59

10,85

12,44

19,34

28,41

31,41

34,17

37,57

40,00

p →

0,005

0,01

0,025

0,05

0,1

0,5

0,9

0,95

0,975

0,99

0,995

21

8,03

8,90

10,28

11,59

13,24

20,34

29,62

32,67

35,48

38,93

41,40

22

8,64

9,54

10,98

12,34

14,04

21,34

30,81

33,92

36,78

40,29

42,80

23

9,26

10,20

11,69

13,09

14,85

22,34

32,01

35,17

38,08

41,64

44,18

24

9,89

10,86

12,40

13,85

15,66

23,34

33,20

36,42

39,36

42,98

45,56

25

10,52

11,52

13,12

14,61

16,47

24,34

34,38

37,65

40,65

44,31

46,93

26

11,16

12,20

13,84

15,38

17,29

25,34

35,56

38,89

41,92

45,64

48,29

27

11,81

12,88

14,57

16,15

18,11

26,34

36,74

40,11

43,19

46,96

49,65

28

12,46

13,56

15,31

16,93

18,94

27,34

37,92

41,34

44,46

48,28

50,99

29

13,12

14,26

16,05

17,71

19,77

28,34

39,09

42,56

45,72

49,59

52,34

30

13,79

14,95

16,79

18,49

20,60

29,34

40,26

43,77

46,98

50,89

53,67