Aus dem Kurs: Statistik-Grundlagen 2: Mehrere Variablen und Wahrscheinlichkeiten

Kontingenztabellen mit bedingten Verteilungen: Beispiele in R – Tutorial zu R

Aus dem Kurs: Statistik-Grundlagen 2: Mehrere Variablen und Wahrscheinlichkeiten

Kontingenztabellen mit bedingten Verteilungen: Beispiele in R

Schauen wir uns in diesem Video an, wie wir bedingte relative Häufigkeitsverteilungen mit R berechnen. Ausgehend von unserer Kontingenztabelle können wir mit prop.table ein zusätzliches Argument wählen, und zwar margin=1, um unsere relativen Häufigkeiten bedingt auf die Zeilensumme zu bilden. Das heißt, jede Zeile addiert sich nun zu 100 % und wir betrachten die Passagiere, die nicht überlebt haben, bzw. die Passagiere, die überlebt haben, einzeln als einzelne Gruppen und können sagen, von den Passagieren, die überlebt haben, 61 % sind in Southampton zugestiegen, 30 % in Cherbourg. Wir können mit dem Argument margin=2 auch auf die Spalte bedingen. Nun ergibt dann jede Spalte die Summe 100 %. Und wenn wir nur die Passagiere aus Southampton betrachten, haben 66 % nicht überlebt und 33 % überlebt. Betrachten wir die Passagiere aus Cherbourg, haben davon 44 % nicht überlebt und 55 % überlebt. Für die Funktion CrossTable gibt es Parameter, die wir für die bedingte relative Häufigkeit anpassen. Das ist einmal prop.r, wenn wir auf der Zeile das berechnen wollen. Wir sehen es auch hier, unter dem Reiter Hilfe habe ich jetzt die Funktion eingegeben und dann sehen wir die Argumente prop.r, dass die "row proportions" miteinbezogen sind, das heißt, sozusagen die relativen Häufigkeiten bedingt auf die Zeile. Wir sehen hier, die drei Werte ergeben 100 % und insgesamt gab es 61 % aller Passagiere, die die Ausprägung "survived=0" hatten und 38 % aller Passagiere hatten die Ausprägung "survived=1". Wollen wir auf die Spalte bedingen, so müssen wir das Argument prop.c hernehmen. prop.c steht für: "Column proportions will be included". Dann sehen wir, dass die beiden Werte pro Spalte sich zu 100 % addieren und beim Column Total sehen wir sozusagen auch jeweils, 20 % aller Passagiere waren aus Cherbourg, 9,4 % aus Queenstown und fast 70 % aus Southampton. Schauen wir uns ein weiteres Beispiel an. Wir nehmen die Daten von "survived" und vom "gender", machen daraus eine Kontingenztabelle, die können wir uns auch anschauen, und dann mit prop.table bedingt auf die Spalten, weil wir haben das Argument hinten 2, sehen wir, dass die Spalten jeweils sich zu 100 % addieren. Das bedeutet, unter allen weiblichen Passagieren haben 27 % nicht überlebt und 72 % überlebt. Unter allen männlichen Passagieren haben 80 % nicht überlebt und 19 % überlebt. Bedingen wir es auf die Zeile, so sehen wir, dass von allen Passagieren, die nicht überlebt haben, 15 % waren Frauen und 84 % waren männlich. Von allen Passagieren, wenn wir nur die Passagiere betrachten, die überlebt haben, waren zwei Drittel weiblich und ein Drittel männlich. Wir haben in diesem Video gesehen, wie wir mit der Funktion prop.table mit dem zusätzlichen Argument margins 2 oder 1, die bedingten relativen Häufigkeiten in einer Kontingenztabelle berechnen können.

Inhalt