Ein kleines Beispiel zum Rangkorrelationskoeffizienten
Bei der Rangkorrelation werden statt der Werte die Ränge der Werte zur Berechnung herangezogen.
Beispiel:
Es seien die folgenden Datenpunkte gegeben:
x | 0.15 | 2.91 | 4.2 | 3.63 | 4.88 | 7.80 | 8.70 | 4.96 | 6.71 | 10.06 |
y | 1.38 | 4.30 | 7.9 | 14.87 | 22.20 | 36.72 | 49.94 | 63.77 | 82.76 | 100.12 |
Das Streudiagramm dieser Daten sieht dann so aus:
Der Korrelationskoeffizient ist nun:
\[r = r_{BP} = 0.7944953\]
Schauen wir uns nun die Werte der Tabelle mit ihrem Rang an:
x | 0.15 | 2.91 | 4.2 | 3.63 | 4.88 | 7.80 | 8.70 | 4.96 | 6.71 | 10.06 |
y | 1.38 | 4.30 | 7.9 | 14.87 | 22.20 | 36.72 | 49.94 | 63.77 | 82.76 | 100.12 |
rx | 1.00 | 2.00 | 4.0 | 3.00 | 5.00 | 8.00 | 9.00 | 6.00 | 7.00 | 10.00 |
ry | 1.00 | 2.00 | 3.0 | 4.00 | 5.00 | 6.00 | 7.00 | 8.00 | 9.00 | 10.00 |
Das Streudiagramm der Ränge sieht nun wie folgt aus:
Und der Korrelationskoeffizient der Ränge ist nun:
\[r_{sp} = r_{ry,rx}=0.8909091\]
Dieser Korrelationskoeffizient der Ränge wird Rangkorrelationkoeffizient genannt.
Aber Vorsicht: Die Ränge anstatt der Werte in die Formel für den Korrelationskoeffizienten einzusetzen funktioniert nur, wenn jeder Wert genau einmal vorkommt!
Um das zu sehen, modifizieren wir unser Beispiel, so dass an zwei Stellen die Werte doppelt vorkommen. Wir erhalten damit die folgende, neue Tabelle:
x | 0.15 | 2.91 | 3.63 | 3.63 | 4.88 | 7.80 | 8.70 | 4.96 | 6.71 | 10.06 |
y | 1.38 | 4.30 | 7.90 | 22.20 | 22.20 | 36.72 | 49.94 | 63.77 | 82.76 | 100.12 |
rx | 1.00 | 2.00 | 3.00 | 4.00 | 5.00 | 8.00 | 9.00 | 6.00 | 7.00 | 10.00 |
ry | 1.00 | 2.00 | 3.00 | 4.00 | 5.00 | 6.00 | 7.00 | 8.00 | 9.00 | 10.00 |
Bevor wir nun einfach die Ränge so in die Formel für den Korrelationskoeffizienten (nach Pearson) einsetzen können, müssen wir noch etwas beachten, was die Definition von Rängen angeht. Denn dort steht im Kleingedruckten folgendes:
Den ranggleichen Beobachtungen wird das arithmetische Mittel der auf sie fallenden Ränge zugeordnet!
Darum müssen wir die Ränge noch etwas korrigieren und erhalten:
x | 0.15 | 2.91 | 3.63 | 3.63 | 4.88 | 7.80 | 8.70 | 4.96 | 6.71 | 10.06 |
y | 1.38 | 4.30 | 7.90 | 22.20 | 22.20 | 36.72 | 49.94 | 63.77 | 82.76 | 100.12 |
rx | 1.00 | 2.00 | 3.50 | 3.50 | 5.00 | 8.00 | 9.00 | 6.00 | 7.00 | 10.00 |
ry | 1.00 | 2.00 | 3.00 | 4.50 | 4.50 | 6.00 | 7.00 | 8.00 | 9.00 | 10.00 |
Nun können wir von den Rängen wieder “ganz normal” den Korrelationskoeffizienten berechnen und erhalten: \[r_{sp} = r_{ry,rx} = 0.8932927\]