Der Spearman'sche Rangkorrelationskoeffizient

Autor: Leandro Alegsa

03-11-2020 00:00

In Mathematik und Statistik ist der Spearman'sche Rangkorrelationskoeffizient ein Korrelationsmaß, benannt nach seinem Schöpfer, Charles Spearman. Er wird kurz als der griechische Buchstabe rho ( ρ {\displaystyle \rho } $\rho$ ) oder manchmal als r s {\displaystyle r_{s}} geschrieben. $r_{s}$ . Es ist eine Zahl, die zeigt, wie eng zwei Datensätze miteinander verknüpft sind. Sie kann nur für Daten verwendet werden, die geordnet werden können, z.B. vom höchsten zum niedrigsten Wert.

Die allgemeine Formel für r s {\darstellungsstil r_{s}} $r_{s}$ lautet ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\darstellungsstil \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\darstellungsstil \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)} $\rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}$ .

Wenn Sie z.B. Daten darüber haben, wie teuer verschiedene Computer sind, und Daten darüber, wie schnell die Computer sind, könnten Sie mit Hilfe des r s {\Anzeigestils r_{s}} sehen, ob sie miteinander verbunden sind und wie eng sie miteinander verbunden sind. $r_{s}$ .

Es ausarbeiten

Erster Schritt

Um r s {\Anzeigestil r_{s}} $r_{s}$ auszuarbeiten, müssen Sie zunächst eine Rangfolge der einzelnen Daten erstellen. Wir werden das Beispiel aus dem Intro von Computern und ihrer Geschwindigkeit verwenden.

Der Computer mit dem niedrigsten Preis wäre also auf Platz 1. Der Computer mit dem höheren Preis hätte Platz 2. Dann geht er nach oben, bis alles auf Rang 1 ist. Dies müssen Sie mit beiden Datensätzen tun.

PC	Preis ($)	R a n k 1 {\Anzeigestil Rang_{1}} $Rank_{1}$	Geschwindigkeit (GHz)	R a n k 2 {\Anzeigestil Rang_{2}} $Rank_{2}$
A	200	1	1.80	2
B	275	2	1.60	1
C	300	3	2.20	4
D	350	4	2.10	3
E	600	5	4.00	5

Zweiter Schritt

Als nächstes müssen wir den Unterschied zwischen den beiden Rängen herausfinden. Dann multipliziert man die Differenz mit sich selbst, was man Quadrieren nennt. Die Differenz wird d {\Anzeigeart d} $d$ genannt, und die Zahl, die man erhält, wenn man d {\Anzeigeart d} quadriert, $d$ wird d 2 {\Anzeigeart d^{2}} genannt. $d^{2}$ .

R a n k 1 {\Anzeigestil Rang_{1}} $Rank_{1}$	R a n k 2 {\Anzeigestil Rang_{2}} $Rank_{2}$	d {\Anzeigestil d} $d$	d 2 {\Anzeigestil d^{2}} $d^{2}$
1	2	-1	1
2	1	1	1
3	4	-1	1
4	3	1	1
5	5	0	0

Dritter Schritt

Zählen Sie, wie viele Daten wir haben. Diese Daten haben die Ränge 1 bis 5, wir haben also 5 Daten. Diese Zahl wird n {\Anzeigestil n} genannt.

Vierter Schritt

Verwenden Sie schließlich alles, was wir bisher in dieser Formel ausgearbeitet haben: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}} $r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}$ .

∑ d 2 {\displaystyle \sum d^{2}} $\sum d^{2}$ bedeutet, dass wir die Summe aller Zahlen nehmen, die sich in der Spalte d 2 {\displaystyle d^{2}} befanden $d^{2}$ . Dies liegt daran, dass ∑ {\displaystyle \sum }Total bedeutet. $\sum$

Also, ∑ d 2 {\displaystyle \sum d^{2}} $\sum d^{2}$ ist 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1+1} $1+1+1+1$ was 4 ist. Die Formel besagt, dass sie mit 6 multipliziert werden muss, was 24 ist.

n ( n 2 - 1 ) {\Anzeigestil n(n^{2}-1)} $n(n^{2}-1)$ ist 5 × ( 25 - 1 ) {\Anzeigestil 5\mal (25-1)} $5\times (25-1)$ , was 120 ist.

Also, um den r s {\Anzeigestil r_{s}} herauszufinden $r_{s}$ machen wir einfach 1 - 24 120 = 0,8 {\displaystyle 1-{\cfrac {24}{120}}}=0,8} $1-{\cfrac {24}{120}}=0.8$ .

Daher beträgt der Spearman'sche Rangkorrelationskoeffizient für diesen Datensatz 0,8.

Was die Zahlen bedeuten

r s {\Darstellungsstil r_{s}} $r_{s}$ gibt immer eine Antwort zwischen -1 und 1. Die Zahlen dazwischen sind wie eine Skala, wobei -1 eine sehr starke Verbindung, 0 keine Verbindung und 1 ebenfalls eine sehr starke Verbindung ist. Der Unterschied zwischen 1 und -1 besteht darin, dass 1 eine positive Korrelation und -1 eine negative Korrelation ist. Ein Datendiagramm mit einem r s {\Darstellungsstil r_{s}} $r_{s}$ Wert von -1 würde wie das gezeigte Diagramm aussehen, außer dass die Linie und die Punkte von links oben nach rechts unten gehen würden.

Zum Beispiel war für die Daten, die wir oben gemacht haben, der r s {\Darstellungsstil r_{s}} $r_{s}$ 0,8. Dies bedeutet also, dass es eine positive Korrelation gibt. Da sie nahe bei 1 liegt, bedeutet dies, dass die Verbindung zwischen den beiden Datensätzen stark ist. Wir können also sagen, dass diese beiden Datensätze miteinander verknüpft sind und gemeinsam nach oben gehen. Bei einem Wert von -0,8 könnte man sagen, dass eine Verbindung besteht, und wenn der eine Wert steigt, geht der andere nach unten.

Dieses Streudiagramm weist eine positive Korrelation auf. Der r s {\Darstellungsstil r_{s}} $r_{s}$ Wert würde nahe 1 oder 0,9 liegen. Die rote Linie ist eine Linie der besten Anpassung.

Wenn zwei Zahlen gleich sind

Beim Ranking von Daten gibt es manchmal zwei oder mehr Zahlen, die gleich sind. Wenn dies im r s {\Anzeigestil r_{s}} geschieht $r_{s}$ nehmen wir den Mittelwert oder den Durchschnitt der Ränge, die gleich sind. Diese Ränge werden als Gleichstand bezeichnet. Dazu ordnen wir die gleichrangigen Zahlen so an, als ob sie nicht gleichrangig wären. Dann addieren wir alle Ränge, die sie haben würden, und dividieren sie durch die Anzahl der Ränge. Nehmen wir zum Beispiel an, wir würden bewerten, wie gut verschiedene Personen in einem Rechtschreibtest abgeschnitten haben.

Testergebnis	Rang	Rang (bei Gleichstand)
4	1	1
6	2	2 + 3 + 4 3 = 3 {\Anzeigestil {\tfrac {2+3+4}{3}}}=3} ${\tfrac {2+3+4}{3}}=3$
6	3	2 + 3 + 4 3 = 3 {\Anzeigestil {\tfrac {2+3+4}{3}}}=3} ${\tfrac {2+3+4}{3}}=3$
6	4	2 + 3 + 4 3 = 3 {\Anzeigestil {\tfrac {2+3+4}{3}}}=3} ${\tfrac {2+3+4}{3}}=3$
8	5	5 + 6 2 = 5,5 {\darstellungsstil {\tfrac {5+6}{2}}}=5,5} ${\tfrac {5+6}{2}}=5.5$
8	6	5 + 6 2 = 5,5 {\darstellungsstil {\tfrac {5+6}{2}}}=5,5} ${\tfrac {5+6}{2}}=5.5$

Diese Zahlen werden genau wie normale Dienstgrade verwendet.

Fragen und Antworten

F: Was ist der Spearman'sche Rangkorrelationskoeffizient?

A: Der Spearman'sche Rangkorrelationskoeffizient ist ein Maß für die Korrelation, das zeigt, wie eng zwei Datensätze miteinander verbunden sind. Er kann nur für Daten verwendet werden, die in eine Reihenfolge gebracht werden können, z.B. vom höchsten zum niedrigsten Wert.

F: Wer hat den Spearmanschen Rangkorrelationskoeffizienten entwickelt?

A: Charles Spearman hat den Spearman'schen Rangkorrelationskoeffizienten entwickelt.

F: Wie lautet die allgemeine Formel für den Rangkorrelationskoeffizienten von Spearman?

A: Die allgemeine Formel für den Spearman'schen Rangkorrelationskoeffizienten lautet ρ = 1 - 6∑d2/n(n2-1).

Q: Wann sollten Sie den Rangkorrelationskoeffizienten von Spearman verwenden?

A: Sie sollten den Rangkorrelationskoeffizienten von Spearman verwenden, wenn Sie sehen möchten, wie eng zwei Datensätze miteinander verbunden sind und ob sie überhaupt miteinander verbunden sind.

F: Mit welcher Art von Daten funktioniert er?

A: Er funktioniert mit jeder Art von Daten, die in eine Reihenfolge gebracht werden können, z.B. von der höchsten zur niedrigsten.

F: Können Sie ein Beispiel nennen, wo Sie diese Maßnahme einsetzen würden?

A: Ein Beispiel für die Verwendung dieses Maßes wäre, wenn Sie Daten darüber haben, wie teuer verschiedene Computer sind, und Daten darüber, wie schnell die Computer sind, dann können Sie mit r_s sehen, ob sie miteinander verbunden sind und wie eng sie verbunden sind.

Suche in der Enzyklopädie