Tücken von Korrelationen: die Korrelationskoeffizienten von Pearson und Spearman
Author(s) -
U Held
Publication year - 2010
Publication title -
swiss medical forum ‒ schweizerisches medizin-forum
Language(s) - German
Resource type - Journals
eISSN - 1424-4020
pISSN - 1424-3784
DOI - 10.4414/smf.2010.07285
Subject(s) - medicine
In der klinischen Forschung werden häufig mehrere Pa rameter, wie z.B. das Gewicht und der systolische Blut druck, an den Patienten gemessen. Zusätzlich zu der separaten Beschreibung jeder einzelnen Datenreihe, auch Variable genannt, ist es oft interessant zu unter suchen, ob es zwischen zwei Variablen Zusammenhänge gibt. Es kann z.B. interessieren, wie die eine Variable sich verhält, sobald die andere fällt oder steigt, wie die Art des Zusammenhangs ist und ob man den Zusam menhang quantifizieren kann, d.h., ob man Stärke und Richtung des Zusammenhangs angeben kann. Je nach dem, ob es sich um metrische (z.B. systolischer Blutdruck) oder ordinale (z.B. die Befindlichkeit gemessen auf einer Skala von 1 bis 7) Variablen handelt, gibt es unterschied liche Zusammenhangs oder Assoziationsmasse, die ver wendet werden können. Anders als bei der linearen Re gression ist die Festlegung einer Variablen als Ziel und der anderen als Einflussgrösse nicht notwendig. Wir betrachten hierzu wieder das fiktive Beispiel, welches wir bereits in Artikel «Wissenschaftliche Fragestellungen in der Medizin brauchen statistische Modelle»1 herangezo gen hatten: An 20 Patienten wurden der systolische Blut druck und das Gewicht gemessen, und die Beobachtungen sind in Tabelle 1 p dargestellt. Es ist zu erkennen, dass bei dem Patienten mit der Num mer 6 ein fehlender Wert in der Variablen Gewicht vorliegt und bei Patient 8 ein fehlender Wert im systolischen Blut druck. Bevor man mit der Berechnung von Zusammenhangs massen, wie z.B. dem Korrelationskoeffizienten für zwei metrische Variablen, beginnt, sollte man die vorliegenden zwei Messreihen graphisch in einem sogenannten Streudiagramm (engl. Scatterplot) darstellen. Für die graphi sche Darstellung der zwei Messreihen sowie auch für die Berechnung des Korrelationskoeffizienten gilt, dass nur vollständige Beobachtungspaare verwendet werden kön nen. Für unseren Beispieldatensatz bedeutet dies also, dass nur 18 Beobachtungspaare eingehen und die einzel nen Beobachtungen einer Person, für die der zweite Wert fehlt, aus der Analyse ausgeschlossen werden müssen (hier Patienten Nummer 6 und 8). Man sollte sicherstellen, dass das Fehlen von Werten unabhängig von ihrem Wert selbst ist. Es darf z.B. nicht sein, dass häufig Patienten mit sehr niedrigen oder hohen Blutdruckmessungen fehlen, denn das würde die Ergebnisse verfälschen. Es gibt in der Praxis keine universell gültige Strategie, wie mit fehlenden Werten umgegangen werden soll, stattdessen sollte man in jedem Fall individuell abwägen. In Abbildung 1 x sind die 18 vollständigen Datenpaare gegeneinander aufgetra gen worden. Die Stärke und Richtung des linearen Zusammenhangs zwischen zwei metrischen Messreihen können mit dem PearsonKorrelationskoeffizienten beurteilt werden. Die Korrelation misst, wie stark der lineare Zusammenhang zwischen den beiden Datenreihen ist. Der Wert des Korre lationskoeffizienten liegt zwischen –1 und 1. Für den Fall, dass kein linearer Zusammenhang zwischen den beiden Messreihen vorliegt, ist der zugehörige Korrelationskoeffi zient ungefähr gleich null, und man spricht davon, dass die beiden Variablen unkorreliert sind. Es kann in diesem Fall trotzdem ein Zusammenhang zwischen den Variablen vor liegen, der aber nicht linear ist. Das Vorzeichen des Korrelationskoeffizienten gibt die Richtung des Zusammenhangs an: Ist es positiv, gehen grosse Werte der einen Variablen mit grossen Werten der anderen Variablen einher; ist das Vorzeichen negativ, so gehen grosse Werte der einen Variablen mit kleinen Wer ten der anderen einher. In Abhängigkeit vom untersuchten Zusammenhang gibt es Richtwerte zur Interpretation der Korrelation. Ab einem Wert grösser 0,3 (kleiner als –0,3) spricht man typischerweise von einem schwachen posi tiven (negativen) Zusammenhang, ab 0,5 bzw. –0,5 von einem moderaten Zusammenhang, und ab 0,8 bzw. –0,8
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom