Simpson-Paradoxon
Das Simpson-Paradoxon ist ein Paradoxon aus der Statistik. Es ist nach Edward H. Simpson benannt, einem britischen Statistiker, der es 1951 erstmals beschrieb. Der Statistiker Karl Pearson beschrieb 1899 einen sehr ähnlichen Effekt - die Beschreibung von Udny Yule stammt aus dem Jahr 1903. Manchmal wird er auch als Yule-Simpson-Effekt bezeichnet. Wenn man sich die statistischen Werte von Gruppen ansieht, können sich diese Werte ändern, je nachdem, ob die Gruppen einzeln betrachtet werden oder ob sie zu einer größeren Gruppe zusammengefasst werden. Dieser Fall tritt häufig in den Sozialwissenschaften und in der medizinischen Statistik auf. Es kann Menschen verwirren, wenn Häufigkeitsdaten zur Erklärung eines kausalen Zusammenhangs verwendet werden. Andere Bezeichnungen für das Paradoxon sind Umkehrparadoxon und Amalgamparadoxon.
Beispiel: Nierenstein-Behandlung
Dies ist ein reales Beispiel aus einer medizinischen Studie, in der die Erfolgsraten von zwei Behandlungen von Nierensteinen verglichen wurden.
Die Tabelle zeigt die Erfolgsraten und die Anzahl der Behandlungen für Behandlungen mit kleinen und großen Nierensteinen, wobei Behandlung A alle offenen Verfahren umfasst und Behandlung B die perkutane Nephrolithotomie ist:
Behandlung A | Behandlung B | |||
Erfolg | Versagen | Erfolg | Versagen | |
Kleine Steine | Gruppe 1 | Gruppe 2 | ||
Zahl der Patienten | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Große Steine | Gruppe 3 | Gruppe 4 | ||
Zahl der Patienten | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Beide | Gruppe 1+3 | Gruppe 2+4 | ||
Zahl der Patienten | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Die paradoxe Schlussfolgerung ist, dass die Behandlung A wirksamer ist, wenn sie bei kleinen Steinen und auch bei großen Steinen angewendet wird, während die Behandlung B wirksamer ist, wenn beide Größen gleichzeitig betrachtet werden. In diesem Beispiel war nicht bekannt, dass die Grösse des Nierensteins das Ergebnis beeinflusst. Dies wird in der Statistik als versteckte Variable (oder lauernde Variable) bezeichnet.
Welche Behandlung als besser gilt, wird durch eine Ungleichheit zwischen zwei Verhältnissen (Erfolg/Gesamt) bestimmt. Die Umkehrung der Ungleichheit zwischen den Verhältnissen, die das Simpson'sche Paradoxon erzeugt, geschieht, weil zwei Effekte zusammen auftreten:
- Die Größen der Gruppen, die kombiniert werden, wenn die lauernde Variable ignoriert wird, sind sehr unterschiedlich. Die Ärzte tendieren dazu, die schweren Fälle (grosse Steine) besser (A) und die milderen Fälle (kleine Steine) schlechter (B) zu behandeln. Daher werden die Gesamtzahlen von den Gruppen drei und zwei dominiert und nicht von den beiden viel kleineren Gruppen eins und vier.
- Die lauernde Variable hat einen großen Einfluss auf die Verhältnisse, d.h. die Erfolgsrate wird stärker durch den Schweregrad des Falles als durch die Wahl der Behandlung beeinflusst. Daher schneidet die Gruppe der Patienten mit grossen Steinen bei Behandlung A (Gruppe drei) schlechter ab als die Gruppe mit kleinen Steinen, auch wenn letztere die schlechtere Behandlung B (Gruppe zwei) verwendet hat.