Wir leben in einer Welt voller Daten. Täglich werden wir mit Statistiken, Studien und vermeintlichen Zusammenhängen konfrontiert. “Menschen, die Rotwein trinken, leben länger!”, “Eiscreme-Verkauf und Gewaltverbrechen steigen gleichzeitig an!” oder “Je mehr Internet-Anschlüsse ein Land hat, desto höher ist die Lebenserwartung!”. Diese Aussagen beschreiben Korrelationen – doch bedeuten sie auch, dass eine Sache die andere verursacht? Warum die Unterscheidung von Korrelation und Kausalität so wichtig ist, erklären wir in diesem Beitrag.
Was ist Korrelation?
Eine Korrelation beschreibt einen statistischen Zusammenhang zwischen zwei Variablen. Wenn eine Variable steigt oder sinkt und die andere einem ähnlichen Muster folgt, sprechen wir von einer positiven Korrelation. Bewegen sie sich in entgegengesetzte Richtungen, handelt es sich um eine negative Korrelation. Korrelationen werden üblicherweise mit dem Korrelationskoeffizienten ausgedrückt, der zwischen -1 (perfekte negative Korrelation) und +1 (perfekte positive Korrelation) liegt. Ein Wert von 0 bedeutet, dass kein statistischer Zusammenhang besteht.
Was ist Kausalität?
Kausalität bedeutet, dass eine Variable tatsächlich die Ursache für Veränderungen in einer anderen Variable ist. Wenn eine Ursache (A) eine Wirkung (B) hervorruft, führt eine Veränderung von A direkt zu einer Veränderung von B. Ein solcher Zusammenhang geht über bloße Korrelation hinaus und zeigt eine direkte Ursache-Wirkungs-Beziehung.
Ein Beispiel für Kausalität ist die Beziehung zwischen Zinssätzen und Investitionen. Wenn die Zentralbank die Zinssätze senkt, werden Kredite günstiger, was Unternehmen dazu anregt, mehr zu investieren. Dies führt häufig zu einem Anstieg der wirtschaftlichen Aktivität und des Wachstums. Hierbei handelt es sich um einen kausalen Zusammenhang: Die niedrigeren Zinssätze verursachen eine Zunahme der Investitionen.
Der entscheidende Unterschied
Der klassische Satz “Korrelation impliziert keine Kausalität” ist einer der wichtigsten Grundsätze in der Datenanalyse und wissenschaftlichen Forschung. Nur weil zwei Variablen ein ähnliches Muster aufweisen, bedeutet das nicht, dass eine die andere verursacht. Es gibt zwei Hauptgründe dafür: Einerseits das Problem der dritten Variable: Manchmal werden beide Variablen von einer dritten, nicht beobachteten Variable beeinflusst. Andererseits das Richtungsproblem: Selbst wenn zwei Variablen korrelieren und möglicherweise kausal verbunden sind, ist es oft schwierig zu bestimmen, welche Variable die Ursache und welche die Wirkung ist.
Nehmen wir den Glühweinkonsum und die Umsatzzahlen des Handels im Dezember. Beide steigen in dieser Zeit an, es besteht also eine Korrelation. Aber bedeutet das, dass erhöhter Glühweinkonsum zu mehr Einkäufen führt? Wahrscheinlich nicht. Vielmehr ist die Weihnachtszeit der gemeinsame Faktor, der beide Phänomene beeinflusst. Beispiele für Korrelationen ohne kausalen Zusammenhang:
- Scheinkorrelationen: Der Eiscremeverkauf und die Anzahl der Unfälle durch Ertrinkung steigen im Sommer an. Verursacht Eiscreme Ertrinken? Natürlich nicht – die höhere Temperatur ist die Ursache für beides.
- Umgekehrte Kausalität: Menschen mit Krankheiten nehmen häufiger Medikamente. Bedeutet das, dass Medikamente Krankheiten verursachen? Nein, die Kausalität verläuft in die andere Richtung.
- Gemeinsame Ursachen: In Ländern mit höherem Wohlstand gibt es sowohl mehr Internet-Anschlüsse als auch eine höhere Lebenserwartung. Der wirtschaftliche Wohlstand ist hier die gemeinsame Ursache für beide Phänomene.
Wie kann man Kausalität nachweisen?
Um echte kausale Zusammenhänge zu ermitteln, benötigen wir mehr als nur Korrelationsdaten. Daher werden weitere Studien oder Experimente durchgeführt, um eine Kausalität nachzuweisen. Mögliche Vorgehen wären folgende:
- Randomisierte kontrollierte Studien: Dieser Ansatz wird oft als “Goldstandard” für die Feststellung kausaler Zusammenhänge angesehen. Teilnehmer werden zufällig in eine Versuchs- oder Kontrollgruppe eingeteilt. Diese Randomisierung stellt sicher, dass alle externen Faktoren gleichmäßig verteilt sind, wodurch die Unterschiede zwischen den Gruppen auf den zu testenden Faktor zurückgeführt werden können.
- Natürliche Experimente: Natürliche Experimente nutzen zufällige oder unvorhergesehene Ereignisse, die bestimmte Gruppen betreffen, um kausale Zusammenhänge zu untersuchen. Ein Beispiel hierfür ist die Analyse von Politikänderungen, die unvorhergesehen in Kraft treten, wie etwa das gesetzliche Rauchverbot, dessen Auswirkungen auf die Gesundheit der Bevölkerung untersucht werden können.
- Längsschnittstudien: Hierbei werden dieselben Subjekte über einen längeren Zeitraum beobachtet. Durch die wiederholte Datenerhebung können Veränderungen und Entwicklungen im Zeitverlauf verfolgt werden, was hilft, kausale Zusammenhänge abzuleiten. Diese Studien sind jedoch oft zeitaufwendig und teuer.
- Statistisches Matching: Bei dieser Methode werden Subjekte so gepaart, dass sie in allen relevanten Merkmalen ähnlich sind, sich aber in dem zu untersuchenden Faktor unterscheiden. Dies reduziert die Verzerrung durch potenzielle Störfaktoren und erlaubt eine bessere Schätzung des kausalen Effekts.
- Instrumentvariablen: Hierbei werden Variablen verwendet, die mit der unabhängigen Variable korrelieren, aber nicht direkt mit der abhängigen Variable. Diese Instrumentvariablen dienen dazu, die Variation in der unabhängigen Variable zu isolieren, um kausale Effekte zu identifizieren. Ein klassisches Beispiel ist die Nutzung von Geburtsmonaten zur Untersuchung des Einflusses von Bildung auf Einkommen.
Fazit
In einer Welt, in der wir ständig mit Daten und vermeintlichen Zusammenhängen konfrontiert werden, ist die Fähigkeit, zwischen Korrelation und Kausalität zu unterscheiden, unerlässlich. Bevor wir Schlussfolgerungen ziehen oder Handlungen auf Basis statistischer Zusammenhänge einleiten, sollten wir uns immer fragen: Gibt es echte Beweise für einen kausalen Zusammenhang, oder handelt es sich nur um eine zufällige Korrelation?
Die nächste Schlagzeile, die einen spektakulären Zusammenhang verkündet, sollten wir daher kritisch hinterfragen: Wurde hier tatsächlich Kausalität nachgewiesen, oder handelt es sich nur um eine interessante Korrelation?