Multiple Regressionsanalyse
Eine Möglichkeit für ein statistisches Analyseverfahren ist die Regressionsanalyse mit mehreren Variablen. Die multiple Regressionsanalyse ist das häufigste eingesetzte multivariate Analyseverfahren in der Markt- und Sozialforschung. Sie untersucht die Beziehung zwischen einer abhängigen und einer oder mehrerer unabhängigen Variablen. In der Ursachenanalyse kommt diese multiple Regressionsanalyse bei der Darstellung und Quantifizierung von Wirkungszusammenhängen zum Einsatz. Ein weiteres Einsatzgebiet ist die Prognostik, die Prognose der Werte der abhängigen Variablen.
Anwendung der multiplen Regressionsanalyse
Der wichtigste Aspekt dieser Analyse ist, dass sie bereits bestehende Strukturen der Kausalität untersucht, jedoch nicht neue Strukturen erforscht. Ein Beispiel wäre die Analyse, wie sich die Absatzmenge eines Konsumguts (abhängige Variante) durch Veränderung des Produktpreises sowie der Werbeausgaben (unabhängige Variablen) verändert. Dies wäre ein linearer Zusammenhang dieser Variablen, der sich am besten mit der multiplen Regressionsanalyse untersuchen lässt.
Arten der Regressionsanalyse
Eine einfache Regressionsanalyse beinhaltet eine abhängige und eine unabhängige Variable und lässt sich mit dieser Formel darstellen:
Y = f(x)
Eine multiple Regressionsanalyse beinhaltet eine abhängige und mehrere unabhängige Variablen und die Regressionsfunktion dazu lautet:
Y = f(x1, x2, x3, …. xn)
Lineare und nicht-lineare Regression
Der Informationswert einer multiplen Regressionsanalyse ist für gewöhnlich sehr hoch. Jedoch lassen sich nicht immer die linearen Zusammenhänge eindeutig festlegen. Ein Beispiel dazu ist der Zusammenhang zwischen Bekanntheitsgrad und Absatzmenge eines Produkts. Es lässt sich kaum schlüssig belegen, dass Produkte aufgrund ihrer Bekanntheit häufiger gekauft werden oder ob umgekehrt der Umlauf in höheren Stückzahlen ein Produkt bekannter macht. Es besteht also die Gefahr, eine Korrelation mit einer Kausalität zu verwechseln. Derartige sogenannte interdependente Systeme lassen sich nur in Mehrgleichungsmodellen erfassen.
Auch nicht-lineare Zusammenhänge lassen sich in eine lineare Analyse transformieren. Ein Beispiel dazu wären Umweltbelastungen durch bestimmte Schadstoffe in einem bestimmten Zeitraum. Diese Zusammenhänge lassen sich nicht direkt linear darstellen, jedoch erlaubt ein Logarithmus die Darstellung der Zusammenhänge im Rahmen einer Regressionsanalyse.
Korrelation und Kausalität
Korrelation und Kausalität sind unterschiedliche Konzepte. Eine Korrelation kann auf eine Kausalität hindeuten, ist aber keine Bedingung dafür. Das bedeutet, auch wenn es Zusammenhänge zwischen zwei Variablen gibt, bedeutet es noch nicht, dass diese sich gegenseitig kausal beeinflussen, denn eine dritte Variable könnte dafür verantwortlich sein. Anders ausgedrückt, das Auftreten einer Korrelation erlaubt noch keinen Rückschluss auf Kausalzusammenhänge.
Schritte einer Regressionsanalyse
Eine Regressionsanalyse läuft für gewöhnlich in vier Schritten ab:
- Formulierung des Modells für die Regressionsanalyse und Prüfung der verschiedenen Grundvoraussetzungen (Skalenniveau, Kausalgeflecht)
- Schätzung und Aufstellung der Regressionsfunktion (Berechnung der Regressionskoeffizienten anhand der Methode der kleinsten Quadrate)
- Prüfung der Regressionskoeffizienten und der Regressionsfunktion: Erklärung der abhängigen Variable im Zusammenhang mit den einzelnen unabhängigen Variablen im Gesamtmodell
- Prüfung des Modells auf Validität und Interpretation der Ergebnisse: Sollte das Modell der Prüfung nicht standhalten, ist auch ein Abbruch der Regressionsanalyse möglich