Warum ist ein Wahlmodell sinnvoll?
Umfragen zu Wahlabsichten sind in den Medien permanent präsent und werden genutzt, um die politische Stimmung im Land abzuschätzen. Die berühmte Sonntagsfrage wird wöchentlich erhoben. Warum also ist es sinnvoll ein komplexes Wahlmodell zu erstellen, wenn durch Umfragen bereits die politische Stimmung erhoben wird?
Das Problem ist, dass Umfragen zwar unmittelbar vor der Wahl recht präzise, aber durchaus mit Unsicherheiten behaftet sind. Insbesondere mit größerem zeitlichen Abstand zum Wahltag sind Umfragen ungeeignet, ein Wahlergebnis präzise zu schätzen. Die Sonntagsfrage fragt nach der aktuellen Wahlabsicht – aber nicht jeden Sonntag ist Bundestagswahl. Immer wieder zeigt sich, dass sich Wählerinnen und Wähler nicht ganz an die Umfragen halten. Die tatsächliche Wahlentscheidung ist also eine andere, als eine Wahlabsicht bei einer Umfrage. Das Ziel ist nun mit einem Modell Faktoren einzubeziehen, die die Umfragen ergänzen und so eine präzisere Vorhersage ermöglichen, als Umfragen alleine.
Das Wahlmodell
Das hier vorgestellte Wahlmodell ist eine vereinfachte Version des Modells von zweitstimme.org (Gschwend et al. 2017), welches ich für die aktuelle Bundestagswahl angepasst habe. Das Modell besteht aus zwei Teilen: einem Basismodell und den aktuellen Umfragewerten. Diese beiden Teile werden zeitlich gewichtet zusammengefügt.
Der erste Teil baut auf der Beobachtung auf, dass das Ergebnis einer Bundestagswahl anhand des letzten Wahlergebnisses und der Umfragewerte 210 und 240 Tagen vor der Wahl bereits relativ präzise bestimmt werden kann. Dieser Basiswert des Modells wird auf Grundlage einer linearen Regression geschätzt, die das Wahlergebnis aufgrund des Wahlergebnisses der letzten Bundestagswahl und den aktuellen Umfragedurchschnitt 240 bis 210 Tage vor der Wahl schätzt. Dafür wurden die Ergebnisse und Umfragen aller Bundestagswahlen seit 1953 verwendet. Mit den Regressionsparametern wird anschließend ein Basiswert für jede Partei errechnet.
Dieser Ansatz allein verliert allerdings über Zeit an Aussagekraft, da die Genauigkeit der Umfragen zunimmt je näher der Wahltag kommt. Daher wird das Basismodell um die aktuellen Umfragewerte erweitert. Dies geschieht mit Hilfe eines Markov Chain Monte Carlo Modells (MCMC). Die Gewichtung der Umfragekomponente nimmt dabei zu, je näher der Wahltermin rückt.
Ein MCMC Modell ist geeignet mit Unsicherheiten zu arbeiten. Weder das Basismodell, noch Umfragen liefern exakte Werte, sondern nur Wahrscheinlichkeitsbereiche. Eine Umfrage, die für Partei A einen Durchschnittswert von 30% ermittelt, hat i.d.R. eine Unsicherheit von +-3%-Punkten. Dies bedeutet, dass mit einer Wahrscheinlichkeit von 95% Partei A aktuell eine Zustimmung zwischen 27% und 33% hat. Ein exakter Wert kann aber durch eine Stichprobe nie ermittelt werden. Im zweiten Schritt müssen also die Unsicherheiten aus dem Basismodell und den aktuellen Umfragen berücksichtigt werden.
Dies geschieht, indem das Ergebnis aller Parteien für jede Partei 10.000 mal simuliert wird. Anhand der Wahrscheinlichkeitsverteilung des Basismodells und der Umfragen wird so 10.000 mal ein zufälliger Wert für die Partei anhand des Basismodells und der aktuellen Umfrage ermittelt. Der Umfrageteil wird dabei zeitlich gewichtet. Der Gewichtungsfaktor wurde empirisch ermittelt. Zu Beginn wird die Umfrage nur mit Faktor 0,5 einbezogen, dieser Wert wächst auf den Faktor 4 unmittelbar vor der Wahl an. Durch die hohe Anzahl an Simulationen kann so ein verlässlicher Prognosewert mit Konfidenzintervall ermittelt werden.
Über die Kombination der strukturellen Komponente und der aktuellen Umfragen hinaus sollten auch die verschiedenen Umfrageinstitute berücksichtigt werden. Es zeigt sich, dass einige Institute bestimmte Parteien unter- bzw. überschätzen. Auch weichen die Institute in der Erhebungs- und Auswertungsmethodik voneinander ab. Da es sich hier um ein vereinfachtes Modell handelt, wird dieses Problem dadurch behoben, dass der Umfragedurchschnitt verwendet wird: bis einen Monat vor der Wahl jeweils ein Monatsdurschnitt, danach einmal der Durchschnitt der Umfragen 14-30 Tage vor der Wahl und 7-14 Tage vor der Wahl. Die letzte Prognose erfolgt eine Woche vor dem Wahltag. Anhand des Durchschnitts sollen die verschiedenen Methoden, Umfrageausreißer und Biases der Institute ausgeglichen werden.
Wie gut hat das Modell in der Vergangenheit abgeschnitten?
Ein Modell muss evaluiert und überprüft werden, um festzustellen, ob es sich um ein präzises Modell handelt. Ziel sollte es sein, dass das Modell mind. besser abschneidet als die Umfragen. Sonst wäre der ganze Aufwand unnötig. Um dies zu tun wurde das Modell anhand den Umfragedaten und Wahlergebnissen seit 1953 (Gschwend et al. 2017) kalibriert und evaluiert. Die Daten wurden durch das Wahlergebnis 2017 erweitert. Insgesamt wurden 27.343 Datenpunkte in die Analyse einbezogen.
Zunächst wurde der Gesamtdatensatz zufällig in eine Trainings- und Testgruppe aufgeteilt (80% Training, 20% Test). Mit der Trainingsgruppe wurde das Basismodell berechnet und das Modell kalibriert. Ein Aufteilen in Test und Trainingsdaten ist sinnvoll, da so die Genauigkeit des Modells für neue Daten überprüft werden kann. Würden alle Daten verwendet, um das Modell zu verbessern, so könnte “Overfitting” eintreten. Dies bedeutet, dass das Modell zwar sehr genau die Trainingsdaten vorhersagen kann, aber für neue, ungesehene Daten deutlich schlechtere Ergebnisse liefert. Anstatt generalisierbare Erkenntnisse aus den Daten zu ziehen hat das Modell bei Overfitting die Daten sozusagen auswendig gelernt, aber nicht verstanden.
Im Ergebnis zeigt sich, dass das Modell sowohl für die Trainings- als auch für die Testdaten genauere Ergebnisse liefert, als die Umfragen alleine. Je näher der Wahltag rückt, desto präziser werden sowohl Modell als auch Umfragen. Dies ist nicht verwunderlich. Im direkten Vergleich liefert das Modell allerdings bereits deutlich früher deutlich genauere Ergebnisse als die Umfragen. Als Zukunftsprognose eignen sich das Modell also besser.
Zeitlicher Verlauf der Modellgenauigkeit
Verändert sich die Modellgenauigkeit über Zeit?
Es zeigt sich, dass das Modell aber auch die Umfragen zunächst deutlich an Genauigkeit gewonnen haben. In den letzten Jahren stieg sowohl die Umfrage-, als auch die Modellungenauigkeit. Da das Modell allerdings stark auf Umfragen aufbaut ist dieser Zusammenhang nicht überraschend. Es bleibt abzuwarten, ob sich der Trend hin zu ungenaueren Umfragen verstetigt oder nur temporär ist. Die Erosion der Volksparteien in den letzten Jahren und der Erfolg neuer Parteien (AfD) könnte allerdings dazu führen, dass die Unsicherheit in Zukunft eher zunehmen wird.
Was unterscheidet dieses Modell von anderen?
Der aufmerksame und interessierte Leser mag vielleicht feststellen, dass dieses Modell relativ einfach ist. Das Modell besteht aus zwei Hauptkomponenten: dem letzten Wahlergebnis und den gewichteten aktuellen Umfrageergebnissen. Diese Feststellung ist durchaus richtig. Die Vereinfachung hat allerdings mehrere Gründe:
- Umfragen schließen bereits viele weitere erklärende Faktoren mit ein. So sollte sich z.B. die Wirtschaftslage auch in Umfragewerten niederschlagen. Daher kann durchaus argumentiert werden, dass weitere Faktoren, wie z.B. die Wirtschaftslage nicht zusätzlich einbezogen werden müssen.
- Das zitierte Modell von zweitstimme.org (2017) bezieht auch die aktuelle Kanzlerpartei mit ein. Ich habe mich allerdings dafür entschieden diesen Faktor nicht mit aufzunehmen, da Kanzlerin Merkel nicht erneut zu Wahl antritt und daher auch der “Kanzlerbonus” diese Wahl nur eingeschränkt beeinflusst. Die aktuellen Beliebtheitswerte von Armin Laschet lassen nicht darauf schließen, dass der Amtsbonus von Angela Merkel signifikant auf ihn übergeht.
- The simpler the better: komplexe Modelle sind nicht abzulehnen, wenn aber simplere Modelle ähnlich gute Ergebnisse liefern, so ist dies ebenfalls gut, da so mit weniger Aufwand ebenfalls gute Ergebnisse erzielt werden können. Das aktuelle Modell ist durchaus als Forschungsprojekt zu verstehen.
- Hinter diesem Modell steht kein großes Team. Während andere Modelle von Forscherteams oder gar kommerziell entwickelt werden, wird dieses Modell von einer Person in ihrer Freizeit entwickelt. Daher war es mir nicht möglich das Modell noch komplexer zu machen.
Für weiterführende Informationen, insbesondere für wissenschaftliche Publikationen zu Wahlmodellen zur Bundestagswahl empfehle ich die Beiträge von zweitstimme.org.
Referenzen
Gschwend, Thomas/Munzert, Simon/Stötzer, Lukas/Neunhoeffer, Marcel/Sternberg, Sebastian. 2017. “Zweitstimme.org Ein strukturell-dynamisches Vorhersagemodell für Bundestagswahlen.” Politische Vierteljahresschrift 58 (3): 418-441. https://www.jstor.org/stable/26427772