Ist es Zufall oder liegt eine Korrelation vor? Oftmals werden wir von vermeintlichen ZusammenhĂ€ngen zwischen Datenreihen getĂ€uscht. Sei auf der Hut und verwende nur Indikatoren, die bulletproof sind đŸ”«

Folgender Artikel erklĂ€rt den Begriff der Scheinkorrelation und die Bedeutung fĂŒr Sportwetten.

Definition

Wenn es eine Korrelation zwischen A und B gibt, kann A also Ursache von B sein, oder B kann Ursache von A sein. Es kann aber auch sein, dass keines von beidem Ursache von irgendwas ist. Statt dessen kann es eine dritte Variable geben, die A und B beeinflusst hat. Manchmal kann man diese Variable ermitteln, manchmal nicht. Und manchmal handelt es sich einfach um Zufall – dann spricht man von Koinzidenz.

Solche Korrelationen, denen kein Kausalzusammenhang zu Grunde liegt, nennt man auch Scheinkorrelationen, und fĂŒr sie gibt es viele wunderbare Beispiele. In manchen Regionen korreliert etwa die Anzahl der Störche mit der Geburtenrate. Erstaunlicherweise ist das eine aber nicht Ursache des anderen, statt dessen gibt es eine dritte Variable, die sich auf Störche und Geburtenrate auswirkt: die LĂ€ndlichkeit der Region. Je lĂ€ndlicher die Region, desto mehr Störche und desto mehr Geburten.

Wie gesagt: Die dritte Variable kann auch verborgen bleiben – oder schlicht nicht existieren. Eine Korrelation kann, zumindest ĂŒber einen bestimmten Zeitraum hinweg, rein zufĂ€llig bestehen, und je grĂ¶ĂŸere Mengen an Big Data wir auswerten können, desto grĂ¶ĂŸer ist die Wahrscheinlichkeit, dass wir Korrelationen finden, Zeitreihen, die sich Ă€hneln, und doch gar nichts miteinander zu tun haben.[1]

Bedeutung fĂŒr den Bereich der Sportwetten

Im Bereich der Sportwetten lassen wir uns gerne von Statistiken blenden. Doch hat eine Mannschaft grĂ¶ĂŸere Siegchancen, nur weil sie mehr Ballbesitz hat?
Schauen Sie sich die Statistik ĂŒber die meisten Ballkontakte an. Hier sollten doch unserem VerstĂ€ndnis nach die 6er, 10er und Spielmacher der Ligen ganz oben stehen. Weit gefehlt – wir finden je nach Spielverlauf oftmals zahlreiche Vertreter an Innen- und Außenverteidigern, die wĂ€hrend eines Spiels den Ball durch die Viererkette laufen lassen.

Eine Korrelation zwischen Ballkontakten und Offensivdrang oder Ballbesitz und erhöhten Siegchancen besteht also nicht zwingend.

Professionelles Mindset

Lasse dich nicht von Statistiken auf die falsche FĂ€hrte fĂŒhren. Dies gilt v.a. auch fĂŒr die Heim- und AuswĂ€rtsstatistik. Nur weil ein Team die letzten drei Heimspiele gewonnen hat, bedeutet dies nicht, dass automatisch der vierte Heimsieg folgt. NatĂŒrlich mĂŒssen wir die Tendenz der HeimstĂ€rke bewerten, allerdings sollte die Analyse ganzheitlich sein, z.B. ĂŒber die Betrachtung gegen wen die Siege eingefahren wurden: Abstiegskandidaten oder Champions-League-Aspiranten?

Gepaart mit der Confirmation Bias kann die Scheinkorrelation sehr gefĂ€hrlich fĂŒr unseren Analyseprozess sein. So suchen wir uns nur Statistiken aus, die in unser vorgefertigtes Denkschema passen. Statistiken, die gegen unsere getroffene Auswahl sprechen, blenden wir aus.

Sei dir dieses Denkfehlers daher stets bewusst, nimm dir Zeit fĂŒr eine fundierte Analyse und verwende Indikatoren, die tatsĂ€chlich eine Korrelation aufweisen (z.B. Big Chance Data / Expected Goals Rate).

Quellen + Links

Keinen Artikel mehr verpassen?