Feyenoord is de beste club van de Eredivisie (aldus de data)
Ons beeld van voetbal wordt in hoge mate bepaald door wat Co Adriaanse ooit ‘scorebordjournalistiek’ noemde: we staren ons blind op uitslagen en ranglijsten. Maar als je geavanceerde data op het spel loslaat, kom je tot verrassende conclusies. Dat Feyenoord (nu tiende) meer kans heeft om kampioen te worden dan PSV (nu eerste) bijvoorbeeld.
Na acht speelronden in de Eredivisie is dit de stand.
Is dit een juiste weergave van de krachtsverhoudingen? Nee. De reden is eenvoudig: in het voetbal speelt toeval een grote rol. Een bal tegen de lat, een onterechte rode kaart, een onwaarschijnlijk doelpunt, een keeper die uitglijdt – het zijn toevalligheden die weinig zeggen over de werkelijke kracht van ploegen en spelers, maar die wel weerslag hebben op de ranglijst.
PSV had het moeilijk tegen het sterk spelende SC Cambuur – maar had het geluk dat het scoorde doordat de keeper van Cambuur uitgleed en dat een verdediger van Cambuur al in de eerste helft een rode kaart kreeg.
Diezelfde dag speelde Feyenoord een geweldige wedstrijd tegen Ajax en creëerde kans op kans – maar Ajax won, met een onwaarschijnlijke vrije trap.
Op basis van incidenten trek je, als het goed is, geen conclusies. Je verwijt een speler niet dat hij een onterechte rode kaart kreeg, je gaat een spits niet verwijten dat de keeper van de tegenstander in topvorm was, je verwijt een keeper niet dat hij uitglijdt. Maar conclusies op basis van de ranglijst zijn – zelfs vroeg in het seizoen – aan de orde van de dag.
Co Adriaanse legde dat in 2003 al heel goed uit, in een interview met NOS-verslaggever Frank Snoeks. Adriaanses ploeg had net 1-5 verloren. Maar, zei Adriaanse, ‘voetbal is een spelletje waarbij toch niet altijd de beste wint.’
Snoeks: ‘1-5, daar valt toch weinig op af te dingen.’
Adriaanse: ‘Dat is scorebordjournalistiek. […] Ik vond Roda absoluut niet een betere ploeg hebben.’
Hoe isoleer je kwaliteit?
En dus is een ranglijst gebaseerd op uitslagen een misleidende ranglijst. Een betere ranglijst zou dan ook een ranglijst zijn die deze factor uitschakelt; die het scorebord en de toevalligheden, in de geest van Adriaanse, negeert.
Hoe bepaal je welke club geluk had en welke niet?
De vraag is alleen – hoe bepaal je welke club geluk had en welke niet? Anders gezegd: hoe isoleer je kwaliteit?
Dat is de vraag waar voetbalstatistici zich de afgelopen jaren over hebben gebogen, aangezien vrijwel alle denkbare voetbaldata via sites als Squawka en WhoScored vrij beschikbaar zijn. Ze bouwden er modellen mee en zo komt deze ranglijst tot stand.
De Verwachte Doelpuntverhouding
De statistische methode waarmee bovenstaande ranglijst tot stand kwam, heet de ‘Expected Goals Ratio’ – Verwachte Doelpuntenverhouding. Met de ‘ExpGR’ krijgt elke kans die een ploeg krijgt – en tegen krijgt – een waarde toegekend. Hoe waardevoller je kansen, hoe beter je bent als ploeg.
Dit vergt wat uitleg.
De waarde van die kansen is geen subjectieve kwestie, zij is gebaseerd op het spel zelf. Het mooie aan voetbal is dat vrijwel elke gebeurtenis in elke wedstrijd al eens eerder is voorgekomen – en niet één keer, maar duizenden keren.
De ExpGR kijkt naar alle aspecten van een kans – locatie, kopbal of schot, type spelsituatie, de assist, de snelheid van de aanval, enz. – en kijkt daarna in de database van de voetbalgeschiedenis. Simpel voorbeeld: een strafschop gaat er in ongeveer 78 procent van de gevallen in en is dus 0,78 ExpGR waard.
Vijftig procent toeval
Je denkt nu misschien: dat is oneerlijk. Zijn sommige spelers niet beter in het benutten van kansen dan andere?
Elke individuele uitslag is een toevallige manifestatie van de krachtsverhoudingen tussen twee ploegen
Gek genoeg is dat niet het geval. Goede ploegen en goede spelers onderscheiden zich door veel kansen uit te spelen. In het benutten van deze kansen zijn professionals allemaal ongeveer even goed. Geen spelers steekt er consequent bovenuit.
Dus: elke individuele uitslag is een toevallige manifestatie van de krachtsverhoudingen tussen twee ploegen. Vaak komt de uitslag redelijk overeen met de daadwerkelijke krachtsverhoudingen, maar vaak ook niet – wetenschappers Chris Anderson en David Sally becijferden in The Numbers Game dat wedstrijden tussen profclubs voor vijftig procent door kwaliteit en voor vijftig procent door toeval beslist worden.
Kortom, als je – als journalist, of als voetbalbestuurder – de prestaties van een ploeg of coach wilt evalueren, dan moet je niet naar toevalligheden kijken. Dan moet je kijken naar de fundamentele, toevalsloze kwaliteit. En dat doe je door te kijken naar de gecreëerde kansen.
Waarom is Feyenoord het best?
Terug naar de ExpGR-ranglijst. Is deze ranglijst nu een perfecte afspiegeling van de daadwerkelijke kracht van ploegen? Verre van.
Excelsior, bijvoorbeeld, staat op de vierde plek, maar is zeker niet de op drie na beste ploeg van de Eredivisie. De hoge notering van Excelsior is zeer waarschijnlijk geflatteerd doordat het relatief zwakke tegenstanders had.
Maar het opvallendst is uiteraard de nummer-1-notering van Feyenoord – de ploeg die tot nu toe dus de beste ploeg van de Eredivisie is.
Daar denkt niet iedereen zo over.
De trainer deugt niet, de technisch directeur deugt niet, de spits is geen spits, ze hebben te veel middenvelders. Zelfs als Feyenoord een onmiskenbaar ijzersterke wedstrijd speelde, putten deskundigen naar hartelust uit deze verwijtengrabbelton.
In de thuiswedstrijd tegen Ajax, op 21 september, creëerde Feyenoord een grote serie mooie kansen, maar miraculeus genoeg stonden lat, paal, lat, her en der rondslingerende ledematen van Ajacieden – of iets anders – steeds in de weg. Ajax creëerde nagenoeg niets, maar scoorde wel – uit een even fenomenale als onwaarschijnlijke vrije trap van verdediger Ricardo van Rhijn.
‘Het heeft toch ook met kwaliteit te maken’
Ajax had dus mazzel, Feyenoord pech. Nu bleef dat zeker niet onbenoemd. Jan Mulder stelde bijvoorbeeld in Studio Voetbal vast dat Feyenoord vooral zo door moest gaan. Een logische conclusie – en ogenschijnlijk de enige juiste conclusie.
Maar wonderlijk genoeg ging het daarna vooral over de vermeende tekortkomingen van Feyenoord, onder aanvoering van Ruud Gullit, die als ex-prof het hoogste woord had en kreeg. Nadat hij erkende dat Feyenoord goed had gespeeld, kwam het hoge woord eruit: ‘Het heeft toch ook met kwaliteit te maken dat ze hebben verloren.’
Waarop een exposé van Feyenoords tekortkomingen volgde: Feyenoordspits Colin Kazim-Richards was geen echte spits, scoren kun je leren, de vleugelspitsen konden geen voorzetten geven, Feyenoord had te veel middenvelders, enz. Traditiegetrouw kreeg ook Lex Immers – die niet eens meedeed – een veeg uit de pan.
Ook andere media waren kritisch. En het zag er slecht uit voor Fred Rutten, Feyenoords trainer – want de trainer krijgt traditioneel de schuld van uitblijvende resultaten, toeval of niet.
Daadwerkelijke doelpunten
Totdat Feyenoord in de wedstrijden erna opeens begon te scoren. De Verwachte Doelpunten werden Daadwerkelijke Doelpunten, mede doordat het kwartje nu eens de goede kant op viel – zie bijvoorbeeld deze goal van Colin Kazim-Richards, die scoorde uit schier onmogelijke positie.
Fred Rutten heeft zijn baan nog. En hoewel de ExpGR dit toeval in zekere zin voorspelde – een ploeg die zoveel kansen krijgt, zal op termijn scoren – loopt het niet voor elke trainer goed af.
Neem het geval Ruud Brood. Brood werd vorig jaar ontslagen als trainer van Roda JC na een serie nederlagen. Maar uit de statistieken blijkt dat Brood en Roda toen veel pech hadden, zoals collega Sander IJtsma eerder elders schreef. Nadat Brood was aangesteld, kreeg hij de kansenverhoudingen van Roda op een significant hoger peil.
Brood verdiende een medaille. In plaats daarvan werd hij ontslagen en stelde Roda een andere coach aan, in de hoop op een positief ‘schokeffect’ – een fenomeen dat uit onderzoek na onderzoek niet blijkt te bestaan. Onder de nieuwe coach stortte Roda’s spel juist in, en nu speelt het voor het eerst sinds 1973 in de eerste divisie.
Is Hiddink opeens minder waard?
Betekent dit nu dat de Expected Goals Ratio een voorspellende waarde heeft?
Ergens wel: de Expected Goals Ratio van ploegen blijft redelijk stabiel over een serie wedstrijden en als je een hoge ExpGR-score hebt, kun je ‘rekenen’ op doelpunten. En toch zou het naïef zijn om de ExpGR-ranglijst simpelweg te extrapoleren naar mei, als de competitie ophoudt. Als de competitie ten einde is, zal Excelsior geen vierde zijn. En Ajax had in eerdere seizoenen in de eerste helft van het seizoen een lage ExpGR-score, maar verbeterde zich later – en werd vier keer op rij kampioen.
Daarom corrigeren we de Expected Goal Ratio van dit seizoen deels met die van vorig seizoen. De mate van correctie neemt tijdens het seizoen steeds verder af, omdat de ware kwaliteit van teams in het huidige seizoen steeds duidelijker naar voren komt. Zodoende zijn dit de kansen van een aantal ploegen op een specifieke eindklassering:
Wordt dit nu de eindstand? Vrijwel zeker niet. Maar statistische modellen voorspelden de eindstand de afgelopen jaren collectief beter dan de bekende deskundigen, zo schreef Simon Gleave van databureau Infostrada recent.
En toch is deze voorspelling niet het voornaamste punt. Voetbal is door de grote rol van toeval een volatiele sport; je kunt goed spelen maar door pech toch verliezen. Statistische methodes zoals de ExpGR kunnen dat doorbreken en voorkomen dat er verkeerde conclusies worden getrokken – iets wat vaak gebeurt na enkele nederlagen kort na elkaar.
Het is opmerkelijk dat KNVB-bestuurder Bert van Oostveen een ‘structureel karakter’ ziet. Hoe kan iets na vier wedstrijden structureel zijn?
Zie het Nederlands elftal. Het spel mag ondermaats zijn geweest, de afgelopen wedstrijden. Maar hoewel we de ExpGR-cijfers niet hebben, en de kwaliteit van het spel van Oranje niet kunnen kwantificeren, zijn er aanwijzingen dat het toeval ook hier een grote rol had. Bruno Martins Indi kreeg een domme rode kaart, Tsjechië scoorde een onwaarschijnlijke eerste goal, de Nederlandse verdediger Daryl Janmaat maakte een zeldzaam grote fout en IJsland benutte zijn eerste twee kansen van de wedstrijd – ook al bijzonder.
Hoe dan ook is het op zijn minst opmerkelijk dat KNVB-bestuurder Bert van Oostveen een ‘structureel karakter’ ziet in de slechte uitslagen. Hoe kan iets na vier wedstrijden structureel zijn? Zijn de redenen om Hiddink aan te stellen als bondscoach na twee nederlagen niet meer geldig?
Te weinig wedstrijden
Toeval wordt onderschat in het voetbal. Basketbal en honkbal kijken hier heel anders tegenaan. Honkbalploegen spelen 162 wedstrijden en weten dat ze minimaal één derde daarvan zullen verliezen – niet omdat ze niet goed genoeg zijn, maar omdat de betere ploeg nu eenmaal niet altijd wint. Billy Beane – de legendarische directeur van de Oakland A’s, beroemd geworden door statistische analyse, en een groot voetbalfan – zei het zo, pratende over de moeilijke start van Louis van Gaal bij Manchester United:
‘Het is bizar… Meer dan welke andere sport zwelt al na zo weinig wedstrijden het geluid aan om de trainer te vervangen. Het verloop onder trainers is iets wat ik niet kan begrijpen.’
Het is tijd voor mensen zoals hij in het voetbal, mensen die de ranglijst negeren en kijken wat er onder de ranglijst schuilgaat. Want de ranglijst, die liegt.
Dit verhaal schreef ik samen met mijn vaste co-auteur Sander IJtsma, die verantwoordelijk is voor het data-onderzoek.