De grootste parel van de Eredivisie schittert bij FC Oss (als de cijfers niet bedriegen)
Georginio Wijnaldum is de beste speler, Richairo Živković het grootste talent, en ene Justin Mathieu van FC Oss de meest ondergewaardeerde speler. Dat zegt Goalimpact, het model van natuurkundige Jörg Seidel. Hij hoopt er talent mee te vinden, dat anders niet ontdekt was. Is dit het einde van de scout?
De beste speler van de Eredivisie?
Georginio Wijnaldum.
Het grootste talent?
Richairo Živkovi?.
De meest ondergewaardeerde speler?
Justin Mathieu.
Justin Mathieu. Van Willem II. Die verhuurd is aan FC Oss.
De kampioen van 2017?
PSV.
Dit alles zegt de Duitse natuurkundige en data-analist Jörg Seidel. Of beter gezegd, dat zegt het model dat Seidel de afgelopen acht jaar heeft ontwikkeld, Goalimpact.
Goalimpact is een poging om te komen tot wat in voetbalmanagement geldt als heilige graal: een accurate en objectieve manier om individuele spelers te beoordelen. Dat is moeilijk, vreselijk moeilijk, in een sport waarin spelers in continue en complexe wisselwerking met elkaar staan.
Maar het kan, zegt Seidel, door te kijken wat er gebeurt met het doelsaldo van een ploeg - het verschil tussen doelpunten en tegendoelpunten - als een bepaalde speler op het veld staat. Wordt het doelsaldo dan lager of hoger?
Door vervolgens rekening te houden met de kwaliteit van zijn medespelers en de tegenstanders, geeft Goalimpact de speler een specifieke waarde.
Achter dit ogenschijnlijk simpele principe gaat een complexe rekenmethode schuil, die alleen kan worden uitgevoerd door iemand met:
- Enorme hoeveelheden voetbaldata;
- diepgaande statistische kennis;
- het vermogen algoritmen te schrijven;
- een ongelooflijk snelle computer;
- engelengeduld;
- creativiteit;
- de verbeelding om te denken dat het überhaupt mogelijk is, en;
- een behoorlijk goed huwelijk.
Een zeldzaam mens, kortom, maar Jörg Seidel voldoet aan alle punten.
Een kunstenaar met cijfers
Seidel (42) is natuurkundige, was bankier en werkt nu als analist bij energiebedrijf Vattenfall, waarvoor hij met wiskundige modellen de energiebehoefte van landen voorspelt.
Dat doet hij overdag.
Als hij klaar is met werken, buigt hij zich over Goalimpact. Want hij heeft een droom: ‘Dat er dadelijk in de Eredivisie, Serie A of Bundesliga spelers rondlopen, die er anders niet hadden rondgelopen. Spelers die door mijn model zijn geïdentificeerd als nuttige spelers.’
Diverse grote voetbalclubs hebben al interesse getoond in Seidels werk. Dat is niet zo gek. Seidel kon aantonen dat zijn model het talent van latere topspelers – zoals Axel Witsel, Gareth Bale, Neven Subotić – al zag, ver voordat ze onbetaalbaar werden.
Het grote HSV uit zijn woonplaats Hamburg bekeek zijn model drie jaar geleden uitvoerig. De scouts waren lyrisch over zijn werk. Helaas voor Seidel liep de samenwerking uiteindelijk stuk op een veto vanuit het management.
Maar dat was in 2011. Inmiddels zien voetbalclubs brood in statistische analyses. Clubs uit binnen- en buitenland kloppen aan bij Seidel, die zijn kennis nu nog deelt op zijn blog. Maar als een club hem daadwerkelijk contracteert, zal hij daarmee stoppen. Voor het zover is, wil hij nog wat geheimen delen.
Het meten van het onmeetbare
Ik vroeg hem bijvoorbeeld wie op dit moment de drie beste spelers onder de 20 en de 23 jaar zijn in de Eredivisie. En welke spelers onder de 20 en 23 de grootste toekomst hebben. (Goalimpact kan aan de ontwikkeling van spelers voorspellen hoe ze zich zullen ontwikkelen.) Dit zei Goalimpact:
De huidige beste spelers onder de 20:
- Richairo Živković
- Justin Mathieu
- Bertrand Traoré
De spelers met het meeste potentie onder de 20:
- Richairo Živković
- Kevin Diks
- Justin Mathieu
De beste spelers onder de 23:
De grootste talenten onder de 23:
- Arkadiusz Milik
- Richairo Živković
- Jetro Willems
Nu zijn meningen over voetbal en voetballers doorgaans uitgesprokener dan - zeg - de garderobe van Gerard Joling. En dus zal niet iedereen het eens zijn met deze lijstjes. Maar zo heel gek zijn ze niet: Diks, Willems, Klaassen, Živković, Traoré - welke voetballiefhebber zou hen geen talent noemen?
Alleen Justin ‘Wie?’ Mathieu valt op. (We hebben hem vier keer afgebeeld in dit stuk, zodat je goed weet hoe hij eruitziet.)
Hoe komt hij in dit illustere gezelschap terecht?
Op die vraag heeft Seidel een kort antwoord: geen idee.
Waarom een speler goed is, zegt het model niet - het weet alleen dat Mathieu goed is. Hij draagt kennelijk bij aan een beter doelsaldo.
Sterker, Seidel probeert niet eens te analyseren hoe een speler dat doet. Want hoe zou dat moeten? Met de traditionele statistieken van spelers – tackles, schoten, sprints, etc – is dat niet te doen, zegt hij. Je mist dan moeilijk meetbare of zelfs onmeetbare factoren.
Neem positionering: sommige spelers zullen beter zijn dan anderen in het anticiperen van wat tegenstanders doen. Ze stellen zich daardoor beter op, waardoor ze minder hard hoeven te rennen en/of minder tackles hoeven te maken. Het uit zich niet in statistieken, toch is het waardevol.
Dat is ook de kritiek van sommige trainers, voetballers, en journalisten op het gebruik van zulke statistieken om spelers te beoordelen: ze missen context.
Daarom draait Seidel het om: hij kijkt niet naar het proces – tackles, schoten, sprints - maar naar de bijdrage van spelers aan de uitkomst: goals. Preciezer: hij kijkt naar de invloed op het doelsaldo tijdens de minuten dat een individuele speler op het veld staat – ofwel de Goalimpact van een speler.
Het elegante daaraan is dat het model zowel verdedigende als aanvallende kwaliteiten van een speler meeneemt. Ook daar gaan traditionele statistieken vaak de mist in. Als een aanvaller zijn verdedigende taken verwaarloost, en zo zijn ploeg kwetsbaar maakt, dan zal hij daar in een model dat alleen rekening houdt met zijn schoten of passes, niet op worden afgerekend. Sterker: het zal hem waarschijnlijk een hogere waardering opleveren.
Maar in Goalimpact kost het hem wel punten. Logisch ook. Een speler die zijn taken niet goed uitvoert, en het team daardoor verzwakt, zal in de werkelijkheid al snel een gesprekje hebben met zijn coach.
De beste selectie van Nederland
Nu werpt dit alles misschien vragen op. Bijvoorbeeld: na hoeveel wedstrijden weet je hoe goed een speler is?
Antwoord: Hoe meer wedstrijden, hoe minder onzeker de voorspelling. Seidel zelf hanteert tien wedstrijden als ijkpunt: als iemand na tien wedstrijden positief uit Goalimpact komt, zou hij scouts adviseren een kijkje te nemen.
Vraag: krijgen verdedigers – vaak vergeten als het gaat om het toekennen van individuele prijzen als de Voetballer van het Jaar of de Ballon d’Or – ook waardering in Goalimpact?
Antwoord: ja. Dortmundverdediger Mats Hummels geldt volgens Goalimpact als een van de beste voetballers ter wereld.
Terug naar de praktijk. Ik vroeg Seidel te kijken naar Ajax en PSV, de twee beste ploegen van Nederland. Hoe sterk zijn die ploegen over twee jaar? Seidel kan door zijn enorme dataset immers voorspellen hoe spelers zich zullen ontwikkelen – er gingen hen immers duizenden en duizenden spelers voor. De PiekGI (hoogste Goalimpact) drukt hun maximale potentie uit volgens het model.
Zo ziet Goalimpact de selectie van PSV:
PSV heeft tussen juni 2016 en juni 2017 een gemiddelde waarde van 127,7.
Ajax scoort net iets minder, met een gemiddelde waarde van 127,2:
En dus wordt PSV kampioen. Goalimpact geeft PSV 38,1 procent kans op het kampioenschap, Ajax 36,7 procent.
Tenminste, in het parallelle universum waarin Georginio Wijnaldum en Memphis Depay PSV’ers blijven. Een universum ver van het onze. En zonder Depay en Wijnaldum daalt PSV’s Goalimpact tot 117,8.
Dat geeft Ajax een royale voorsprong op de concurrentie. En dus is er werk aan de winkel van PSV’s scouting. En moeilijk werk ook: vind adequate en betaalbare vervangers voor twee topspelers.
Combineer de twee: de scout en het model
Is dit nu De Waarheid?
Klopt het dat de alom bejubelde Nemanja Gudelj van AZ - naar verluidt volgend seizoen Ajacied - in Goalimpact slechts geldt als ‘enigszins bovengemiddeld’? Dat wekt misschien wel evenveel verbazing als de ontdekking dat ene Justin Mathieu van Willem II/FC Oss waarschijnlijk een erg goede voetballer is. (PiekGI: 139,7)
Seidel: ‘Dat kan.’
Goalimpact is immers niet perfect, zoals geen enkel model ooit perfect kan zijn, zegt hij. Een model is een benadering van de werkelijkheid. Maar, voegt hij er meteen aan toe: trainers, scouts en andere voetbalkenners gebruiken ook een model. Dat model zit in hun hoofd en is opgebouwd uit herinneringen en overtuigingen. Het is alleen niet zo gestructureerd als het zijne, en de herinneringen zullen selectief zijn. ‘En’, zegt Seidel, ‘we weten dat voetbalclubs regelmatig slechte beslissingen nemen bij hun aankoopbeleid.’ Goalimpact is niet selectief - alle minuten van een speler, de goede en de slechte acties, alles staat erin.
Moeten clubs hun scouts dan maar ontslaan?
Nee, zegt Seidel. Zijn model dient gebruikt te worden in combinatie met het kwalitatieve oordeel van de scouts en trainers. Twee onafhankelijke oordelen over een speler dus.
Dat gezegd hebbende: Seidel vertrouwt zijn model. Het model baseert zich namelijk op decennia en decennia aan voetbaluitslagen en speelminuten van spelers (de oudste wedstrijd in zijn model is uit 1903).
En het in data gecondenseerde oordeel van de voetbalgeschiedenis is dat als je vanavond de niet-zo-glamoureuze trip maakt naar het Frans Heesenstadion in Oss, je waarschijnlijk een bovenmatige getalenteerde voetballer aan het werk zult zien: Justin Mathieu .