‘Woz’ is de meest voorspelbare vrouw in het tennis. Toch bleef ze winnen. Hoe dan?
Het tennis bezit data waar andere sporten stikjaloers op zijn – maar die data zijn niet openbaar en de sport doet er zelf weinig mee. Dan doen wij het wel, dacht een groep enthousiaste vrijwilligers. In hun vrije uurtjes noteren ze slag na slag, en doen ze ontdekking na ontdekking.
De volgende keer dat je Caroline Wozniacki – de voormalige nummer 1 op de wereldranglijst, ook wel: ‘Woz’ – ziet tennissen op televisie, dan is het de moeite waard om op haar servicegames te letten.
Ze doet namelijk altijd hetzelfde bij haar services. De eerste vier volgen een vast patroon: eerste punt: naar buiten. Tweede punt: door het midden. Derde punt: door het midden. Vierde punt: naar buiten. Wide-T-T-wide, in tennisjargon.
Na die eerste vier services is Wozniacki weer zeer onvoorspelbaar – zoals tennissers in theorie ook horen te zijn. Maar tot die tijd is het dus W-T-T-W. Niet soms, niet regelmatig, niet vaak, nee: vrijwel altijd. 94 procent van de tijd volgt ze dit patroon.
Caroline Wozniacki is daarmee, zoals een tennisanalist schreef, ‘The Most Predictable Woman in Tennis’.
Die voorspelbaarheid is een groot nadeel in een tennisgevecht – in theorie en in de praktijk. Juist aan de top, waar de verschillen tussen spelers klein zijn, is voorspelbaarheid killing. Om succes te hebben moet je juist onvoorspelbaar zijn. En inderdaad: hoe beter de tennisser, hoe onvoorspelbaarder diens opslagen, wees recent wetenschappelijk onderzoek uit.
En dat maakt ‘Woz’ tot een curiositeit: hoe kon ze, ondanks dat ze haar opslagen jarenlang ‘telefoneerde’ naar haar tegenstanders, toch 73 weken lang de nummer 1 van de wereld zijn?
Je gaat het pas zien als je het doorhebt: de tenniseditie
De ontdekker van Wozniacki’s ogenschijnlijke zwakte is een Nederlandse econoom: Kees Haasnoot. Overdag is Haasnoot (34) docent economie aan de Universiteit van Amsterdam. In zijn vrije avonduurtjes rondt hij zijn promotieonderzoek af. En in de uurtjes na die vrije uurtjes verzamelt hij nieuwe tennisdata.
Haasnoot is een van de tientallen vrijwilligers van het Match Charting Project, een initiatief van data-analist Jeff Sackmann. Vrijwilligers over de hele wereld kijken en coderen (‘charten’) tenniswedstrijden. Fore- of backhand; volley, smash of halfvolley; richting van de bal; diepte van de bal; of het een fout was (en wat voor fout: te wijd, te lang, of beide, in het net, afgedwongen of niet); of het een winner (een slag die het punt beslist) was; en de slagrichting van de speler.
Onlangs, op een zaterdagavond, zat Haasnoot een recente wedstrijd* tussen Mirra Andreeva en Diane Parry te charten. Parry serveert naar rechts, rukt op naar het net, volleert en wordt gepasseerd. ‘4+F3z29p19*’, typt Haasnoot in. ‘4’ is de richting van de service, ‘+’ naar het net, ‘F3’ = forehand naar rechts, ‘z29’ is een diepe (9) backhandvolley (z) door het midden (2), ‘p19’ is een diepe backhand naar Parry’s rechterkant, ‘*’ is een winner.
Multitasken is een mythe, zegt de wetenschap, maar als je Haasnoot bezig ziet zou je zweren van niet. Hij codeert de slagen in real time, zonder hapering, en legt ondertussen uit wat hij doet. ‘Tenniswedstrijden charten is voor mij wat breien is voor anderen’, zegt hij. ‘Nietsdoen maar toch bezig zijn, en zo extra genieten van een wedstrijd.’
Haasnoot begon begin 2019 met coderen – en sindsdien chartte hij al zo’n 1.500 tenniswedstrijden. Inderdaad: gemiddeld een volledige tenniswedstrijd per dag, in de vrije uurtjes van de vrije uurtjes. Op deze manier ontdekte* hij begin april 2019 de verbazingwekkende voorspelbaarheid van Caroline Wozniacki.
‘Woz’ speelde die dag in het Amerikaanse Charleston tegen de Duitse Laura Siegemund. Tijdens een pauze overlegde Siegemund met haar coach, Antonio Zucca. Zucca zei dat ze meer risico moest nemen op Woz’ opslag. Want: ‘She’s going like Sharapova. Wide, T, T, wide […] The first four are always like this.’
Haasnoot luisterde mee. Always? ‘Ik dacht: dat kan niet waar zijn.’ Hij keek naar wat hij zelf had zitten charten. En verrek: Wozniacki had volgens dit patroon geserveerd. Hij keek naar het vervolg van de wedstrijd, en verdomd: Woz bleef het doen. Hij zocht een wedstrijd op YouTube op en – jawel – ook daar deed ze het.
Haasnoot passte zijn bevindingen door aan Sackmann, die al Wozniacki’s wedstrijden in zijn database erbij pakte en van zijn stoel viel. Sackmann schreef er een blogpost over, The Most Predictable Woman in Tennis. Ook bij de recente Australian Open volgde ze in haar opslagbeurten haar perfect voorspelbare schema.
Wat Wozniacki erover zegt? Voorlopig niks. Een vraag over haar servicestrategie, die werd gesteld op Wozniacki’s website, blijft vooralsnog onbeantwoord. Misschien denk je nu: niets zeggen is slim. Haasnoot ziet het anders. ‘Ze zou juist kunnen zeggen: inderdaad, dat is wat ik doe, om die en die reden. Als ik Wozniacki was, zou ik dat toegeven. En dan op beslissende momenten iets anders doen.’
Wat weet het tennis van zichzelf?
Wozniacki’s voorspelbaarheid is een van de geestige inzichten die de subcultuur van de data-analyse in het tennis heeft voortgebracht.
Er zijn er meer: er zijn geen spelers die op breakpoints (als je de servicegame van de tegenstander kunt winnen) duidelijk beter of slechter* zijn dan op andere punten. (Enige echte uitzondering: Rafael Nadal.)* Jo-Wilfried Tsonga is de beste smasher in het tennis aller tijden – wat hem een plek hoger* op de wereldranglijst doet belanden. Dropshots (korte balletjes vlak achter het net) zijn meestal een slecht idee.*
De zevende game is, in tegenstelling tot de wijdverspreide commentatorenwijsheid,* niet de belangrijkste game* in de set. Hoeveel procent van alle punten in een tenniswedstrijd wint de gemiddelde winnaar van een wedstrijd? (Het antwoord: klik hier.) En, heel basaal maar toch verrassend: 80 procent van de rally’s in het tennis duurt vier slagen of minder.
Interessant, maar vergeleken met de opmars van data-analyse in andere sporten blijft het tennis achter. Er is nooit een levendige blogcultuur geweest (Sackmann ís zowat de blogosfeer). Er zijn ook geen data-analytici in dienst bij tennissers, anders dan in het honkbal, basketbal en voetbal, waar data-analisten nu soms zelfs de baas zijn.
Een reden daarvoor is een gebrek aan data. In het voetbal, honkbal en basketbal is dat er niet, omdat data over die sporten vrijelijk beschikbaar zijn op het internet. In het tennis zijn die gegevens er nauwelijks, waardoor tal van interessante vragen onbeantwoord blijven: zijn services en returns van bepaalde spelers voorspelbaar?
Bij welke slag is het de moeite waard om naar het net op te rukken: een langzame slice of een hardere vlakke bal? En wanneer, tegen wie en hoe vaak hebben dropshots zin? Of: hoeveel risico moet ik nemen met mijn backhands? Wanneer kost dat risico mij te veel punten, en wanneer kost veiligheid mij juist te veel punten?
Pas in 2017, in de herfst van zijn carrière, begon* Roger Federer meer risico te nemen met zijn backhands. Had hij dat eerder gedaan als er data-analyse beschikbaar was? Vermoedelijk wel. Kortom: met de juiste data kun je nieuwe tenniskennis ontwikkelen.
Tennisdata zijn de mooiste sportdata – maar het tennis doet er niks mee
Data-analyse in het tennis bestaat dus niet, omdat analisten niet beschikken over data. Maar die data bestaan wel! Sterker: het tennis bezit data waar andere sporten hun vingers bij aflikken.
Zo heeft het sinds 2006 Hawk-Eye; super scherpe camera’s die aangeven of een met 230 kilometer per uur geslagen service in of uit is. Maar Hawk-Eyes camera’s registreren veel meer: waar de bal landt, de snelheid van de bal, de spin van de bal, het raakpunt van de bal, de posities van de spelers. Een ware schatkist voor analisten.
Alleen: deze data worden nergens centraal verzameld en verspreid. Elk toernooi registreert, behoudt en negeert deze data afzonderlijk. Dus staat de ‘rijkste’ dataset in de sport op servers te beschimmelen.
Dit is extra jammer omdat het tennis zich als individuele sport goed leent voor data-analyse. Het toeschrijven van plusjes (goed gedaan!) en minnetjes (slecht gedaan!) is bij tennis beter te doen dan bij teamsporten. Scoort een voetbalspits nou zo vaak omdat hij zo goed is, omdat hij goede voorzetten krijgt of omdat hij de enige aanvaller van zijn team is? De onderlinge afhankelijkheid maakt de bijdrage van het individu lastig te isoleren.
Het tennis is overzichtelijker. Als een serveerder veel of weinig punten scoort met zijn eerste opslag, dan ligt dat voor het allergrootste deel aan hemzelf. Als je een heleboel dropshots slaat – met succes of niet – ook. Zoals Haasnoot zegt: ‘Op dezelfde manier waarop je bij voetbal vraagt: “Hoeveel draagt deze speler bij?”, kun je bij tennis vragen: “Hoeveel draagt deze slag bij?”’
Maar ieder voordeel heeft zijn nadeel: juist omdat tennis een individuele sport is, is er weinig vraag naar analyse. Er is geen markt voor tennisspelers, zoals bij teamsporten. Coaches en technisch directeuren in het voetbal willen zo goed als mogelijk weten welke spelers hoeveel bijdragen aan het teamresultaat. Logisch, want ze betalen hun miljoenensalarissen.
In het tennis zijn er geen spelers die je kunt contracteren; er is geen transfermarkt. Als een speler wint of verliest, ligt dat aan hem of haar alleen. Dus ontbreekt er een belangrijke prikkel om precies te achterhalen wat wel en niet werkt in het tennis. Er ontbreekt een marktspeler met een groot belang.
Coaches en spelers dan? Die hebben die prikkel wel, zou je zeggen. Maar blijkbaar ook weer niet zo sterk om er grof tijd, geld en energie in te steken. Je moet dan immers data kopen van al die verschillende toernooien, je moet een analist vinden om die data te analyseren en je moet kunnen bepalen of die analist zinnige dingen te vertellen heeft.
En zelfs als dat alles geen bezwaar is, dan nog wordt het lastig, want goede analisten zijn schaars, omdat in het tennis nooit een subcultuur van analytics is ontstaan. Zodoende is er al jaren sprake van een impasse: tennis heeft de mooiste data van alle sporten, maar doet er niks mee.
'Iemand moet de software leren wat een dropshot is'
Dit was de reden voor Jeff Sackmann om in 2013 te beginnen met het Match Charting Project: dan maken we die data zelf wel. Ook al is het charten voor Haasnoot ontspanning, over een tijdje zal hij ermee stoppen, denkt hij.
‘Computer vision’, het vermogen van algoritmes om automatisch data te destilleren uit camerabeelden, gaat met grote sprongen vooruit. Wat Haasnoot en zijn collega-vrijwilligers nu nog ambachtelijk handmatig doen, kan over enkele jaren als vanzelf gaan. Heeft zijn vrijwilligerswerk daardoor nog wel nut?
Jazeker, zegt Haasnoot. Het dient als training van de algoritmes van de nabije toekomst. Ja, binnenkort kan AI zijn werk doen, maar alleen als het weet waar het naar kijkt. ‘Iemand moet die software leren wat een dropshot is, wat topspin is, wat een volley is. Dat zijn wij, wij geven AI de trainingsdata.’
Als wedstrijden eenmaal automatisch worden gechart, kunnen spelers en coaches hun eigen spel en dat van hun tegenstanders vrijwel gratis analyseren. Simpele patronen zullen snel worden blootgelegd, patronen die tot nu toe de oplettendheid van mensen als Haasnoot vroegen. Zelf leeft hij, op zijn eigen amateurniveau, al in de toekomst. Gewoon, op een weinig futuristische baan in de Utrechtse wijk Leidsche Rijn.
Hij filmt zijn tenniswedstrijden met zijn mobieltje, opgehangen aan het hek achter de baan, terwijl een app op zijn telefoon in real time de slagen analyseert: snelheid, fore- of backhand, spin, richting, type slag. De categorieën zijn nog niet zo verfijnd als in Sackmanns project, en de accuratesse van de app is nog niet perfect. Maar het werkt al verbluffend goed, zo blijkt uit een opname van een van zijn eigen wedstrijden.
Zelf heeft hij er al wat van geleerd: als zijn beste vriend een tweede service heeft, moet hij nog verder naar voren instappen. ‘Ik moet niet als een angstig vogeltje in het hek hangen, maar op een normale plek gaan staan.’ Het voelt eng. Het voelt als een groot risico. ‘Maar in de data zag ik het: mijn returns eindigden dieper.’