Het is 1633. In het Duitse dorpje Oberammergau stapelen de doden zich op. Ging een paar maanden terug nog een op de duizend inwoners dood, nu is dat gestegen naar twintig op de duizend per maand. De builenpest houdt genadeloos huis hier in het zuiden van het land.

De dorpelingen krijgen een idee: wat als ze aan God beloven dat ze elke tien jaar een toneelstuk opvoeren over het leven van Jezus? Ze bidden dat ze tot in de eeuwigheid zulke passies zullen organiseren.

Na het gebed wordt geen enkele nieuwe inwoner meer ziek. De dorpelingen die nog aan de pest lijden, genezen. Er heeft zich een wonder voltrokken. De gelofte heeft geholpen. In 1634 vindt de eerste

Denkfouten in tijden van epidemie

Nog altijd wordt elke tien jaar de Oberammergau-passie georganiseerd. De ontstaansgeschiedenis is verworden tot een lokale legende. Hoe het echt verliep, is lastig te achterhalen. Maar het toont hoe een denkfout gemakkelijk te maken is, zeker in tijden van onzekerheid.

Dat er niemand meer stierf aan de pest na het gebed is misschien waar. Dat het sterven door het gebed ophield, is erg onwaarschijnlijk. Een klassiek voorbeeld van het door elkaar halen van correlatie en causaliteit. In die fout zul je vandaag de dag niet snel meer trappen.

Dat betekent niet dat er bijna vier eeuwen later geen denkfouten meer worden gemaakt. Ook nu, in het coronatijdperk, zie je bijna dagelijks fouten met cijfers of redeneringen langskomen.

Neem deze kop van de Financial Times: Een nieuw epidemiologisch model zou volgens het artikel laten zien dat de grote meerderheid nauwelijks of niets van de ziekte merkt. Zo bleek dat de helft van de Britse bevolking misschien al corona heeft gehad, de meesten zonder het te merken. Koren op de molen van mensen die vinden dat al die maatregelen maar overdreven zijn.

Maar wie erbij pakt, ziet: het is een theoretische exercitie. De wetenschappers onderzochten hoe gevoelig de uitkomst van een epidemiologisch model is voor verschillende aannames. Een belangrijke variabele in het model: ‘rho’ – het aandeel van de bevolking dat ernstig ziek zal worden.

Als ze aannemen dat die rho gelijk is aan 0,1 procent – slechts een op de duizend geïnfecteerden wordt ernstig ziek – dan zou dat volgens het model betekenen dat 68 procent van de Britse bevolking al corona heeft gehad. Want al liggen de ziekenhuizen misschien vol, er is ook een hele grote groep die het heeft gehad zonder het te merken.

Alleen: dat hangt helemaal af van de aanname in dit toch al versimpelde model. Is die rho groter, dan ziet het er een stuk minder rooskleurig uit. En wat die waarde precies is, weten we niet, want daarvoor zouden we uitgebreider moeten Zoals de eerste auteur ook zei: ‘Dit zijn geen voorspellingen.’

In schreef ik over de belangrijkste cijfers in het debat over het coronavirus. Vandaag duik ik dieper in de interpretatie van die cijfers. En vooral wat daarbij mis kan gaan.

Je hoeft geen epidemioloog te zijn om de onzin te herkennen in de berichten die je langs ziet komen. Zoals wetenschapsjournalist Hans van Maanen ooit schreef: ‘We kunnen geen ei leggen, maar soms wel ruiken of het rot is.’

Deze drie fouten kwamen de laatste weken langs. En je komt ze geheid komende tijd weer tegen.

1. Cherry picking

Je hebt hem misschien wel langs zien komen, de tabel die de trend in sterfgevallen in Nederland naast die in Italië legde. De boodschap: we gaan Italië achterna! En inderdaad, kijk je naar de twee cijferreeksen, dan lijken die griezelig veel op elkaar.

Bron: AD.nl

Alleen, het hangt er maar net vanaf wanneer je begint met tellen. Want waarom begint deze tabel op 16 maart in Nederland te tellen en in Italië op 29 februari?

De tabel begint voor de twee landen niet op dezelfde datum. Dat is logisch: in Italië dook het eerste coronageval op 31 januari op, in Nederland pas op 27 februari. De eerste Italiaanse dode viel op 21 februari, de eerste Nederlander stierf op 6 maart

Wanneer begin je dan wel met tellen? De tabel kiest 16 maart voor Nederland, maar dat lijkt willekeurig – sinds het eerste bevestigde geval zijn dan verstreken, sinds de eerste dode tien. 29 februari voor Italië lijkt net zo arbitrair, 29 dagen sinds het eerste bevestigde geval en acht dagen sinds de eerste dode.

De tabel lijkt bij uitstek een voorbeeld van cherry picking – data zo selecteren en masseren dat ze perfect passen bij je argument. In dit geval: pas op, we gaan precies de kant van Italië op!

Maar het hangt er maar van af wanneer je begint met tellen. Het Algemeen Dagblad dat de situatie er in Nederland – in absolute getallen – beter uitziet als je begint te tellen bij de eerste dode, een logischer startpunt. En nog beter als je pas begint te tellen bij de honderdste besmetting.

Bron: AD.nl

2. Appels met peren vergelijken

Deze tabel is niet de enige die landen vergelijkt. Zo kijken we allemaal nieuwsgierig naar ontwikkelingen in Azië, en zou Zweden laten zien dat je ook

Hoe verleidelijk ook, het is oppassen met die vergelijkingen. Want de volgende denkfout ligt op de loer: appels met peren vergelijken. Je doet alsof twee situaties vergelijkbaar zijn, terwijl er verschillen zijn die dat onmogelijk maken.

Neem Italië en Nederland. Allereerst hebben de twee landen een andere bevolkingsopbouw. Italië heeft de groep die het grootste risico loopt om te sterven aan corona.

Ook heeft Italië maatregelen anders uitgerold dan Nederland. In Nederland werd op 12 maart besloten dat evenementen met meer dan honderd man niet door mochten gaan, dat mensen met milde klachten thuis moesten blijven en iedereen waar mogelijk thuis moest werken. Dat was vijf dagen na het eerste sterfgeval. Drie dagen later volgden nog strengere maatregelen, zoals het sluiten van scholen en horecagelegenheden. Italië ging ‘pas’ op 9 maart op slot, zeventien dagen na de eerste dode. Maar maatregelen zijn daar intussen wel strenger – zo is ook veel productie stilgelegd.

Wat ook mee kan spelen: in Italië is het vrij gewoon dat meerdere generaties in één huishouden wonen. Italianen tussen de dertig en vijftig jaar oud wonen relatief vaak bij hun ouders – kwam op een aandeel van meer dan 20 procent van die leeftijdsgroep, tegenover minder dan 5 procent voor Nederland. Omdat ouderen bij uitstek kwetsbaar zijn voor corona, kan dit een extra risico opleveren.

Zo kun je nog wel even doorgaan met de verschillen tussen de twee landen – een ander zorgsysteem, een andere manier van tellen, een andere algemene gezondheid. Het blijft speculeren hoe groot de rol van al die factoren is. Maar zolang je ze niet kunt uitsluiten, is het lastig vergelijken. Dat betekent niet dat we absoluut niet de kant van Italië opgaan. Wel dat je dat niet kunt zeggen op basis van een tabelletje.

Nog zo’n vergelijking die verleidelijk is: die met de griep. Bijvoorbeeld in in de Volkskrant van Ira Helsloot en Peter Olsthoorn: ‘Ja, er vallen wellicht nog vele honderdduizenden doden wereldwijd, mede door corona. Naar, maar een fact of life in een wereld waar jaarlijks 56 miljoen mensen overlijden, van wie 600 duizend aan griep. Wie van hen redden we?’

Je hoort vooral veel over de griep-epidemie van 2018, toen in Nederland 16.000 ziekenhuisopnamen waren en er een was van 9.444 mensen. Het is natuurlijk belangrijk om de huidige situatie in perspectief te zetten. Slaan we niet wat door? Maar ook hier geldt weer: de twee situaties zijn niet te vergelijken.

Überhaupt is SARS-CoV-2 – het virus dat de ziekte covid-19 veroorzaakt – anders dan de influenzavirussen die Treft griep vaak – naast ouderen – ook kinderen, van corona worden ze nauwelijks ziek. Ook lijken de symptomen van corona heftiger te zijn dan die van griep. Ook is corona nieuw, en is er dus nog geen vaccin ontwikkeld of natuurlijke afweer opgebouwd.

Maar er is een andere reden dat dit appels met peren vergelijken is. Want de griep-epidemie van 2018 is voorbij, de corona-epidemie is nog volop aan de gang. We weten nog niet wat voor cijfers we uiteindelijk zullen moeten vergelijken, want we weten niet hoe de toekomst eruitziet.

Dat benadrukt ook socioloog Tanja Traag van het Centraal Bureau voor de Statistiek (CBS), in gesprek met het ‘Wat mensen niet moeten vergeten is dat die ruim 9.400 extra sterfgevallen in de griepgolf van toen vielen in een periode van achttien weken. Dat zijn dus gemiddeld 75 sterfgevallen per dag. Dat is vergelijkbaar met of lager dan de sterfgevallen aan corona de laatste dagen. We weten alleen niet of die aantallen doorzetten.’

3. Schijnzekerheid

Dagelijks krijg je updates over hoe het nu staat met corona. Op een van de eerste pagina’s op de krant, in een pushbericht van je nieuws-app, in een update van het RIVM – elke dag hoor je hoeveel nieuwe gevallen er zijn en hoeveel mensen er aan corona zijn overleden. Op YouTube kun je zelfs live volgen wat er wereldwijd gebeurt qua cijfers.

YouTube
Payette Forward: ‘Coronavirus LIVE Map: [Updated Every 2 Minutes] Live Stream Stats, Updates, Graph, World Map & Count’

Alleen: de precisie van die cijfers is misleidend. Neem het aantal coronagevallen. Dat aantal weten we simpelweg niet, want lang niet iedereen wordt getest. Heb je milde symptomen, wat goed mogelijk is bij covid-19, dan hoef je de dokter niet eens te bellen. Überhaupt wordt er terughoudend getest, omdat er niet genoeg testen zijn. We weten dus enkel de bevestigde gevallen.

Ook op de overlijdenscijfers is het een en ander af te dingen. Sowieso goed om te weten: soms duurt het even voordat de GGD een overlijdensgeval doorgeeft aan Het kan dus zijn dat een geval pas een paar dagen later opduikt in de cijfers.

Maar er is nog iets aan de hand met de sterftecijfers: een geval wordt alleen meegeteld als iemand daadwerkelijk positief getest is op corona. dat dit een onderschatting geeft van het aantal doden, omdat er terughoudend wordt getest. Zij zien dat patiënten overlijden met corona-achtige klachten maar nooit in de cijfers terechtkomen. Ook in onder andere en wordt gevreesd dat het aantal doden wordt onderschat.

Het kan nog erger. In Iran werden op 20 februari de eerste coronagevallen gerapporteerd. Alleen: dat waren ook meteen sterfgevallen. Dat is vreemd, want het duurt zeker een paar weken voordat infectie met het coronavirus leidt tot overlijden. Dus, is de logische conclusie, het virus was al langer in het land en het aantal gevallen was veel hoger dan Is dat opzet, geklungel of simpelweg gebrek aan capaciteit? We zullen het waarschijnlijk nooit weten.

Kortom, in het beste geval moet je de cijfers met een grote korrel zout nemen, in het slechtste kun je ze misschien helemaal niet

Wat kun je dan wel zeggen?

Dit is natuurlijk allemaal frustrerend. Je wilt graag houvast, begrijpen wat er gebeurt. Wat weten we dan wel?

Jaap van Dissel, directeur van het Centrum Infectieziektebestrijding van het RIVM, zei tijdens een briefing voor de Tweede Kamer dat de bevestigde gevallen inderdaad geen goede reflectie van de omvang van de corona-situatie in Nederland geven. En dat internationale vergelijkingen lastig te maken zijn.

De hardste cijfers, vindt hij, zijn de ziekenhuisopnames en, in het bijzonder, het aantal ic-bedden dat bezet wordt door corona-patiënten. Daar is niet zoveel mis te tellen, zoals bij die andere cijfers, en het is dus een betere graadmeter van hoe het gaat. Ook is het vooral zinvol om naar trends in de cijfers te kijken. Want een schommeling kan ook toevallig zijn of door een vertraging in het rapporteren komen.

Uiteindelijk hoop je dat de onzekerheid in de data minder wordt. Door meer te testen, en niet alleen als daar een directe medische aanleiding voor is. Om zo te zien wie ziek zijn (geweest), hoe ernstig en hoe besmettelijk het virus is, en hoe die zaken samenhangen met factoren

Maar tot die tijd moeten we vooral door onze oogharen naar de cijfers kijken. En de volgende Oberammergau-passie? Die was in 2020 gepland, maar moest worden afgelast. Wegens corona.

Met dank aan Floris van Proosdij, die me wees op het voorbeeld van Oberammergau. En aan Jaime Borjas, die een deskundig oog wierp op dit artikel.

Op de hoogte blijven van mijn artikelen? Als correspondent Ontcijferen onderzoek ik de getallenwereld. In mijn wekelijkse mail houd ik je op de hoogte van wat ik schrijf, hoor en lees. Een vast onderdeel: #NerdAlert, voor de getallenliefhebbers.
Schrijf je in voor mijn nieuwsbrief
These are the three most important fallacies in the coronavirus debate Read this article in English

Verder lezen?

Waarom slimme mensen domme dingen zeggen Iedereen valt over elkaar heen met feiten en cijfers over het coronavirus. Maar bij het interpreteren van die informatie kan je eigen onderbuik zomaar in de weg zitten. Lees mijn artikel hier terug Corona in context: een gids die je helpt de pandemie te begrijpen In deze gids delen we de belangrijkste inzichten uit onze eigen journalistiek over de pandemie. Ook gidsen we je naar de belangrijkste journalistiek, academische publicaties en andere relevante bronnen die we elders tegenkomen. Lees onze coronagids