Voor mijn masterscriptie verzamelde ik data in Oeganda. Drie weken lang reisde ik rond met vragenlijsten, ik sprak bijna tweehonderd mensen. Ik vroeg de respondenten of ze een mobiele telefoon bezaten en stelde vragen over

Vol moed keerde ik terug naar Nederland. Nu zou ik de vraag kunnen beantwoorden: is de mobiele telefoon een armoedebestrijder? Zet het telefoonbezit naast het inkomen en, voilà, je weet wat het verband is.

Dat verband bleek sterk. Significant, in statistisch lingo. Mensen die een mobiele telefoon hadden, hadden vaak ook een hoger inkomen. Maar mijn enthousiasme ebde al snel weg. Hoe kon ik nu weten of dat hogere inkomen ook door de mobiele telefoon was veroorzaakt?

Correlatie is geen causaliteit

Als onderzoeker krijg je er ingeramd dat ‘correlatie niet gelijk is aan causaliteit’. Als twee dingen tegelijk gebeuren of bij dezelfde groep mensen, wil dat nog niet zeggen dat het een het ander ook veroorzaakt.

Bekend voorbeeld: er is een relatie tussen schoenmaat van kinderen en hoe goed ze kunnen lezen. Maar dat betekent niet dat je schoenmaat je leesniveau beïnvloedt (of, gekker nog, dat je grotere voeten krijgt als je goed kunt lezen).

Als twee dingen tegelijk gebeuren of bij dezelfde groep mensen, wil dat nog niet zeggen dat het een het ander ook veroorzaakt

Nee, er is een derde ‘verstorende variabele’: leeftijd. Oudere kinderen hebben én grotere voeten én kunnen beter lezen.

Zo was het ook met mijn onderzoek naar mobiele telefonie en inkomen. Ook hier kon een verstorende variabele zijn. Ondernemingszin, bijvoorbeeld. Iemand is ondernemend, koopt een mobiele telefoon én heeft een hoger inkomen doordat hij of zij hosselt.

Bij mijn scriptie-onderzoek was nog iets aan de hand: het verband kon ook andersom lopen. Om een mobiel te kopen, heb je immers geld nodig. Dus had het hoge inkomen net zo goed het mobiele telefoonbezit kunnen veroorzaken.

Hoe weet je het dan wel?

Maar hoe weten we dan wél of er sprake is van een oorzakelijk verband? Een belangrijke vraag, die raakt aan veel grote vraagstukken. Hoe weten we dat CO2 opwarming van de aarde veroorzaakt? En of een beleidsverandering helpt tegen werkloosheid?

Een claim over een oorzakelijk verband afbranden is eenvoudig. Het bewijzen? Dat is lastig, maar niet onmogelijk. Ik werk nu aan een stuk over de verschillende methoden waarmee je een oorzakelijk verband wel hard kunt maken.

Neem een gecontroleerd experiment, zoals in de geneeskunde veel wordt gebruikt. Een behandeling wordt willekeurig toegewezen aan een groep mensen. Vergelijk deze patiënten met een controlegroep en je krijgt een beeld van de werking.

Maar er zijn ook andere mooie manieren, zoals een ‘natuurlijk experiment’. Er is dan in de ‘echte wereld’ - dus niet in het laboratorium - een situatie ontstaan die het testen van een oorzakelijk verband mogelijk maakt. Vaak niet omdat de onderzoeker dat zo heeft bedacht, maar bijvoorbeeld omdat de overheid nieuw beleid invoert.

Zo werd in 2006 besloten dat mensen die in 1950 of later waren geboren verminderd recht hadden op vervroegd pensioen. Wat waren de gevolgen van dat beleid? Dat kun je testen door mensen die in 1949 geboren zijn te vergelijken met mensen geboren in 1950. De belangrijke aanname: de twee groepen zijn hetzelfde, afgezien van het pensioenbeleid.

Voorbeelden gezocht

Zelf deed ik in mijn scriptie een onvruchtbare poging met een methode die ‘instrumentele variabelen’ heet. Later publiceerde ik dat gebruikmaakte van de ‘copulamethode’, die alleen werkt onder strikte aannames.

Ik heb aan den lijve ondervonden hoe moeilijk het is om onderzoek te doen naar oorzaak en gevolg

Ik heb aan den lijve ondervonden hoe moeilijk het is om onderzoek te doen naar oorzaak en gevolg. Daarom heb ik extra bewondering voor wetenschappers die met slimme, creatieve oplossingen komen voor dit soort netelige vraagstukken.

Ik ben op zoek naar mooie voorbeelden. Ken jij interessant wetenschappelijk onderzoek naar oorzaak en gevolg? Ik hoor het graag. Alvast veel dank!

Een deel van de oproep verscheen deze week ook in

Op de hoogte blijven van mijn artikelen? Als correspondent Ontcijferen onderzoek ik de getallenwereld. In mijn wekelijkse mail houd ik je op de hoogte van wat ik schrijf, hoor en lees. Een vast onderdeel: #NerdAlert, voor de getallenliefhebbers. Schrijf je in voor mijn nieuwsbrief

Verder lezen?

De tabaksindustrie maakte van twijfel een dodelijk wapen (en klimaatsceptici volgen gretig dit voorbeeld) Hoe kun je liegen met statistiek? Uitgerekend de journalist die schreef over de onbetrouwbaarheid van cijfers liet zich inhuren door de tabaksindustrie om twijfel te zaaien over de dodelijke gevolgen van roken. En werd daarmee een lichtend voorbeeld voor andere schadelijke industrieën die hun belangen proberen te beschermen. Lees mijn verhaal hier terug

Mijn TEDx-talk: Zo verdedig je jezelf tegen cijfergeweld in het nieuws Wat doe je als je een peiling in het wild tegenkomt? Hoe zet je een grafiek op haar plek? En hoe zorg je ervoor dat je niet verdrinkt in de eindeloze stroom dieetadviezen? Daar sprak ik onlangs over bij TEDxMaastricht. Bekijk hier mijn TEDx-talk