Vijf woorden die volgens statistici de wereld kunnen veranderen
In Kaapstad begaf ik me vier dagen lang in het walhalla voor datagekkies: het World Data Forum van de Verenigde Naties. De gangen zoemden hier van het jargon. Onbegrijpelijke woorden, die de wereld zomaar eens zouden kunnen veranderen. Leve de datarevolutie!
‘Hallo mensen!’ zegt de vrouw als ze het woord krijgt. De mannen links en rechts van haar aan tafel grinniken even. Dan antwoorden ze in koor: ‘Hallo!’ Beiden dragen een grijs pak met blauwe das en een onopvallende bril. De conferentiebadge bungelt aan een wit keycord om hun nek. Ze zijn bijna symmetrisch, alleen hun zijscheiding dragen ze aan verschillende kanten.
‘Ik ben geen statisticus,’ gaat de vrouw verder. ‘Mijn naam is Nnenna en ik kom van het internet.’ Afgezien van het keycord lijkt de vrouw in niets op de mannen. Haar huidskleur is zwart, haar jurk blauw, geel en rood. Eerder die week zag ik haar tijdens haar eigen praatje ineens een sjaal bovenop haar hoofd leggen.
Ik ben op het World Data Forum in Kaapstad, waar twee diersoorten bij elkaar komen: de statistiekmensen en de datamensen.
De twee mannen horen bij die eerste groep. Het zijn statistici, die werken voor een statistisch bureau of voor de statistische tak van een internationale club zoals de VN.
Nnenna ‘van het internet’ hoort bij de datamensen, de new kids on the block. Ze werken bij ngo’s of bedrijven, en experimenteren met dingen als Big Data en datavisualisatie.
En die twee groepen komen elkaar nauwelijks tegen. Er heerst dan ook een lichte wij-zij-mentaliteit. De statistiekmensen zijn ‘conservatief,’ de datamensen ‘geen echte statistici.’
Maar als je goed luistert, hoor je dezelfde taal. Onbegrijpelijke taal, maar toch. Ze knikken als het over multistakeholder partnerships gaat, en pleiten vol hartstocht voor disaggregation. En iedereen, maar dan ook echt iedereen, is het erover eens dat het tijd is voor betere data en statistiek.
Of, om maar even in het jargon te blijven: het is tijd voor een datarevolutie.
Datawatte?
Zonder goede cijfers zouden we niet weten hoe erg de armoede is. Niet dat vrouwen worden benadeeld of dat overleden kinderen überhaupt ooit geboren waren. Je hebt cijfers nodig om problemen te signaleren en ze vervolgens op te lossen.
Maar in veel lage- en middeninkomenslanden zijn de cijfers van lage kwaliteit of ze bestaan simpelweg niet. Daardoor weten we eigenlijk veel minder over armoede, honger en andere belangrijke zaken dan we denken.
Vandaar dat het tijd is voor die datarevolutie. In Kaapstad sprak ik met twintig mensen over wat die revolutie precies inhoudt. Mensen van statistische bureaus uit Argentinië, Mongolië, Zuid-Afrika en Nederland. Mensen van de Verenigde Naties en de Wereldbank. Mensen van start-ups en ngo’s.
Al hun verhalen zijn samen te vatten in vijf buzzwoorden. Woorden die een slapeloze met een speedprobleem nog in slaap kunnen sussen. Maar - vinden de mensen in Kaapstad - die woorden zouden zomaar de wereld kunnen veranderen.
Ze nemen in het kleurige blokkenschema van de conferentie niet eens de moeite om deze afkorting uit te schrijven. Want iedereen hier weet waar dit voor staat: Civil Registration and Vital Statistics.
Een goed CRVS-systeem registreert voor elk persoon de belangrijkste gebeurtenissen in zijn leven - denk aan geboorte, huwelijk en dood. In Nederland en België is dat zo normaal dat je er niet meer bij stilstaat. ‘Zelfs onze koeien en schapen staan geregistreerd!’ roept een Brits echtpaar dat een ngo (en een huis op het platteland) runt.
Maar zo’n systeem is lang niet overal vanzelfsprekend. Op de conferentie hoor ik: in meer dan honderd landen bestaat geen compleet bevolkingsregister.* Zo wordt geschat dat bijna een kwart miljard kinderen onder de vijf jaar niet geregistreerd staan. Dat is één op de drie kinderen wereldwijd.*
Waarom dat erg is? Als je aanspraak wilt maken op bepaalde rechten, moet je vaak aantonen dat je bent wie je zegt dat je bent. Bij het aanvragen van een uitkering, het ontvangen van gezondheidszorg, het registreren van het land dat je bezit.
En dus kies ik een blauw blokje uit in het programma over innovaties op het gebied van CRVS. Een man uit Zuid-Afrika laat een foto zien van grote stapels papier. In het ministerie van Binnenlandse Zaken alleen al liggen 2,8 miljard documenten die ingescand moeten worden. Het oudste stamt uit 1789.
‘Kijk, zie je, mijn oog trilt,’ lacht Emily Courey Pryor. ‘Ik heb maar drie uur geslapen vannacht.’ Als directeur van Data2X, zet Pryor zich dag en (blijkbaar) nacht in voor meer en betere data op het gebied van sekse.
In de koffiecorner van het congrescentrum vertelt de Amerikaanse: we weten nog te weinig over de verschillen tussen man en vrouw. Dat is erg, omdat je zonder goede cijfers niet weet of er sprake is van discriminatie. Zo wisten we in Nederland door cijfers dat vrouwen minder verdienen dan mannen.
Data2X bracht de hiaten in kaart, 28 om precies te zijn. Zo bestaan in minder dan een derde van de landen cijfers over geweld tegen vrouwen. En hetzelfde geldt voor gegevens over vrouwen in onbetaald werk en ondernemerschap.
Dat opsplitsen van data heet in het Statistisch ‘disaggregation.’ Sekse is trouwens lang niet de enige dimensie, de cijfers moeten ook worden opgebroken naar inkomen, leeftijd, woonplaats, handicap en - als het even kan - nog tig andere aspecten.
Het lijkt mij wat ambitieus, gaat het wel lukken om al die gegevens te verzamelen? ‘Het probleem begint al bij de definitie,’ vertelt Robert Hermans in dezelfde koffiecorner. De Limburger werkt bij het Nederlandse Centraal Bureau voor de Statistiek. ‘Je kunt bijvoorbeeld niet overal naar etniciteit vragen, dat is in sommige landen verboden. En hoe maak je het onderscheid tussen stad en platteland? Daar zijn wel tien definities van.’
‘Laten we eerst maar eens kijken of we het eens kunnen worden over de definities. Of die cijfers verzameld kunnen worden is een volgend punt.’
Hermans vertelt ook over een bezoek aan het Azerbeidzjaanse bureau voor de statistiek. ‘‘Hoe krijgen jullie al die informatie van de Belastingdienst?’, vragen ze dan. Dat zijn ze in Nederland gewoon verplicht, dat staat in de Statistiekwet.’
Zijn tripje naar Azerbeidzjan is een van de vele voorbeelden van ‘statistical capacity building.’ Zo spreek ik een Mongoolse die op bezoek ging in Duitsland, Estland en Finland. En een Zuid-Afrikaan die hielp bij het opzetten van de statistische bureaus van Soedan en Cambodja.
En dat alles met één doel: het statistisch systeem in een land verbeteren. Want al dat geklets over CRVS en disaggregatie is leuk, maar je komt geen stap verder als er niet genoeg geld, mankracht en kennis is om de plannen uit te voeren.
Maar die statistische capaciteit gaat verder, vertelt Hernán Muñoz van het Argentijnse ‘CBS.’ Zo moet de onafhankelijkheid van het bureau stevig in de wet verankerd zijn. De Argentijnen kunnen het weten: in hun land werden acht jaar lang cijfers - in het bijzonder de inflatie - gemanipuleerd op bevel van de regering.
‘Wij statistici lijken een beetje op journalisten, soms moeten we slecht nieuws brengen,’ zegt Muñoz, terwijl hij een croissantje met kaas en jam eet. ‘Onafhankelijkheid is dus heel belangrijk.’
‘Voor 2007 hadden we technisch gezien een sterk statistisch bureau. Maar op institutioneel vlak niet,’ vertelt Muñoz. ‘In Argentinië zag je hoe belangrijk statistiek is. Het is als zuurstof, je hebt het pas door als het er niet meer is.’
Het woord is verre van jargon, maar zoemt hier net zo hard rond: geld. ‘Je krijgt geen datarevolutie zonder een financiële revolutie,’ zegt Philipp Schönrock op het terras van het Hilton in Kaapstad. Hij onderbreekt ons gesprek even om een grote man in een wit overhemd in het Spaans te begroeten.
Schönrock is de baas van de Colombiaanse club CEPEI. Hij is de allereerste die ik op de conferentie spreek, en hij is de eerste van velen die klagen over geld. Want van Mongolië tot Nederland, van Australië tot Schönrocks Colombia: overal wordt bezuinigd.
‘Jullie CBS kijkt nu hoe het gebruik kan maken van data uit het bedrijfsleven,’ zegt Schönrock. ‘Dat is goed én noodzakelijk.’
Zulke ‘multi-stakeholder partnerships’ zijn hip. Zo vertelt een Filipijnse in een bijeenkomst dat haar statistisch bureau samenwerkt met een bedrijf om documenten te digitaliseren. Het bedrijf betaalt trouwens ook hun nieuwe gebouw, vertelt ze, en ze laat op de beamer wat glimmende catalogus-ontwerpen zien.
Op het balkon van het congrescentrum vertelt Tariq Khokhar van de Wereldbank dat zijn organisatie samenwerkt met Facebook. ‘We wilden een vragenlijst onder bedrijven afnemen, en die zitten nu eenmaal vaak op het sociale netwerk.’ Is dat wel veilig? ‘Wij nemen privacy heel serieus. We zijn heel selectief met wie we samenwerken en leggen afspraken goed vast.’
En zo antwoordt iedereen als ik vraag naar samenwerking met bedrijven. Duidelijke afspraken gegoten in memoranda of understanding of rules of engagement. Mooie woorden, maar - vraag ik me hier steeds af - zijn die opgewassen tegen de wil van grote bedrijven als Google en Facebook?
Cijfers produceren is één ding, ze communiceren is een tweede. ‘Je kunt niet zomaar een cijferfabriek zijn en dan zeggen: zoek het maar uit,’ zegt Hermans. Bij het CBS zetten ze dan ook vol in op betere communicatie van statistiek. Ze hebben zelfs een hele eigen media-afdeling - inclusief studio, waar ze video’s schieten om hun cijfers uit te leggen.
Het is een van de vele initiatieven om mensen meer ‘data literate’ te maken. Dat betekent dat ze begrijpen wat cijfers betekenen, waarom ze belangrijk zijn en waar de beperkingen liggen.
Bij de Wereldbank, vertelt Khokhar, bleek dat bijna een derde van de rapporten nooit werd gedownload. ‘Daarom begon ik eenvoudige ‘Economist-achtige’ grafieken met slechts één idee uit een rapport of initiatief.’ Ook gaf hij aan meer dan 300 communicatiemedewerkers een crash course statistiek en datavisualisatie.
Goede communicatie is ook belangrijk om politici ervan te overtuigen dat ze meer geld in statistiek moeten investeren. ‘We moeten een betere business case maken voor goede statistiek,’ vertelt Stefan Schweinfest. Hij is de baas van de statistiektak van de VN en een van de twee identieke mannen naast Nnenna.
‘Ik wil voorbeelden verzamelen waar goede data en statistiek geld hebben bespaard,’ vertelt Schweinfest. Heeft hij een voorbeeld? ‘Nee. Er is vaak geen tijd om terug te kijken. Je bent net klaar met het ene programma, en je begint alweer met het volgende.’
Ironisch, iedereen vindt het hier belangrijk dat cijfers gebruikt worden, maar er lijken niet genoeg cijfers te zijn die dat bewijzen.
Keep it yellow
‘De sessie gisteravond tussen zeven en tien,’ zegt Nnenna aan het eind van haar praatje. ‘Als je die hebt gemist, dan heb je dit World Data Forum gemist.’ Even baal ik dat ik er niet bij was, maar dan besef ik me: ik was er wel degelijk. Ze heeft het over het galadiner. ‘Wat ik me realiseerde was: statistici kunnen dansen.’ VN-man Stefan Schweinfest barst naast haar in lachen uit.
‘Maar dan nog iets,’ gaat ze verder, ‘dat gele pak.’ De vorige avond kwam Schweinfest - een statisticus zoals je hem zou tekenen - in een knalgeel pak het podium op. Het was van Pali Lehohla, baas van het Zuid-Afrikaanse statistische bureau en co-organisator van het congres. Lehohla droeg het pak twee jaar lang elke dag tijdens de volkstelling in Zuid-Afrika.
‘Pali deelde het met Stefan op een open license,’ trekt Nnenna de parallel met data. ‘Hij droeg het op zijn eigen manier, met zijn eigen riem.’ En, gaat ze verder, ‘nu kunnen we vergelijken hoe het gele pak Pali staat in vergelijking met Stefan.’
Ook dat is de datarevolutie: een beetje gek. En knalgeel.
Mijn reis werd mede mogelijk gemaakt door het European Journalism Center.