Speuren naar verhalen in de databerg
Wat is datajournalistiek en wat ga ik ermee doen bij De Correspondent?
Het is misschien wel de grootste paradox van de journalistiek: het vak dat over het nieuwe zegt te gaan, blijft zelf hardnekkig vasthouden aan ouderwetse methoden. Alsof er geen informatierevolutie gaande is die enorme kansen biedt.
Want hoe komen veel journalistieke artikelen en nieuwsitems tot stand? Er ‘speelt’ iets dat aanleiding is om een vraag te formuleren. De journalist belt een deskundige, leest een aantal rapporten en gaat met een beetje geluk de straat op om te zien en horen hoe het in de praktijk gaat. Terug op de redactie worden instanties geconfronteerd, met woordvoerders geruzied, het artikel geschreven of het item gemonteerd. En na publicatie of uitzending wacht het archief. Alle vergaarde informatie verdwijnt in de prullenbak, want de nieuwscyclus is onverbiddelijk: morgen moet de krant weer vol en de uitzending weer gevuld met nieuwe thema’s.
ICT speelt hierin louter een technische rol. Het jaagt de snelheid en de omvang van de nieuwscyclus aan: informatie vindt zijn weg vlugger in de krant of op het scherm. Maar informatie is nog geen kennis en snelheid nog geen kwaliteit. Integendeel zelfs, zoals mijn nieuwe collega’s allemaal in hun introductieblogs betogen.
Betere verhalen
Die technische benadering is jammer. Wie informatietechnieken beheerst, kan ook andere en betere verhalen maken. Er gaat voor de datajournalist een wereld aan bronnen open die anders ongebruikt blijft. Nu zijn journalisten afhankelijk van onderzoekers en instanties die hun (vaak openbare) data bewerken en de bevindingen naar buiten brengen. Waarom zouden we dat onderzoek niet voor een belangrijk deel zelf doen? Waarom zouden we niet een antwoord zoeken op onze eigen vragen?
Maar informatie is nog geen kennis en snelheid nog geen kwaliteit.
Mijn taak bij De Correspondent wordt om de wereld vanuit een dataperspectief te aanschouwen. Belangrijk hierbij is dat de techniek en de data dienstbaar zijn aan het verhaal. Data leveren meestal sporen op, geen kant-en-klare verhalen en schreeuwende nieuwskoppen. Sporen die we zonder datatechnieken hadden gemist.
Een goed voorbeeld van de toepassing van datajournalistiek is het onderzoek van The Guardian naar aanleiding van de rellen in London, in 2011. De regering-Cameron wilde in tijden van onrust sociale media platleggen: die zouden het vuur alleen maar aanwakkeren. The Guardian onderzocht samen met een universiteit een paar miljoen tweets en vergeleek het tijdstip van de rellen met het tijdstip waarop over die rellen werd gesproken: dat was altijd daarna. Meer een soort nabeschouwing dus, dan een oproep om de boel in de hens te steken.
Een ander goed voorbeeld vind ik de onlangs gepubliceerde Offshore Leaks. Bij deze Leaks kreeg een internationaal consortium van journalistieke organisaties een dump van rapporten, e-mails, memo’s, etc. van een bron bij een trustkantoor. Een aantal techneuten heeft die enorme hoeveelheid losse gegevens weten te structureren en inzichtelijk gemaakt, zodat journalisten ermee aan de slag konden. Dit heeft in veel landen tot onthullingen over belastingontwijking en -ontduiking geleid. Helaas hebben we weinig van Nederlandse media gehoord.
Op meer bescheiden schaal zal ik dit soort onderzoeken uitvoeren. Ik zal voor een deel mijn collega’s ondersteunen en hun bronnen verrijken met (digitale) data. Dat kan van alles zijn: simpele CBS-gegevens, maar ook complete databases, zoals de farmaceutische clinical trials databases van de EU en de VS. Hierdoor komen hun verhalen op een nog steviger bodem te staan.
Als Tomas bijvoorbeeld onderzoek doet naar de logica achter de landbouwsubsidies, kan ik hem helpen door verschillende internationale databases met subsidieverstrekkingen te analyseren. Als Lynn op zoek gaat naar de betekenis van woorden waar we veel over spreken in het publieke debat, kan ik haar helpen door in mediadatabases en de Handelingen van het parlement te speuren naar het veranderende gebruik van die woorden.
Data driven journalism
Het mooie van datajournalistiek (of liever: data driven journalism) is dat het je minder afhankelijk maakt van de agenda van instanties: je kan je eigen conclusies trekken uit de data. En wat je niet in het openbaar kunt vinden, is vaak met een beroep op de Wet Openbaarheid Bestuur (Wob) wel te krijgen.
Daarnaast zal ik mijn eigen onderzoeken opzetten. Ik wil onder andere een simpele maar cruciale vraag proberen te beantwoorden: aan wie zijn wij onze staatsschuld schuldig? Pensioenfondsen? China? Saudi-Arabië? Daarnaast wil ik mij toeleggen op (sociale) netwerkanalyses: wie zijn de belangrijke lobbyisten in Nederland? In hoeverre is er een draaideureffect tussen journalistiek en pr? Dit zijn vragen die alleen met data goed te beantwoorden zijn. We gooien deze data na publicatie uiteraard niet weg: als we ze goed bewaren en onderhouden kunnen we steeds betere analyses maken.
Ik kan dit soort verhalen niet alleen opzetten. Bij voorkeur zoek ik hulp buiten de journalistiek: van programmeurs, webdesigners, experts, statistici, database-managers. Wanneer je mensen met verschillende vaardigheden aan dergelijke verhalen laat werken - ook wel hackatons genoemd - kun je nieuwsthema’s uitdiepen op een manier die in je eentje onmogelijk was geweest.
Van groot belang is het dan ook om datajournalistiek in het redactionele proces van De Correspondent te integreren. We zijn nog een kleine club, maar ik hoop onze gezamenlijke intelligence capaciteiten te vergroten door alle Correspondenten te helpen met het verzamelen, bewerken, koppelen en analyseren van relevante data. Want dat is dé manier van journalistiek bedrijven in de eenentwintigste eeuw.