Help mee de datakluwen van de overheid in kaart te brengen

Maurits Martijn
Correspondent Beter internet

Wat doet de overheid met onze data? Twee weken geleden deed Ard van der Steur, de nieuwe minister van Veiligheid en Justitie, een eerste poging meer inzicht in haar informatiestromen te bieden. Op zaterdag 30 mei organiseren collega Dimitri Tokmetzis en ik een hackaton om het werk van de ambtenaren van Van der Steur verder op te pakken. Wees welkom!

Op 24 maart de kersverse minister van Veiligheid en Justitie Ard van der Steur een interessante brief naar de Tweede Kamer. Bijgevoegd een excelbestand, met daarin een overzicht van de ‘koppelingen van databestanden’ bij de overheid: welke databases met gegevens over burgers zijn aan elkaar gekoppeld, wie heeft daar toegang toe en met wie delen de verschillende ministeries deze informatie. Kortom: hoe lopen de informatiestromen binnen de Rijksoverheid?

Een belangrijk initiatief. Wij Nederlanders hebben het recht om te weten welke informatie van ons waar ligt opgeslagen, wie daar iets mee kan en wat daarmee gebeurt.

Aldus de theorie.

Vier jaar geleden concludeerde de Wetenschappelijke Raad voor het Regeringsbeleid (WRR) al dat dit onderdeel van de privacywetgeving een wassen neus is. De oorzaak? De Nederlandse overheid lijdt volgens de WRR aan een dusdanige verzamelwoede, dat zij het overzicht kwijt is geraakt. Laat staan dat burgers er inzicht in hebben.

Als leek krijg je het idee een onoplosbare puzzel voorgeschoteld te krijgen, in plaats van goed geïnformeerd te worden

‘Het verzamelen van steeds meer informatie en het aanleggen van koppelingen daartussen lijkt nauwelijks meer in het gareel te krijgen,’ stelde de WRR onomwonden. ‘Het resultaat is dat informatie vervuilt, onduidelijk is wie verantwoordelijk is voor informatiestromen en dat burgers, bedrijven en ook instanties binnen de overheid zelf, verst(r)ikt raken in de datakluwen van de overheid.’

Dat Van der Steur deze stap neemt, valt daarom toe te juichen. Het is een dappere poging een deel van die datakluwen te ontwarren en in kaart te brengen.

Met de nadruk op ‘poging.’

Want het exceldocument is een gedrocht, dat bestaat uit een brij aan databases en organisaties. Als leek krijg je het idee een onoplosbare puzzel voorgeschoteld te krijgen, in plaats van goed geïnformeerd te worden.

Conclusie: hier kan niemand iets mee.

Van der Steurs ambtenaren hebben een kans laten liggen om de informatiestromen zo te presenteren dat we er ook echt iets aan hebben. Dat kan anders. En is niet eens zo heel ingewikkeld.

Wat gaan we doen?

Op zaterdag 30 mei organiseren collega Dimitri en ik een hackaton op de redactie van De Correspondent. Binnen één dag willen we samen met hackers, ontwikkelaars, ontwerpers en juristen de informatiestromen van de overheid in kaart brengen. Welke databases zijn op welke ministeries te vinden? Hoe lopen de datastromen tussen de verschillende databases? Welke data zitten erin? Met wie worden de gegevens gedeeld?

Wij willen deze informatie op een toegankelijke manier openbaarmaken, zodat iedereen er wat aan heeft. Uiteindelijk zullen wij een serie artikelen schrijven die gebaseerd is op de uitkomsten van dit onderzoek.

De brief en het excelbestand van Van der Steur vormen de basis van de hackaton, maar moet verder aangevuld. Zo hebben niet alle ministeries op tijd informatie ingeleverd, zijn de koppelingen met Basisregistraties geen onderdeel van het overzicht en zijn de databases van de gemeenten helemaal buiten beschouwing gehouden. Daarnaast zijn ook veel databases en koppelingen voor opsporingsdoeleinden niet meegenomen.

Wij willen, waar mogelijk, de informatie van Van der Steur aanvullen met andere openbare informatie over de informatiestromen bij de Rijksoverheid. Zo hopen we een eigen database op te bouwen met daarin een overzicht van alle databases die bij de Rijksoverheid gebruikt worden, welke data die bevatten en hoe die zijn gelinkt.

Op de dag zelf willen we daarom ook met hackers aan de slag gaan. Maar we willen uitdrukkelijk ook ambtenaren, juristen en andere experts uitnodigen om mee te kijken en waar nodig toelichting te geven. Wat we gaan maken, is immers voor iedereen relevant, ongeacht aan welke kant van de privacydiscussie je staat.

Naar wie zijn we op zoek?

We willen een zo breed mogelijke groep bij elkaar te brengen, die in ieder geval bestaat uit:

  • Database-experts. Mensen die ervaring hebben met netwerkdatabases als Neo4J en visualisatietools, zoals Gephi. We staan uiteraard open voor andere methoden, talen en programma’s.
  • We verwachten dat we niet veel meer hoeven te scrapen, maar we hebben wel dataschrobbers nodig, vooral mensen die ervaring hebben met Regex. De databases zijn behoorlijk vervuild.
  • Juristen. Kenners van de wet, die kunnen beoordelen of de verschillende koppelingen aan de wet voldoen.
  • Ambtenaren, die ervaring hebben met databasekoppelingen.

Wat hebben we te bieden?

Een mooie redactieruimte, een wifinetwerk, koffie, lunch, borrel, pizza’s en eeuwige roem.

Dus kom!

Stuur een mail naar maurits@decorrespondent met daarin kort je achtergrond en wat je op de hackaton wilt bijdragen en hoopt te bereiken.

Zaterdag 30 mei, vanaf 11 uur, Weesperzijde 94 te Amsterdam.