De Verenigde Staten proberen het al jaren en voor veel Europese landen is het een droom die binnenkort werkelijkheid kan worden: de automatisering van het grenstoezicht door middel van profiling. Ik schreef daar deze twee stukken over.

Dit gebeurt er allemaal achter de schermen als je naar Amerika vliegt Wie naar de Verenigde Staten vliegt, steekt ook een digitale grens over. Tientallen instanties en databases verwerken jouw persoonsgegevens om te kijken of je een betrouwbare reiziger bent. Waar gaan die data naartoe? En wat gebeurt ermee? Ik reconstrueer een reis van Amsterdam naar Los Angeles en ontrafel het informatieweb waar je als reiziger in belandt. Lees verder Europese leiders schitteren in veiligheidstheater Binnenkort wordt vrijwel zeker een Europees systeem voor massasurveillance opgetuigd: EU PNR. Hiermee wordt een grote hoeveelheid gegevens van alle luchtvaartpassagiers vijf jaar opgeslagen om terroristen, pedofielen en andere criminelen op te sporen. Een lovende recensie van dit veiligheidstheater. Lees verder

Uit beide artikelen klinken de hoge verwachtingen door van het gebruik van technologie. Er wordt daarbij vooral ingezet op het automatisch schiften van goedwillende reizigers van kwaadwillende door middel van profiling.

Maar profiling is een slecht begrepen technologie. Daarom deze explainer, waarbij ik mij beperk tot Ik baseer me grotendeels op het Informatiegestuurde grenscontrole: Verkenning ten behoeve van het gebruik van selectieprofielen in het kader van grensbeheer (2012), van het Nederlands Forensisch Instituut.

Wat is profiling?

Profiling is het maken en gebruiken van profielen. Een profiel is een typering van een individu of een groep personen. Daarbij wordt gekeken naar wat een individu of een groep onderscheidt van andere individuen of groepen. Een bekend individueel profiel is je vingerafdruk. Als je Amerika binnenkomt, moet je je vingerafdrukken afgeven. Als die afdruk op een zwarte lijst staat en er een match is, kun je uit de rij worden gehaald en extra worden ondervraagd.

Ben je een man, bestel je halal eten en vlieg je vaak in je eentje naar Pakistan? Dan is er wellicht een hogere kans dat je eigenschappen deelt met het profiel ‘terrorist’

Daarnaast heb je groepsprofielen. Sommige groepseigenschappen zijn bekend. Diplomaten mogen bijvoorbeeld ongehinderd reizen op basis van hun eigenschap ‘diplomaat.’ Maar sommige groepen hebben geen duidelijke eigenschappen. Als je een Pools kenteken hebt en bijvoorbeeld twee keer per week Nederland binnenrijdt bij Venlo, behoor je mogelijk tot een groep ‘verdachte en zou je door de Koninklijke Marechaussee extra onderzocht kunnen worden.

Dan is er nog het risicoprofiel. Dat is een groepsprofiel dat tot doel heeft per persoon in te schatten of hij of zij tot de doelgroep behoort. Ben je een man, bestel je halal eten en vlieg je vaak in je eentje naar Pakistan, dan is er wellicht een hogere kans dat je eigenschappen deelt met het profiel ‘terrorist’ dan wanneer je een vrouw van 73 bent die altijd met haar man en kinderen reist.

Welk probleem moet profiling oplossen?

Als we het hebben over grenstoezicht moet profiling twee problemen oplossen: het verbeteren van efficiëntie en het vergroten van de effectiviteit.

Eerst de efficiëntie. Computers zijn sneller dan mensen. Als je daarmee geautomatiseerd een risico-inschatting maakt, kun je met minder middelen meer mensen controleren. Zeker bij vliegverkeer is er een grote druk om de groeiende hoeveelheid passagiers met ongeveer dezelfde hoeveelheid mensen

Die tijdwinst kan behaald worden als de controle gerichter wordt. Het is zonde om mensen te ondervragen die een verwaarloosbaar risico vormen. Het toezicht zou zich vooral kunnen richten op mogelijke kwaadwillenden. Ik zeg mogelijk, want het blijft kansberekening.

Daarnaast, zo is de gedachte, kan het gebruik van profielen het toezicht effectiever maken. Door de grensbewaking meer informatie te geven over reizigers, kan die betere beslissingen nemen.

Hoe wordt een profiel gemaakt?

Er zijn ruwweg twee manieren om tot een profiel te komen. Het eerste profiel is gebaseerd op kennis. Hierbij speelt ervaring van bijvoorbeeld grensbewakers een belangrijke rol. De bewaker heeft een bepaald beeld van wat verdacht is en handelt daarnaar. Dit soort profielen zijn gevoelig voor vooroordelen. Anderzijds is er juist veel ruimte voor gezond verstand en kunnen directe observaties meegewogen worden.

Een tweede vorm van profiling is gebaseerd op data en laat zich beter automatiseren. Die aanpak begint met het verzamelen van gegevens. Vervolgens wordt een fenomeen bepaald en de mensen die daarbij horen beschreven (denk aan de Poolse automobilisten). Vervolgens kan voor ieder individu worden gekeken wat de kans is dat hij of zij tot de doelgroep behoort.

Een variant hierop, die de laatste jaren sterk in opkomst is, is dat een computer zélf de doelgroepen vindt. De computer zoekt en vindt waar mensen niet zo snel aan zouden denken. Een fictief voorbeeld is dat drugssmokkelaars relatief vaak een stoel aan het gangpad reserveren en hun ticket met contant geld betalen. Een aantal grote technologiebedrijven, zoals Google en Facebook, investeren veel geld in de ontwikkeling van dit soort zelflerende algoritmen.

Hoe werkt het in de praktijk?

Profiling in de praktijk is het volgen van een aantal stappen.

  1. Er wordt informatie verzameld, bijvoorbeeld de boekingsgegevens van de passagiers.
  2. Er is een aantal doelgroepen gedefinieerd; zoals terroristen, pedofielen, drugssmokkelaars en mensenhandelaren. Die hebben eigenschappen die ze onderscheiden van andere doelgroepen.
  3. Een algoritme bekijkt bij alle passagiers in hoeverre zij voldoen aan die eigenschappen. Alle passagiers krijgen een score.
  4. Bij de fysieke controle op Schiphol bekijkt de grensbewaker de score en beslist of nadere inspectie nodig is. Hij zal daarbij afgaan op wat het algoritme zegt, maar ook op zijn ervaring (als het goed is).
  5. Bij de inspectie wordt gekeken of de score terecht is en er actie ondernomen moet worden.
  6. Idealiter wordt de uitkomst van die selectie teruggekoppeld aan de mensen (of machines) die het profiel hebben gemaakt om het algoritme te verbeteren.

Wat gaat er goed met profiling?

Profiling lijkt nieuw, maar gebeurt in wat meer rudimentaire vorm al jaren. Miljoenen mensen maken iedere dag weer belangrijke beslissingen met behulp van statistiek. Dokters gebruiken statistiek om te bepalen of iemand in aanmerking komt voor een behandeling. Rechters gebruiken statistiek om te bepalen of iemand vervroegd vrijkomt (of hoelang iemand juist De politie gebruikt statistiek om te bepalen waar ze het beste Mits goed toegepast, kan dit soort profiling een zeer nuttig instrument zijn om mensen hun werk beter te laten doen. In de meeste gevallen ondersteunt profiling het besluitvormingsproces.

Wat zijn de beperkingen?

Een eerste beperking is de relevantie en representativiteit van de gegevens. Als je wilt bepalen of iemand man is of vrouw, dan is lichaamslengte geen goede variabele. Er zijn immers kleine mannen en grote vrouwen. In dit geval is lichaamslengte niet heel relevant. Daarnaast moeten de gegevens de doelgroepleden goed representeren. Als je terroristen wilt pakken, moet je een goed idee hebben welke variabelen uniek zijn voor hen. Een afwijkend reispatroon kan bijvoorbeeld evengoed van toepassing zijn op een bepaald soort zakenlieden.

Een tweede beperking is de kwaliteit van gegevens. Die kunnen fout of onvolledig zijn. Bij het maken van profielen wordt er meestal van uitgegaan dat de data kloppen, maar in datakringen geldt ook het adagium: rotzooi erin, rotzooi eruit. Als je data niet correct zijn, is de uitkomst van het profiling-proces ook onbetrouwbaar.

Tot slot is er nog de beperking van het model zelf. Een algoritme weegt verschillende data en maakt een risicoscore. De vraag is natuurlijk of het algoritme goed is en of de werking transparant is. Kan een bewaker die een score ziet nog herleiden hoe die score tot stand is gekomen? Hoeveel ruimte heeft hij of zij nog om van die score af te wijken en zelf een beslissing te nemen? En in hoeverre zijn de gebruikers van deze technologie er nog van op de hoogte dat het hier altijd om een kansberekening gaat?

Wat zijn de gevolgen van slecht gebruik?

Het gebruik van data en statistische methoden om tot een oordeel te komen, kan goed uitpakken. Maar als we een stap terug zetten, komen we voor nieuwe vragen te staan. Er wordt bijvoorbeeld weleens gesproken over algorithmic citizenship. Of jij mag reizen, hangt af van de score die het algoritme uitspuugt. Maar als je data veranderen, kan het zijn dat je de volgende keer een minder hoge risicoscore hebt. Het zou kunnen dat we in de toekomst vaker onze bewegingsvrijheid beknot (of juist verruimd) zien door de grillen van een algoritme.

Daarnaast is profileren in de kern sorteren. Niet voor niets wordt profiling ook wel social sorting genoemd. Die term is bedacht door de Canadese socioloog David Lyon. ‘Social sorting is een manier om identiteiten vast te stellen, maar ook om risico’s en waarde toe te wijzen aan mensen,’ stelt Lyon. ‘De vraag is hoe we de categorieën bepalen. Dat is een belangrijke ethische en politieke kwestie.’

Wat maakt je een terrorist? Wanneer ben je een risico? Wanneer moet je bewegingsvrijheid worden beknot en wanneer niet? Dat zijn in de kern politieke en ethische vragen die nu soms in de technologie verstopt zitten. Als we die vragen niet goed beantwoorden en ons niet verdiepen in de black box die profiling vaak is, lopen we volgens hem de kans bestaande maatschappelijke tegenstellingen en ongelijkheden te versterken.

YouTube

David Lyon over social sorting.

Meer over informatiegestuurde grenscontrole Voor deze explainer heb ik veel kunnen putten uit het heel goede en duidelijk geschreven rapport Informatiegestuurde grenscontrole: Verkenning ten behoeve van het gebruik van selectieprofielen in het kader van grensbeheer (2012). Dit rapport is geschreven door André Hoogstrate en Cor Veenman van het Kennis- en expertisecentrum voor intelligente data-analyse (Kecida) van het Nederlands Forensisch Instituut. Download het rapport hier