Zelf YouTube doorlichten? Hier vind je de programmeercode waarmee je dat kunt doen

Dimitri Tokmetzis
Correspondent Surveillance & Technologie

De eerste resultaten van ons onderzoek naar radicalisering op YouTube, hebben we vorige week gepresenteerd. Vandaag geven we alle programmeercode en de meeste data vrij. Daarmee kun jij ons werk makkelijker controleren of je eigen onderzoek starten.

Er wordt vrij weinig wetenschappelijk en journalistiek onderzoek en dat is jammer. Het grootste videoplatform ter wereld is voor veel mensen hun venster op de wereld, de bron van haast eindeloos vermaak en laatste nieuws. Vorige week lieten Hassan Bahara en Annieke Kranenberg van de Volkskrant en ik hoe je die data kunt gebruiken om aanwijzingen van radicalisering op te sporen op het videoplatform.

Daarnaast is YouTube vrij makkelijk te onderzoeken. Althans, het is vrij eenvoudig om heel veel data over video’s, kanalen, aanbevelingen en commentaren te vergaren. YouTube geeft ruimhartig toegang tot Het enige wat je nodig hebt is wat code.

Welnu, de code die we hebben geschreven voor het onderzoek naar radicalisering is hiervoor uitermate geschikt. Vandaag geven we die code en een groot deel zodat anderen ons werk kunnen controleren, of een eigen onderzoek kunnen starten.

We hebben de code geschreven in de Python programmeertaal en in een module verpakt die je makkelijk kunt downloaden en Met deze code kun je een lijst YouTube-kanalen die je interessant vindt en verder wilt onderzoeken als input nemen. De output bestaat dan uit metadata van alle video’s, commentaren, transcripties van de video’s en aanbevelingen die YouTube genereert.

Ook leveren we een aantal Jupyter Notebooks mee met suggesties hoe je de code kunt gebruiken en wat je met de verzamelde data kunt doen.

Enkele voorbeelden:

  1. Een specifieke gebruikersgemeenschap onderzoeken, bijvoorbeeld populaire Nederlandse vloggers of filmpjes van anti-vaccinatieactivisten. Het is vrij eenvoudig om allerlei statistieken te genereren, maar ook om transcripties te krijgen van de video’s zodat je op grote schaal kunt onderzoeken wat er nu precies wordt gezegd in die filmpjes.
  2. Ons radicaliseringsonderzoek herhalen, of uitvoeren op een andere politieke of levensbeschouwelijke richting, zoals extreemlinks, of religieus extremisme.
  3. Een landenanalyse doen. Dus een verzameling van bijvoorbeeld Belgische kanalen maken en die analyseren.

We willen nog een aantal functionaliteiten toevoegen aan de code en zullen de documentatie verder uitwerken waar nodig. Mocht je willen bijdragen aan dit project: je bent van harte welkom. Wil je toegang tot de data? Stuur me even met wat je precies wil hebben en waarvoor je het gaat gebruiken.

Lees ook: