Er wordt vrij weinig wetenschappelijk en journalistiek onderzoek en dat is jammer. Het grootste videoplatform ter wereld is voor veel mensen hun venster op de wereld, de bron van haast eindeloos vermaak en laatste nieuws. Vorige week lieten Hassan Bahara en Annieke Kranenberg van de Volkskrant en ik hoe je die data kunt gebruiken om aanwijzingen van radicalisering op te sporen op het videoplatform.

Daarnaast is YouTube vrij makkelijk te onderzoeken. Althans, het is vrij eenvoudig om heel veel data over video’s, kanalen, aanbevelingen en commentaren te vergaren. YouTube geeft ruimhartig toegang tot Het enige wat je nodig hebt is wat code.

Welnu, de code die we hebben geschreven voor het onderzoek naar radicalisering is hiervoor uitermate geschikt. Vandaag geven we die code en een groot deel zodat anderen ons werk kunnen controleren, of een eigen onderzoek kunnen starten.

We hebben de code geschreven in de Python programmeertaal en in een module verpakt die je makkelijk kunt downloaden en Met deze code kun je een lijst YouTube-kanalen die je interessant vindt en verder wilt onderzoeken als input nemen. De output bestaat dan uit metadata van alle video’s, commentaren, transcripties van de video’s en aanbevelingen die YouTube genereert.

Ook leveren we een aantal Jupyter Notebooks mee met suggesties hoe je de code kunt gebruiken en wat je met de verzamelde data kunt doen.

Enkele voorbeelden:

  1. Een specifieke gebruikersgemeenschap onderzoeken, bijvoorbeeld populaire Nederlandse vloggers of filmpjes van anti-vaccinatieactivisten. Het is vrij eenvoudig om allerlei statistieken te genereren, maar ook om transcripties te krijgen van de video’s zodat je op grote schaal kunt onderzoeken wat er nu precies wordt gezegd in die filmpjes.
  2. Ons radicaliseringsonderzoek herhalen, of uitvoeren op een andere politieke of levensbeschouwelijke richting, zoals extreemlinks, of religieus extremisme.
  3. Een landenanalyse doen. Dus een verzameling van bijvoorbeeld Belgische kanalen maken en die analyseren.

We willen nog een aantal functionaliteiten toevoegen aan de code en zullen de documentatie verder uitwerken waar nodig. Mocht je willen bijdragen aan dit project: je bent van harte welkom. Wil je toegang tot de data? Stuur me even met wat je precies wil hebben en waarvoor je het gaat gebruiken.

Hier vind je de code op GitHub. De module met alle scripts kun je vinden op GitHub. Vooral DataCollection is relevant. Je vindt daar ook een READ.me over hoe je de module kunt installeren. Ga naar GitHub.

Lees ook:

Aanbevolen voor jou op YouTube: racisme, vrouwenhaat en antisemitisme Het videoplatform waar jij kattenfilmpjes en het doelpunt van de week terugkijkt, is ook verantwoordelijk voor een van de grootste problemen van onze tijd: de verspreiding van haat, leugens en racisme. Hoe meer filmpjes je op YouTube bekijkt, hoe extremer de inhoud die je krijgt voorgeschoteld. Dat blijkt uit onderzoek dat De Correspondent samen met de Volkskrant uitvoerde. Lees het verhaal van Dimitri hier terug YouTube schotelt je steeds meer extreme video’s voor. Hoe werkt dat? Hoe meer filmpjes je op YouTube bekijkt, hoe extremer de inhoud die je krijgt voorgeschoteld. Dat is de conclusie van een groot onderzoek dat we samen met de Volkskrant uitvoerden. Maar hoe werkt die aanbevelingssoftware van YouTube eigenlijk? Lees het verhaal van Dimitri hier terug