Ik heb prachtige data over extremisme op YouTube. Kom je ook lekker hacken?
Op zaterdag 8 september gaan we met een groepje techneuten met interessante YouTube-data aan de slag. Doe je mee?
Het afgelopen jaar moest een aantal sociale media door het stof vanwege hun rol in het verspreiden van rechtsextremistische content en nepnieuws. Vooral Facebook kreeg veel kritiek te verduren.
Een gigantisch medium is grotendeels de dans ontsprongen: YouTube.
Ten onrechte, want op dit videoplatform, dat dagelijks door honderden miljoenen mensen wordt gebruikt, wemelt het van extremistische videos en vloggers en complotdenkers. Daarnaast, zo luidt een forse beschuldiging, komen kijkers via door YouTube aanbevolen video’s in contact met extremistische content waar ze anders hard naar hadden moeten zoeken.
Samen met de Volkskrant onderzoek ik de (rechts)extremistische bubbel op YouTube. Welke vloggers zijn actief? Wie is invloedrijk? En hoe werkt dat met die aanbevelingen? Krijgen we door het platform steeds extremere videos voorgeschoteld?
Wat gaan we doen?
Om hier een antwoord op te vinden, hebben we de afgelopen maanden veel data verzameld en interviews gehouden. Ik heb al een aantal analyses gemaakt, maar er zit zo veel in de data dat ik jullie hulp wil inroepen.
Daarom wil ik een kleine – met nadruk op klein (vijftien mensen max) – hackathon houden op de nieuwe redactie van De Correspondent, vlakbij Amsterdam Centraal. Deze vindt plaats op zaterdag 8 september en duurt in principe de hele dag.
Welke data hebben we?
We hebben twee soorten data.
De eerste soort is een netwerk van de (extreem)rechtse bubbel op YouTube. We hebben een lijst met 130 bekende extreme en radicale kanalen bezocht (automatisch) en gekeken op wie die kanalen zelf zijn geabonneerd (wat zijn hun inspiratiebronnen) en welke andere kanalen ze aanbevelen (idem, maar ook: wie steunen ze). We hebben dit twee keer bekeken, in november 2017 en in augustus 2018.
Deze data vertellen ons welke YouTube-persoonlijkheden belangrijk zijn in de rechtse bubbel, leveren ons statistiek over het bereik van deze kanalen en hoe het netwerk het afgelopen jaar veranderd is, al dan niet door ingrijpen van YouTube. Een van de belangrijke spelers binnen dit netwerk was bijvoorbeeld de Amerikaanse complotdenker Alex Jones met zijn Infowars-kanalen. Zijn kanalen zijn begin augustus verwijderd door YouTube. Welke effecten heeft dit gehad?
De tweede dataset is mogelijk nog interessanter. We hebben op de computers van 78 Nederlanders, waaronder veel jongeren (mbo en hbo) via een computerprogramma gezocht naar politiek gevoelige videos (denk aan filmpjes over of met Geert Wilders, Thierry Baudet, Zwarte Piet en Sylvana Simons).
Vervolgens heeft dit programma consequent op de aanbevelingen geklikt en is dat een tijdje blijven doen. Uiteindelijk heeft dit een corpus van meer dan drie miljoen aanbevolen video’s opgeleverd. Je begrijpt: het is een flinke kluif om zo’n set te analyseren, maar het zijn prachtige data.
Wat hebben we nog nodig?
We hebben aardig wat kennis in huis en een aantal mensen heeft al toegezegd mee te doen. Toch kunnen we nog een paar mensen met de volgende vaardigheden gebruiken:
- Statistiek: kun je ondanks de beperkingen die aan de data kleven zinvolle informatie halen uit de metadata van de video’s?
- Grafentheorie: hebben netwerken geen geheimen voor je? Ben je een Gephi-kungfu-meester?
- Progammeurs: ben je een hardcore pythonista? Kun je onze data snel en betrouwbaar verrijken?
- Schoonmakers: hoewel de data al aardig zijn opgeschoond, kan er nog veel meer werk gebeuren. Maak je graag vuile handen, meld je dan aan.
- Topic-modelleerders: ben je thuis in natural language processing en gaat je bloed sneller stromen van bigrams en trigrams? Dan is deze hackathon voor jou.
Waarom zou je mee doen?
- Het zijn toffe data.
- Het is een belangrijk project en aangezien YouTube de kaken altijd stijf op elkaar houdt, is dit de enige manier om dit gigantisch invloedrijke bedrijf ter verantwoording te roepen.
- Het is leuk om te doen.
- En natuurlijk eeuwige roem en dank met mooie publicaties in de Volkskrant en op De Correspondent.
Hoe kun je meedoen?
Stuur me een mail (dimitri at decorrespondent punt nl). Ik kan niet garanderen dat je mee kunt doen – we moeten een selectie maken en een goede mix hebben van expertisen en vaardigheden, maar ik doe mijn best om iedereen een plekje te geven.