De slechtste manier om een goede werknemer te vinden? Een sollicitatiegesprek
Hoe selecteren werkgevers werknemers? Waardoor nemen carrières een beslissende wending? Hoe krijgen hele levens vorm? Vaak door een sollicitatiebrief plus sollicitatiegesprek. En dat is een probleem. Want sollicitatiegesprekken zijn modderpoelen van desinformatie. Ze vertellen de werkgever meer over hemzelf dan over de kandidaat.
Het sollicitatiegesprek is het belangrijkste moment in bijna elke sollicitatieprocedure – en het is tegelijkertijd het misleidendste moment in een sollicitatieprocedure.
Als je luistert naar onderzoekers uit het veld van werving en selectie, human resources en arbeids- en organisatiepsychologie, zie je het sollicitatiegesprek niet meer als kans om te ontdekken wat een kandidaat kán, maar meer als een informationeel mijnenveld.
Een sollicitatiegesprek levert zeker informatie op, maar die ligt bedolven onder een berg van desinformatie. Wat een sollicitant ook over zichzelf vertelt of vergeet te vertellen: hoe hij of zij eruitziet, zich kleedt, of in de stoel zit, laat de werkgever vaak te zwaar meewegen in zijn beoordeling van de kandidaat. In diens voor- of nadeel.
In zijn paper* over de misleiding door sollicitatiegesprekken – Belief in the Unstructured Interview: The Persistence of an Illusion – illustreert Harvardonderzoeker Jason Dana dit met een anekdote.
Een vriendin van hem kwam een keer op sollicitatiegesprek, keurig vijf minuten te vroeg. Na een prettig gesprek kreeg ze direct de baan aangeboden. Ze hoorde ook wat de doorslag gaf bij de werkgever: de sollicitatiecommissie was onder de indruk geweest van haar kalmte, hoewel ze 25 minuten te laat voor het gesprek was verschenen.
25 minuten te laat?
De kandidaat had een andere tijd doorgekregen. Ze was kalm gebleven omdat ze niet wist dat ze te laat was. Als ze dat had geweten, was ze zeker zenuwachtig geweest.
Maar die baan kreeg ze – op basis van een karaktereigenschap die ze niet heeft.
Als carrières worden gebaseerd op een oppervlakkige indruk
Het is natuurlijk een extreem voorbeeld – maar subtielere vormen van misleiding zijn aan de orde van de dag.
Jason Dana en zijn collega’s lieten in hun onderzoek sollicitanten bewust willekeurige antwoorden geven op een serie ja-neevragen. Hun beoordelaars baseerden er evengoed een samenhangende analyse van haar potentie op. Maar het kan nog gekker.
Toen de beoordelaars hoorden dat de interviews onzingesprekken waren geweest, wilden ze nog steeds het interview gebruiken als basis voor hun oordeel. De vermoedelijke gedachtegang: hoe meer informatie hoe beter. En iemand zien en horen praten, al is het bewezen onzin, is ook informatie.
Kun je iemand leren kennen in een gesprek van dertig minuten? Nee. Kun je in een halfuur je vooroordelen bevestigen over iemand? Dat wel
Een sollicitatiegesprek dient om iemand te leren kennen. Maar in de praktijk leveren de gesprekken nauwelijks informatie op. Want kun je iemand echt leren kennen in een gesprekje van een halfuur? Nee. Kun je in een halfuur je vooroordelen over iemand bevestigen? Dat wel.
Mensen horen wat ze willen horen, denken te horen, of hopen te horen. Sollicitatiegesprekken, concluderen Dana en zijn collega’s, zeggen meer over de werkgever dan over de sollicitant.
Dit is meer dan een psychologische curiositeit. ‘Het beïnvloedt carrières’, zegt Janneke Oostrom, onderzoeker naar sollicitatieprocedures aan de Vrije Universiteit. ‘Mensen kunnen hele carrièrepaden inslaan op basis van zo’n oppervlakkige, misleidende indruk.’
Of niet inslaan – als je wordt overgeslagen om de verkeerde redenen.
Niettemin: het informele maar misleidende sollicitatiegesprek – waarin werkgevers iemand ‘persoonlijk’ willen leren kennen – is in Nederland de dominante selectiemethode, volgens een enquête* van Yacht en de Universiteit van Amsterdam uit 2008.
Het verbazingwekkende van dit alles?
Dat sollicitatiegesprekken riskant zijn – en wat de simpele alternatieven zijn – is al decennia bekend, dankzij een serie fascinerende ontdekkingen van psychologen.
Hoe het intuïtieve oordeel van de expert in diskrediet kwam
In 1939 liet psycholoog Theodore Sarbin leden van de toelatingscommissie van de Universiteit van Minnesota, bestaande uit ervaren docenten, voorspellen hoe eerstejaarsstudenten zouden presteren.
De commissie had een weelde aan informatie over de eerstejaars tot haar beschikking: onder meer de cijferlijst van hun middelbare school, de score op een soort Cito-toets, tests van andere geestelijke vermogens, een test van hun persoonlijkheid, mate van interesse in de studie.
Daarnaast hadden de commissieleden de studenten geïnterviewd in een persoonlijk gesprek, onder meer om hun motivatie en de mens achter de cijferlijsten te leren kennen. Op basis van al deze bronnen deden ze hun voorspellingen.
Sarbin vergeleek hun verwachtingen * met de voorspellingen van een simpel model: een combinatie van de cijferlijst van de kandidaten en hun score op de Cito-toets.
De uitkomst?
De simpele ‘mechanische’ combinatie was even goed in het voorspellen van de prestaties van de studenten als de ‘holistische’ beoordeling door de ervaren leden van de toelatingscommissie.
Meer informatie, kortom, leidde niet tot een betere beoordeling.
De deskundige ziet meteen: dit been is gebroken. Het model niet
Sarbins vondst paste in een zelfs voor psychologen obscure tak van psychologisch onderzoek die – in essentie – blootlegde dat zelfs de grootste deskundigen matige voorspellers konden zijn.
In 1954 werd dit onderzoek in één klap beroemd – en berucht – door het boekje Clinical versus Statistical Prediction van psycholoog Paul Meehl. Meehl had twintig onderzoeken zoals dat van Sarbin op een rij gezet, alleen dan met psychiaters die voorspellingen deden over hun patiënten. Op één na wezen die uit dat de deskundige psychiater het aflegde tegen conventionele toetsen, op basis van een simpele test, checklist of formule.
Meehl trok het belang van de intuïtie van de experts niet compleet in twijfel. Het leek hem dat de mening van deskundigen in veel situaties, zoals bij sollicitaties, wel degelijk iets kan toevoegen. Om dit te onderbouwen beschreef hij een fictief rekenmodel dat inschatte hoe groot de kans was dat iemand naar de bioscoop zou gaan.
Zo’n model, hoe slim geconstrueerd ook, zou allerlei factoren missen die filmbezoek in de weg stonden die een mens direct zou opmerken. Bijvoorbeeld of iemand een gebroken been had, waardoor hij niet naar de bioscoop zou kunnen.
Een broken leg cue heette dit fenomeen sindsdien: een zeldzaam maar beslissend beetje informatie dat in een model ontbrak, maar dat een (deskundig) mens zou zien. Een groot voordeel voor de deskundige, zou je zeggen.
Een zinnenprikkelend experiment in een psychiatrische inrichting
Er was alleen een probleem: de lawine aan vervolgonderzoek die Meehls boek veroorzaakte, bevatte weinig aanwijzingen dat deskundigen hun voordeel konden doen met hun exclusief menselijke vermogen om gebroken benen te detecteren.
Integendeel: de expert bleek het continu af te leggen of gelijk te spelen tegen simpele, goedkope en soms ronduit absurde alternatieven.
Zoals in 1957 bleek, toen vier psychologen van de Universiteit van Michigan een experiment deden in een psychiatrisch ziekenhuis. Ze hadden een prikkelende vraag: zouden de patiënten even goed kunnen voorspellen hoe het hun mede-patiënten zou vergaan als de medische staf?
Maandenlang lieten onderzoekers iedereen op de afdeling, personeel en patiënten, verwachtingen uitspreken over elke patiënt. Zou de patiënt na zijn ontslag uit de inrichting binnen twee jaar ‘recidiveren’ en weer worden opgenomen? Zou die een partner hebben? Zou die werk hebben?
De secretaresse en de bezigheidstherapeut van de inrichting konden het gedrag van patiënten beter voorspellen dan de psychiaters
Twee jaar later was bekend hoe het de ontslagen patiënten was vergaan. Wat bleek: patiënten bleken prima voorspellers van wat er met hun mede-patiënten zou gebeuren. Tot de beste individuele beoordelaars hoorden de secretaresse en de bezigheidstherapeut.
Expertise? Schmexpertise!
Dat was al verbazingwekkend genoeg. Maar er was nog een hele goede voorspeller van recidive, relatie en werk. Die voorspeller was hoog- noch laagopgeleid, niet eens mens. Wat het wel was?
Het gewicht van het dossier van de patiënt. Heel letterlijk. Hoe dikker het dossier van de patiënten, des te groter de kans dat de patiënt binnen twee jaar opnieuw zou worden opgenomen.
Het simpele gewicht van dossiers deed het beter dan deskundigen, die bovendien over het hele dossier beschikten en de inhoud ervan kenden.
Hoeveelheid seks min hoeveelheid ruzie = huwelijksstabiliteit
In de decennia erna stapelden de studies in allerlei vakgebieden zich op waarin de deskundige het aflegde tegen de conventionele toetsen of checklists.
Bij het voorspellen van de prijs van wijn, legden vinologen het af tegen een simpele formule die alleen rekening hield met de gemiddelde temperatuur, de regenval vlak voor de oogst en de regenval in de winter voor de oogst.
Bij het voorspellen van de levensverwachting van hodgkinpatiënten waren oncologen minder goed dan simpele modellen waarvoor ze zelf de relevante variabelen – de symptomen – hadden aangeleverd.
En bij het voorspellen van de recidive van gevangenen werden maatschappelijk werkers ‘verslagen’ door relatief eenvoudige checklists.*
Sterker: je kon zelfs een echtscheiding of huwelijksgeluk goed voorspellen met een simpel model.
Niet na uitgebreide gesprekken met de echtgenoten, maar door het aantal keren seks te tellen en daar het aantal onderlinge ruzies van af te trekken. Was er minder seks dan ruzie, dan was de kans op onmin groot.
Achter ogenschijnlijk simpele gegevens gaat een berg aan informatie schuil
De grote vraag, ook voor de onderzoekers, was hoe dat kon.
Hoe kunnen domme en simpele formules deskundigen de baas zijn, terwijl mensen nuances kunnen waarnemen, proeven en aanvoelen – en modellen niet?
Een antwoord was: omdat het model niet dom of simpel ís.
De deskundigen in de experimenten hadden de modellen zelf gebouwd. Onderzoekers hadden hun gevraagd welke criteria ze hanteerden bij voorspellingen of diagnoses én hoe zwaar ze die meewogen. Kortom: de kennis van de deskundige zat in de modellen.
Het model was niet dom of simpel, de experts hadden zelf de criteria aangeleverd. Kortom: de kennis van de deskundige zat in de modellen
Voor de dossiers van de patiënten, voor de weersomstandigheden in een wijngaard, voor de cijferlijst van een student en voor het turven van seks en ruzie geldt min of meer hetzelfde: die ogenschijnlijk simpele gegevens bevatten veel informatie die de expert ook belangrijk vindt.
Denk maar even door: aan seks gaat meer vooraf dan lust – anders zou er meer seks zijn in de wereld. Achter ruzies zit meer dan ergernis – in een goed huwelijk escaleert irritatie minder snel tot ruzie dan in een matig huwelijk.
Maar als het model alleen maar weet wat de deskundige weet, hoe kan het dan winnen van de deskundige?
Omdat het model geen rekenfouten maakt als het de relevante gegevens combineert en verrekent. De deskundige mens wél: hij of zij is soms moe, boos, hongerig, of heeft om welke reden dan ook z’n dag niet als hij/zij een student/patiënt/sollicitant beoordeelt.
Dat was de ontdekking van de psycholoog Lew Goldberg in zijn paper Man versus Model of Man: hij toonde aan dat dezelfde deskundigen op basis van vrijwel identieke informatie tot andere inschattingen kwamen. In de weging van factoren waren ze inconsistent. Ze zeiden dat ze het ene deden, maar deden het andere.
Deskundigen zien te veel gebroken benen
En er was nog een reden dat modellen het zo goed deden.
Experts zijn nodig om het model te bouwen. En een model werkt als een expert die nooit fouten maakt. Maar hoe zit het dan met de gebroken benen? Met de uniek menselijke wapens die de expert nog in zijn arsenaal heeft als het gaat om voorspellen?
Robyn Dawes, een andere onderzoeker op dit gebied, ging hier op in* aan de hand van een voorbeeld uit de praktijk. Een studente beklaagde zich bij hem over de toelatingsprocedure voor de campus in Santa Barbara van de Universiteit van Californië. Zonder gesprek was ze afgewezen. Oneerlijk, vond ze, om alleen op een cijferlijst en een competentietest te worden beoordeeld.
Dawes begreep wel dat dit zo aanvoelde, maar hij draaide het om. De cijferlijst weerspiegelt vier jaar studie; de kans dat haar docenten haar stelselmatig hadden onderschat, lijkt klein. En de competentietest is een zorgvuldig gevalideerde toets. Echt oneerlijk, aldus Dawes, zou het zijn om een klein beetje nieuwe informatie een vrij compleet beeld van een student te laten vervormen.
‘Denken we nu echt’, schreef hij, ‘dat we in een gesprek van een halfuur tot een betere of eerlijkere beoordeling komen dan op basis van die twee cijfers?’
Hier moest natuurlijk een retorisch nee op volgen. Maar in de praktijk denken mensen dat ze zoiets wél kunnen. Op het eerste gezicht is dat niet zo gek: waarom zou je niet én én doen? Conventionele tests én gesprek? Meer informatie is beter, toch?
Nou, nee. Het probleem is dat beoordelaars te veel indrukken opdoen die belangrijk líjken, maar dat niet zijn; dat ze te veel gebroken benen waarnemen. En die gebroken benen vertroebelen het beeld.
Dit was de reden waarom de leiding van voetbalclub FC Midtjylland overwoog scouts niet meer naar wedstrijden te sturen. De kans was te groot dat de scout de wedstrijd waar hij persoonlijk aanwezig was veel zwaarder liet wegen dan de vele wedstrijden die hij op video terugzag.
Zo gaat het ook tijdens sollicitatiegesprekken.
‘Stel dat de sollicitant vertelt over hoe ze zich met hard werken via een community college heeft opgewerkt’, zegt selectiepsycholoog Scott Highhouse.* Zoiets raakt je. ‘Maar hoe weeg je het mee?’
Hoe het sollicitatiegesprek een bron van informatie kan zijn
Dus hoe doe je het dan wel goed als werkgever?
Een metastudie* uit 1998 zette 85 jaar aan onderzoek naar selectieprocedures op een rij. Het meeste succes hadden job simulations of work samples. Ofwel: iemand een dag(deel) mee laten werken in diens aanstaande baan. Het zal weinig verbazing wekken dat dit een goede voorspeller is van succes.
Maar het is ook tijdrovend en onmogelijk: sollicitanten werken meestal al ergens. Slechts iets minder doeltreffend, maar veel goedkoper, waren ‘gestructureerde interviews’. Gesprekken met vaste vragen, die de werkgever inzicht geven in de eigenschappen van de kandidaat die de werkgever belangrijk acht.
Het komt neer op wat het psychologisch onderzoek naar deskundigen aantoonde: laat de deskundige relevante factoren bepalen, en breng die vervolgens rigide in kaart.
- Zet als werkgever de eigenschappen voor succes in de betreffende baan op een rij. Als werkgever ben je daarin deskundig, jij weet wat je zoekt.
- Geef ze elk een gewicht: de ene factor is belangrijker dan de andere. Ofwel: maak een model – precies zoals de oncologen deden die hodgkin moesten diagnosticeren.
- Probeer vervolgens via een set vaste vragen in te schatten hoe de kandidaat scoort op die eigenschappen. Druk die score uit in een cijfer.
- Belangrijk: stel alléén de vragen die van tevoren zijn vastgelegd. Voorkom dat je het gesprek allerlei kanten op laat gaan, waardoor je de kandidaten niet meer met elkaar kunt vergelijken.
- Selecteer de kandidaat met de meeste punten.
Zie er voorts op toe dat je gedragsvragen stelt: wat hebben kandidaten in specifieke situaties gedaan of wat zouden ze doen? Zulke vragen geven betrouwbaardere informatie dan traditionele sollicitatievragen – zoals: waarom wil je deze baan? – die belangrijker lijken, maar dat niet zijn.
De reden is niet al te moeilijk te bedenken: zulke vragen zijn voorspelbaar en iedereen kan daar van tevoren wel een mooi, overtuigend, maar misleidend verhaal bij verzinnen. Nutteloze gebroken benen dus.
Een hardnekkig fenomeen
Een sollicitatiegesprek kan dus nuttig zijn, als je je gedisciplineerd aan een vast stramien houdt. Dit alles is geen nieuws. Waarom blijven werkgevers dan toch vertrouwen op informele gesprekjes?
In zijn artikel* ‘Stubborn Reliance on Intuition and Subjectivity in Employee Selection’ geeft Scott Highhouse enkele verklaringen. Gebrek aan kennis is het probleem niet: de wetenschappelijk literatuur is welbekend bij humanresourcesmedewerkers. Ze denken alleen dat het niet op hen van toepassing is. Anderen zijn slecht in het beoordelen van mensen. Ik niet.
Een tweede verklaring is dat mensen denken dat ze beter worden in sollicitanten beoordelen naarmate ze het vaker doen. Daarvoor is weinig bewijs – wat ook wel logisch is. Een hr-manager krijgt immers vrijwel nooit bruikbare feedback: of een gekozen werknemer presteert of niet, weet je vaak pas na jaren. Dat maakt leren lastig.
Maar de gedachte dat je goed in beoordelen wordt, is begrijpelijk. Stel je vindt een student goed genoeg om toe te treden tot een hoog aangeschreven school. De student zal zich op zo’n goede school inderdaad ontwikkelen. Voilà, kan de selectiecommissie denken, we maakten de juiste keuze.
Alleen: dat is een denkfout. Want de goede resultaten van de student kunnen ook gewoon bewijzen dat de school een stimulerende omgeving is, niet per se dat de student terecht is geselecteerd. Vergelijkbare denkfouten kom je ook tegen in het voetbal. Selectiepsychologe Susan Niessen en sportwetenschapper Tom Bergkamp voeren momenteel een experiment uit bij FC Groningen om dit proces in de jeugdopleiding te verbeteren.
Een sollicitatiegesprek biedt wel meer kans op een betere besluit. Maar alleen als je de extra informatie perfect inschat. En dat gebeurt vaak niet
Een derde verklaring is dat de extra informatie uit een sollicitatiegesprek in theorie meer kans geeft op een betere beslissing, maar alléén als je al die extra indrukken perfect inschat. En zoals we zagen gebeurt dat vaak niet.
Dus zou je zeggen: val terug op eerder werk, studieresultaten, of een vaste vragenlijst. Op een model, kortom. Maar daarin ligt een vierde reden dat het informele gesprek blijft bestaan: fouten van een model worden minder acceptabel gevonden dan fouten van een mens, al is de kans dat een mens een fout maakt groter.
Daryl Morey, de general manager van basketbalclub Houston Rockets, weet dat gesprekken met toekomstige spelers weinig zeggen over hun toekomstige prestaties. Hun verleden als speler is veel belangrijker. Toch is hij bij elk gesprek aanwezig, vertelde hij aan schrijver Michael Lewis.
Waarom?
‘Als we [een speler] kiezen, en hij blijkt een of ander enorm probleem te hebben, en de eigenaar [van de club] vraagt: "Wat zei hij dan in het gesprek toen je hem die vraag stelde?", en ik zeg "Nou, ik heb hem niet gesproken voordat ik hem 1,5 miljoen per jaar betaalde", dan ben ik mijn baan kwijt.’
De bijna-perfecte sollicitatieprocedure
Zelfs experts in sollicitatieprocedures doen het niet altijd goed. Neem de vakgroep Human Resources Management and Organisational Behaviour van de Rijksuniversiteit Groningen – hun procedures zijn sinds enkele jaren zeer gedegen, maar dat was niet altijd zo.
Het onderzoek naar solliciteren is het vakgebied van de vakgroep. Sterker: in de masteropleiding wordt het vak Personnel Instruments aangeboden, waarin studenten al het bovenstaande leren.
Maar de eigen sollicitatieprocedures bij het aantrekken van mensen waren in het verleden niet altijd volgens het boekje. Hoogleraar Bernard Nijstad: ‘Soms kwamen er vragen voorbij dat je dacht: waarom vragen we nu dit? Wilden we dat vooraf weten?’
Geef je mensen de kans tot vrijelijk associëren, spontane vragen stellen, dan gaan mensen blijkbaar vrijelijk associëren. Niet dat de procedures matig waren – maar helemaal conform de theorie van het vakgebied waren ze niet. Waren, want als de vakgroep nu iemand aanneemt, dan gaat het wel volgens de letter van de leer.
En dat is te danken aan universitair hoofddocent Laetitia Mulder.
‘We moeten het net zo doen zoals we het onze studenten leren’
Mulder is zo iemand die een sollicitatiegesprek minder als een informationele kans ziet dan als een informationeel mijnenveld. Je hebt er wat aan, maar alleen als je heel voorzichtig te werk gaat.
Niet zo gek: zij geeft die cursus Personnel Instruments,* waar selectieprocessen een onderdeel van zijn. ‘Ik vertel de studenten steeds hoe het moet, en dan wringt het als we dat zelf anders doen.’
En dus zette zij de procedure op toen er in het voorjaar van 2016 een vacature was voor een tenure-track-positie. Een prestigieuze plek: de kandidaat ligt dan in principe op koers (track) om, uiteindelijk, een positie als hoogleraar te verwerven (tenure).
Het profiel van de kandidaat werd van tevoren nauwkeurig omschreven; de gezochte eigenschappen werden tijdens de sollicitatiegesprekken cijfermatig gescoord en na afloop opgeteld aan de hand van een van tevoren opgestelde formule.
Bovendien: de leden van de selectiecommissie zouden hun cijfers onafhankelijk van elkaar geven. Pas als je je oordeel had gegeven, zag je wat de anderen vonden, zegt Nijstad, die ook lid was van de commissie. Deze aanpak benut de ‘wisdom of crowds’.
Verder was er nog een proefcollege dat de kandidaten zouden geven – een work sample* dus, de intensieve maar meest valide voorspeller.*
Kortom: check, check, check, check.
Wel of geen gesprek voeren?
Zeker: het kost flink wat tijd om een functieprofiel op te stellen en een model met de juiste criteria en hoe je ze moet wegen. Maar daarna, zegt Mulder, bespaar je juist tijd en moeite door cijfermatig te werken.
‘Toen we keken wie de hoogste scores had, en wie er dus doorging naar de volgende ronde, sloot onze indruk aan bij de cijfers. Maar als we de cijfers niet hadden gehad, hadden we er eindeloos over gediscussieerd. Dat was nu onnodig. En op de langere termijn: als je min of meer hetzelfde systeem steeds opnieuw kunt gebruiken, is dat heel efficiënt.’
Is deze aanpak nu de perfecte sollicitatieprocedure?
Dat hij goed is, staat buiten kijf. ‘Laetitia opende ons de ogen’, zegt Bernard Nijstad. Toch twijfelt hij nog over één aspect: de noodzaak van een gesprek.
‘Als je al zoveel over een kandidaat weet’, zegt hij, doelend op het uitgebreide wetenschappelijke cv dat je van academische sollicitanten ontvangt, ‘kun je je afvragen of je überhaupt wel een gesprek moet voeren.’
De ‘natuurlijke tendens’ is om dat wel te doen, zegt Nijstad. ‘En nee, ik kan niet iemand aannemen die ik niet heb ontmoet. Maar: wat zegt een gesprek nu eigenlijk helemaal over een kandidaat? Dat moet je je wel afvragen.’