Krokodillenkak als anticonceptiemiddel, gemalen muis tegen de kiespijn of geitentestikels tegen onvruchtbaarheid. De geschiedenis van de geneeskunde zit vol met die enthousiast gebruikt werden, zonder enig bewijs dat ze werkten.

Maar hoe maak je het onderscheid tussen geneesmiddelen die wel en niet werken?

Dat leg ik je graag uit, in acht vragen en antwoorden.

1

Gemalen muis helpt je niet bij kiespijn. Maar hoe onderzoek je of een middel wel effectief is?

Het was een Vlaming, een zekere Jan Baptista van Helmont, die in de zeventiende eeuw als een van de eersten een manier verzon om de werkzaamheid van geneesmiddelen te bepalen. Toen dachten dokters nog dat de mens vier verschillende soorten lichaamsvocht had: bloed, slijm, zwarte gal en gele gal. Als je ziek was, waren deze vochten niet in balans. De remedie: aderlatingen, waarbij men het teveel aan bloed Van Helmont was een van de weinigen die hier, terecht zo weten we nu, niet in geloofde. Om te bewijzen dat aderlatingen niet werkten, deed hij het volgende voorstel:

‘Laten we uit de ziekenhuizen, tweehonderd of driehonderd arme mensen nemen die lijden aan koortsen of de pleuris. Laat ons hen in tweeën delen, laat ons lootjes trekken, zodat de helft door mij behandeld kan worden en de andere helft door jullie. Ik zal hen zonder aderlatingen genezen en jullie met. (...)

Dat idee is de kern van wat we nu een klinische studie’ noemen. Het is een van de grootste doorbraken ooit in de geneeskunde: een methode om te bepalen of een geneesmiddel ook echt geneest.

Als mensen geloven in de werkzaamheid van een geneesmiddel, dan doen ze dat vaak op basis van persoonlijke ervaring. Ze waren bijvoorbeeld grieperig, namen oscillococcinum – een extract van de lever en het hart van een muskuseend, dat je nog altijd bij de drogist kunt kopen, en dat volgens de verpakking nuttig is bij ‘griepachtige toestanden’ – en enkele dagen later voelden ze zich weer heel wat beter.

geleverd. Dat spul werkt.

Wil je bewijzen dat het de pillen zijn die het verschil maken, dan moeten beide groepen zo gelijkend mogelijk zijn

Of toch niet. Want veel ziektes gaan vanzelf weer over. Misschien was je zonder medicijn evengoed opgeknapt. Vandaar dat je, als je een geneesmiddel wilt testen, je proefpersonen eerst in twee groepen moet onderverdelen – net als Jan Baptista van Helmont deed. De ene groep laat je wel pillen slikken, de andere niet. Als de pillenslikkende groep het beter doet dan de controlegroep, is dat al een overtuigender bewijs van hun werkzaamheid.

Overtuigender, maar nog niet overtuigend genoeg. Bestaat de ene groep uit twintigers in blakende gezondheid en de andere uit bedlegerige bejaarden, dan is een verschil waarschijnlijk eerder te wijten aan hun initiële gezondheid. Wil je bewijzen dat het de pillen zijn die het verschil maken, dan moeten beide groepen zo gelijkend mogelijk zijn.

Dat kan je bereiken door randomisatie: je laat de groepsindeling bepalen door het toeval. Dat kan door lootjes te trekken, zoals Jan Baptista van Helmont voorstelde, maar momenteel gebruiken onderzoekers liever random number generators.

Als je die randomisatie correct uitvoert, dan is het enige systematische verschil tussen beide groepen de pil die ze al dan niet slikken.

Maar weet je dan zeker dat de genezing door de pil kwam?

Nee. Zelfs als in zo’n gerandomiseerde studie de pillenslikkende groep het beduidend beter doet dan de groep die geen pillen slikt, mag je nog niet concluderen dat het geneesmiddel werkt. Ook dan is er nog een andere mogelijke verklaring. Die werd ontdekt op een operatietafel aan het front aan het einde van de Tweede Wereldoorlog.

In 1945 was morfine schaars in de veldhospitalen. Op een dag kreeg een Amerikaanse anesthesist, Henry Beecher, een zwaar gehavende soldaat op zijn operatietafel. Die kerel had pech. Beecher had enkele dagen daarvoor de laatste morfine gebruikt. En dus – soms moet je roeien met de riemen die je hebt – gaf Henry Beecher de patiënt een injectie met zout water. Tot zijn grote verbazing kalmeerde de patiënt en kon de operatie zonder problemen uitgevoerd worden.

Tot het einde van de oorlog herhaalde Beecher, elke keer als hij weer eens zonder morfine zat, deze truc, bijna altijd met succes. Hij schreef er, toen hij veilig en wel terug in Amerika was, een over dat gepubliceerd werd in het Journal of the American Medical Association: ‘The powerful placebo’.

Als je iemand een geneesmiddel geeft, verwacht die persoon vaak dat dit effect zal hebben

Het mechanisme achter dit placebo-effect werkt als volgt. Als je iemand een geneesmiddel geeft, verwacht die persoon vaak dat dit effect zal hebben. Die verwachtingen hebben invloed. Ook als die pil geen enkel actief ingrediënt bevat, voelt de slikker ervan zich vaak beter. Of, ook een mogelijkheid, hij voelt zich niet echt beter, maar beweert van wel, omdat hij bang is de onderzoeker teleur te stellen.

De invloed van dit placebo-effect kunnen we uitsluiten door beide groepen nog gelijkender te maken: alle deelnemers aan de studie krijgen een pil. De ene groep krijgt het echte geneesmiddel. De andere groep krijgt een pil die in alle aspecten (kleur, vorm, smaak) lijkt op de echte pil, maar geen actief bestanddeel bevat.

Als dan de groep die de echte pil slikt vaker geneest dan de placebogroep, hebben we weer een beter argument dat het middel echt werkt.

Is controle op het placebo-effect dan genoeg?

Nee. Ook dan zijn er nog andere mogelijke verklaringen. Want ook de verwachtingen van de onderzoekers kunnen het resultaat vertekenen. Tijdens een naar een geneesmiddel tegen multiple sclerose, een aandoening van het centraal zenuwstelsel, kenden de onderzoekers elke patiënt een score toe, die weergaf in welke mate klachten van die patiënt verminderd waren.

Na de analyse van deze scores was het duidelijk: er was een significant verschil tussen de groep die de echte pil nam en de placebogroep. Het geteste geneesmiddel werkte dus.

Of toch niet. Want de onderzoekers wisten welke patiënten de echte pil kreeg en welke een placebo.

Als een arts weet dat een patiënt de echte pil neemt, heeft dat invloed

Toen een tweede groep dokters, die dit niet wisten, de patiënten onderzochten, verdween het verschil tussen de beide groepen.

Hoe dit werkt? Als een arts weet dat een patiënt de echte pil neemt, heeft dat invloed. Zij kent, bewust of onbewust, een iets hogere score toe, of voert metingen op een andere manier uit.

Om dat te vermijden, moet je de onderzoekers dus blinderen: zij mogen niet weten of de patiënt die ze onderzoeken de echte pil krijgt of een placebo. Pas dan kom je achter het effect van de pil.

Hoe weet je dat je resultaat geen toeval is?

Toeval is de laatste verklaring die je moet uitsluiten. Om te bepalen of iets toeval is of niet, heb je statistiek nodig. En pas als uit die analyse volgt dat het verschil is, mag je, eindelijk, besluiten dat jouw pil werkt.

Waarom zijn deze testen zo belangrijk?

Door deze placebogecontroleerde, gerandomiseerde, dubbelblinde klinische studies kunnen we het onderscheid maken tussen geneesmiddelen die werken en geneesmiddelen die dat niet doen.

Veel middelen waarvan dokters en patiënten dachten dat ze werkten, raakten toch niet over deze lat. maar ook veel middelen uit de reguliere geneeskunde. Een jaar of twintig geleden waren bijna alle dokters ervan overtuigd dat vrouwen in de menopauze maar beter extra hormonen konden nemen. Die zouden, zo dachten ze, niet alleen de vervelende effecten van de menopauze verminderen, maar ook beschermen tegen hart- en vaatziektes.

Maar toen men deze hormoontherapie testte in een gerandomiseerde, dubbelblinde klinische studie, dat de toegediende hormonen de kans op een hartaanval niet verlaagden, maar juist net verhoogden.

Deze studies vormen het fundament van onze geneeskunde. Het leeuwendeel van de wetenschappelijke artikelen in medische vakbladen bestaat uit dit soort onderzoek. Zonder deze studies heeft jouw dokter geen enkel houvast, en zou zij onmogelijk kunnen bepalen of de middelen die zij voorschrijft ook echt werken.

Als een middel deze test doorstaat, betekent dat dan ook dat het als patiënt een goed idee is om deze te slikken?

Niet noodzakelijk. Dat een pil werkt, betekent nog niet dat deze ook echt geneest. In vakjargon: statistische significantie is nog geen klinische relevantie.
Misschien herinner je je nog dat begin van het jaar verschillende dat het voor de werkzaamheid van antidepressiva geleverd was?

Inderdaad, uit een dat werd gepubliceerd in het gerenommeerde medische tijdschrift The Lancet, bleek dat er een statistisch significant verschil bestond tussen antidepressiva en placebopillen. Maar de duivel zit in de details: als je het wetenschappelijk artikel doorspitte, ontdekte je daar dat de gemiddelde werkzaamheid van antidepressiva dan wel statistisch significant was,

Zo klein zelfs dat je van de meeste patiënten niet kan zeggen dat ze zich echt beter in hun vel voelen door die pillen. Aan statistische significantie heb je als patiënt niet veel – je wilt dat die pil

Moet elk geneesmiddel op deze manier getest worden voor het op de markt mag komen?

Ja. Zodra een bedrijf moet dat een aantal fases doorlopen. In een eerste fase krijgt een tiental gezonde het nieuwe middel toegediend. Eerst in een heel lage dosis, en dan geleidelijk meer en meer. Ondertussen monitoren de onderzoekers zorgvuldig hun hartslag, bloeddruk en andere parameters.

Als er bij deze proefkonijnen geen vervelende bijwerkingen ontstaan, kan het onderzoek door naar de volgende fases. Dan ondergaat het nieuwe middel de dubbelblinde, gerandomiseerde studies die ik hierboven beschreef.

Eerst weer met een kleine groep patiënten (fase 2). En als dat goed gaat, dan bij een veel grotere groep, vaak met duizenden patiënten (fase 3).

Als uit die studies blijkt dat het middel werkt, dan verzamelt het bedrijf alle resultaten, zowel van de labproeven als van de testen op mensen, en stuurt deze naar de geneesmiddelenautoriteiten: in Amerika, of in de Europese Unie. Die laten er dan een team experts op los, die beslissen of het middel goed genoeg is om op de markt te komen.

Werken alle medicijnen die mijn dokter mij kan voorschrijven?

wordt betaald door de farmaceutische industrie. Een industrie die vanzelfsprekend belang heeft bij de uitkomst ervan. In die industrie werken verdomd slimme koppen, die precies weten hoe je de resultaten van deze studies Een klein detail in de statistische analyse, een miniem foutje in de randomisatiemethode of een net niet optimale blindering, al die kleine details kunnen veel invloed hebben op het uiteindelijke resultaat.

Meer dan de helft van deze studies wordt betaald door de farmaceutische industrie

Uit een door het onafhankelijke Cochrane-instituut bleek dan ook dat studies uitgevoerd door de farma-industrie een grotere kans hebben om een positief resultaat te vinden dan studies die niet door hen betaald worden. Wie betaalt, bepaalt.

Als arts moet je al erg bedreven zijn in statistiek en studiemethodologie, en ook nog eens enorm veel tijd hebben om elke studie in detail door te nemen, om deze geraffineerde leugens te doorprikken.

De meeste artsen hebben die tijd niet. En als ze toch de moeite doen om ’s avonds, na hun spreekuur, de medische literatuur te doorworstelen, dan doen ze dat vrijwillig: niemand betaalt artsen om vakbladen te lezen. Dat veel artsen zich weleens laten misleiden door de industrie is dan ook niet zo verwonderlijk.