De coronacrisis bewijst: zonder dokter blijft kunstmatige intelligentie oliedom

Dimitri Tokmetzis
Correspondent Surveillance & Technologie
De beelden bij dit verhaal zijn gemaakt met behulp van artificiële intelligentie. Het zijn de coronasymptomen verbeeld door een computer. Dit beeld volgde uit 'losing taste'. Lees onder het verhaal een uitgebreidere toelichting.

De laatste jaren is er een enorme belofte rond AI in de zorg, maar wordt die in de pandemie, nu het hard nodig is, waargemaakt? Drie Nederlandse ervaringen laten zien dat er nog een lange weg te gaan is.

Na China en Zuid-Europa was vanaf 27 februari ook Nederland aan de beurt. Het coronavirus sloeg eerst toe in Noord-Brabant. In het Catharina Ziekenhuis in Eindhoven meldde de eerste patiënt zich op dinsdag 3 maart. Vijf dagen later werd de eerste coronapatiënt opgenomen op de intensive care en weer vijf dagen later ging het ziekenhuis volledig in pandemiemodus: het was alle hens aan dek.

Iedere patiënt met verdachte klachten moest zo snel mogelijk een krijgen om covid-19 te herkennen. En hoewel het Catharina Ziekenhuis voldoende van deze tests had, moest er zuinig mee worden omgegaan. Bij andere ziekenhuizen dreigden namelijk al tekorten en veel landen waren in paniek tests aan het opkopen.

‘Headache’
‘Soar throat’

Daarnaast duurde het met de PCR-test van toen soms wel acht uur voordat er een Al die tijd werd een bed op de isolatieafdeling bezet gehouden. Als die afdeling vol was, moesten nieuwe patiënten naar een ander ziekenhuis.

Volgens Arjen-Kars Boer, een klinisch chemicus-endocrinoloog die op het laboratorium van het Catharina Ziekenhuis werkt, is het bloed een soort spiegel van het lichaam. ‘Sommige dingen die je meet, veranderen door de aanwezigheid van zo’n virus. Wanneer je hierin patronen vindt die specifiek zijn voor het coronavirus, kan het bloed dus iets vertellen over de aanwezigheid van het coronavirus.’ Het voordeel is dat dit soort tests sneller uit te voeren zijn dan een PCR-test.

Daarom ging Boer met zijn collega, biomedisch ingenieur op zoek naar patronen in het bloed die een betrouwbare voorspelling geven van de aanwezigheid van Tegenwoordig kom je dan al snel uit bij kunstmatige intelligentie een techniek die bij uitstek patronen in grote hoeveelheden data kan vinden. Zou AI het Catharina Ziekenhuis kunnen helpen om covid-patiënten sneller te herkennen? En hoe kan kunstmatige intelligentie in het algemeen helpen deze pandemie

Dat is een belangrijke vraag. 

Na ‘web 2.0’, ‘de cloud’, ‘big data’ is AI namelijk the next big thing. Bedrijven en overheden investeren gretig miljarden in kunstmatige intelligentie om nieuwe markten en kennis aan te boren, en bestaande markten en overheidsdiensten op hun

Inmiddels wordt AI op talrijke manieren toegepast. Zelflerende computersystemen bepalen welk nieuws, producten, video’s, liedjes we krijgen aanbevolen. Banken, verzekeraars, politie en geheime diensten brengen continu risico’s van klanten en burgers in kaart aan de hand van transacties, reisbewegingen, telefoondata en internetverkeer. Computers leren beelden en geluiden te herkennen, vaak voor surveillancedoeleinden, maar ook om grappige nieuwe

Veel AI-projecten mislukken omdat er te veel wordt beloofd

Technologiebedrijven hebben zich inmiddels ook op kunstmatige intelligentie in de zorg gestort. Alphabet, het moederbedrijf van Google, heeft twee dochterbedrijven die zich hier volledig op richten. IBM trok de afgelopen jaren miljarden uit om te leren om medische vragen te beantwoorden. Amazon richtte een bedrijf op dat medische data en verzekeringsgegevens analyseert van de eigen werknemers, in de hoop later AI-diensten te verkopen aan de hele zorgmarkt. Microsoft heeft een eigen AI-divisie die gericht is op gezondheidszorg. En dan is er nog een enorme waaier een kleine en grote bedrijven die opslag, analyse, verrijking en andere diensten rondom

Deze pogingen, vooral van de grote bedrijven, worden met veel argwaan en scepsis bekeken. Veel projecten mislukken omdat er te veel wordt beloofd. IBM kondigde bijvoorbeeld aan dat AI-systeem Watson kanker wel even En dokters en patiënten blijken huiverig om zeer gevoelige data met bedrijven te delen, omdat die soms een belabberde reputatie hebben op privacygebied.

‘Losing smell’

Maar hoe werkt AI in de rommelige praktijk?

Als er een moment is dat AI zich kan bewijzen in de zorg, is het wel nu, tijdens deze zeer ontwrichtende pandemie. En dat gebeurt ook mondjesmaat, bijvoorbeeld voor het vinden van een het ontsluiten van het voorspellen van het diagnosticeren van patiënten, en voor

Dit klinkt nog allemaal behoorlijk abstract. Dat AI potentie heeft, neem ik graag aan. Veel AI-technieken hebben zich op andere terreinen al bewezen, dus waarom niet in de zorg? Maar toch, als je kijkt naar de alledaagse klinische praktijk, naar wat zich daadwerkelijk in de behandelkamer afspeelt, lijkt de belofte van kunstmatige intelligentie behoorlijk lastig waar te maken, zeker nu de zorg zo onder druk staat. 

Dat blijkt ook uit drie initiatieven die ik van dichtbij bekeek en waar AI een rol speelt in de behandeling van coronapatiënten. Alle drie laten zien dat je met mooie, overmoedige verkooppraatjes niet ver komt. Er komt veel specialistische kennis bij kunstmatige intelligentie kijken. En er is veel, vaak behoorlijk ouderwets, monnikenwerk nodig om het toe te passen. 

Casus 1: Terug naar het Catharina Ziekenhuis

In het lab van het Catharina Ziekenhuis is veel bedrijvigheid. Mensen in witte jassen lopen heen en weer tussen testapparaten. Verderop staat klinisch chemicus-endocrinoloog Arjen-Kars Boer een arts telefonisch te woord. 

Even later legt hij in een kleine werkkamer uit hoe hij samen met zijn collega op zoek ging naar een patroon van in het bloed van patiënten dat kan duiden op de aanwezigheid van covid-19 in het lichaam, of het virus juist kan uitsluiten.

Daarvoor gebruikten Boer en Deneer de data van ruim tienduizend patiënten wier bloed tussen juli 2019 en juli 2020 Voor het compleet maken van een dataset waar een computer iets mee kon, het zogenoemde opschonen van de data, bleek heel veel

Vervolgens was de vraag: welke methode is geschikt om verbanden te leggen binnen een nette dataset van bloed- en coronatests? Dat kan bijvoorbeeld met heel geavanceerde middelen, zoals deep learning, waarin complexe computernetwerken samenwerken om patronen te vinden. Maar er is ook machine learning, waarbij een computer, vaak met enige hulp, wordt getraind om statistische verbanden te vinden. En dan is er nog ouderwetse, maar geavanceerde statistiek. 

De modegril dicteert dat je dit AI noemt, maar eigenlijk is het gewoon geavanceerde statistiek

Deep learning was in dit geval geen optie. ‘Dat is een black box’, zegt Ruben Deneer. Dat wil zeggen dat de berekeningen die deep learning doorgaans oplevert zo complex zijn, dat het niet duidelijk is waarom de computer een bepaald antwoord geeft. ‘Deep learning is nu nog niet transparant en dat is iets waar artsen huiverig voor zijn. Die willen juist weten: hoe komt een diagnose tot stand? Welke biomarkers zijn gebruikt? Klopt de uitslag met wat ik voor ogen had?’

‘Gewone’ statistiek biedt die transparantie wel, legt Arjen-Kars Boer uit. Het algoritme dat hieruit voortkomt, geeft aan of iemand op basis van de bloedwaarden covid-19 heeft, en is vervolgens ook na te rekenen. Boer: ‘De modegril dicteert dat je dit AI noemt, maar eigenlijk is het gewoon

De grote vraag is natuurlijk: werkt het? 

Boer ziet dat de diagnoses van het model erg overeenkomen met de resultaten van de PCR-tests. Soms scoort het model Een bijkomend voordeel, aldus Boer, is dat een algoritme het hoofd koel houdt. ‘Aan het begin van een coronapiek raakt iedereen in de stress. Een dokter zal misschien eerder geneigd zijn om PCR-tests aan te vragen, terwijl die nog niet nodig zijn.’ Bloed wordt daarentegen altijd afgenomen bij een ziekenhuisopname. Het algoritme kan op basis van de bloedmetingen dan adviseren de PCR-test maar even te laten zitten. Dat scheelt ziekenhuizen tijd en middelen.

‘Having a cold’

Toch is het voor andere ziekenhuizen nog niet zo makkelijk om het model van Boer en Deneer over te nemen, want zij ontwierpen het algoritme speciaal voor de tests en apparatuur van het Catharina Ziekenhuis. Andere ziekenhuizen gebruiken ook andere tests, of meetapparatuur die net weer anders is ingesteld. 

Als de data ook maar een klein beetje afwijken, kan de uitkomst van het algoritme ineens heel anders zijn. En dus ligt voor alle ziekenhuizen veel handwerk in het verschiet om de eigen data op orde te krijgen als ze dit model willen gebruiken. Om maar te zeggen: de AI-bloedmetingen zijn geen kant en klaar wondermiddel nu de tweede golf van besmettingen is aangebroken.

Casus 2: Hightech monnikenwerk

In maart van dit jaar ontstond een ambitieus plan in het Amsterdam UMC. Intensivist Paul Elbers kwam op het idee om machine learning in te zetten om de beste behandelstrategie voor coronapatiënten te achterhalen. Het Amsterdamse bedrijf Pacmed zou de data helpen opschonen, dus klaarmaken voor gebruik, zodat een computer

Op die manier kon hopelijk direct uit de praktijk worden geleerd welke behandelingen de kans voor een patiënt vergroten om de ic levend te verlaten, liefst zonder complicaties, met een zo kort mogelijke duur van behandeling en Als zich dan nieuwe patiënten zouden melden, kon een AI-systeem helpen een zoveel mogelijk gepersonaliseerd behandelplan op te stellen.

Op het fraaie kantoor van Pacmed, tegenover dierentuin Artis, leggen directeur Willem Herter en hoofd dataonderzoek Daan de Bruin uit dat het vrij logisch was om mee te doen aan dit project. Van nature richt het technologiebedrijf zich op ic’s, want daar wordt ongelooflijk veel data verzameld door beademingsmachines, bloedtesten en andere patiëntmonitoring. ‘Dat zijn algauw 30.000 datapunten per patiënt per dag’, aldus Herter. 

Daarnaast zijn artsen volgens De Bruin gewend om op basis van data te sturen. ‘Ze hebben continu monitoren voor zich met grafiekjes en hebben ook allerlei richtlijnen waar heel erg op basis van data wordt gestuurd.’ Bij zoveel data kan machine learning helpen om meer overzicht te krijgen. Die vat al die datastromen samen en kan, in het ideale geval, op basis daarvan aanbevelingen doen.

‘Burning up’

Zo ook bij corona, is de gedachte. Herter: ‘Intensivisten staan onder enorme druk. Covid-19 is een nieuwe ziekte, er is nog veel onbekend over hoe ic-patiënten het beste behandeld moeten worden. Omdat grote wetenschappelijke studies nog lang op zich laten wachten, wilden we zelf data van verschillende ziekenhuizen verzamelen.’ Uiteindelijk zouden er bijna veertig ic’s

Bij verzamelde data zaten bijvoorbeeld metingen van de beademingsapparatuur, waaronder de hoeveelheid zuurstof die een patiënt kreeg toegediend, ademhalingen per minuut, gemeten zuurstofdruk, hartslagmetingen, temperatuur, bloeddruk en bloedwaardes. Daarnaast werden ook data over de dosering van bepaalde medicatie verzameld, en wanneer deze werd gestart en gestopt. Ook een aantal demografische gegevens werden meegenomen, zoals leeftijd, geslacht, mogelijke andere aandoeningen bij ziekenhuisopname en of iemand tijdens de opname was overleden. In totaal verzamelde Amsterdam UMC zo’n 500 miljoen waarnemingen van ongeveer twee derde van alle coronapatiënten die op Nederlandse ic’s zijn

Tot zover het makkelijke werk. 

Want ic’s leveren data allemaal net iets anders aan. Zo maakt het nogal uit hoe de zuurgraad van het bloed (pH) gemeten wordt: veneus (via de ader) of arterieel (via de slagader). Ic’s noteren dat op verschillende manieren, waardoor het in de data niet altijd duidelijk is welke pH-waarde nu precies wordt getoond. Dat moet dus alsnog worden berekend, of in het slechtste geval, per ic worden uitgeplozen. 

Nog zo’n praktisch probleem: in de data leek het alsof veel mensen geregeld voor korte tijd van de vaste beademing bij hun bed werden gehaald, een heel vreemd patroon. Wat bleek: patiënten werden aan een andere mobiele beademingsmachine gelegd, zodat ze een CT-scan konden laten maken. Maar die data had Pacmed niet. Datawetenschapper De Bruin: ‘Als je daar niet op corrigeert, ga je verkeerde conclusies trekken.’

Uiteindelijk is een team van datawetenschappers en artsen maandenlang voltijd bezig geweest om alle patiëntdata op orde te krijgen, een zeer specialistische en arbeidsintensieve klus die niet even aan een paar stagiairs kan worden overgelaten. 

Voor bepaalde patiënten bleek de ene behandeling beter te werken dan de andere. Daar ligt dus een kans

Het resultaat is een dataset waar met behulp van machine learning allerlei patronen kunnen worden ontdekt. Intensivist Paul Elbers heeft de resultaten nog niet gepubliceerd, maar ziet wel dat ic’s covid-19 op verschillende manieren behandelen. Voor bepaalde patiënten bleek de ene behandeling beter te werken dan de andere. Daar ligt dus een kans om van artsen van verschillende ziekenhuizen te leren. ‘Dit zijn allemaal nog correlaties, waarschuwt hij, dus er moet nog verder onderzoek naar worden gedaan.’ Aan de hand van deze en toekomstige resultaten kunnen behandelrichtlijnen

Aan de hand van al deze patiëntendata wordt vooralsnog geen tool gemaakt voor ic’s. Denk bijvoorbeeld aan een soort slimme digitale assistent die voor iedere nieuwe patiënt een prognose kan maken van de meest geschikte behandeling. Volgens Herter en De Bruin kost dat erg veel tijd. De software zou extreem uitvoerig en herhaaldelijk getest moeten worden – het gaat immers om Ic’s en ziekenhuizen zouden hun eigen systemen moeten aanpassen zodat er continu data beschikbaar zijn en artsen zouden opgeleid moeten worden om met de software om te leren gaan. Daar is nu geen

Casus 3: Buiten hiv gerekend

In de radiologie speelt AI al langer een prominente rol. Computers kunnen bijvoorbeeld longfoto’s helpen analyseren en daarmee radiologen ondersteunen en tijd besparen. Een bijkomend voordeel: computers worden niet moe van het turen en blijven ‘oog’ houden voor de kleinste details. 

Bij ziektes als longkanker en tuberculose wordt deze vorm van computer vision al ingezet. En nu blijkt het ook van pas te komen bij coronabestrijding. Keelin Murphy, postdoctoraal onderzoeker bij de Diagnostic Image Analysis Group van het Radboudumc in Nijmegen, ontwikkelde het dat in vier van de vijf gevallen covid-19 goed kan diagnosticeren aan de hand van longfoto’s. 

‘Runny nose’
‘Having the chills’

Vanuit Ierland vertelt Murphy dat Nederlandse radiologen aan het begin van de coronacrisis moeite hadden om de toestroom van patiënten te verwerken. Vanuit haar ervaring met automatische diagnostiek voor tbc-patiënten in Afrika heeft Murphy een bestaand AI-systeem aangepast aan covid-19, zodat ziekenhuizen het kunnen gebruiken om coronapatiënten sneller te herkennen. Het systeem is gratis beschikbaar.

Ook hier blijkt weer dat er veel specialistische medische kennis nodig is om een bruikbaar AI-systeem te ontwerpen. Zo was door eerder gebruik van dit specifieke systeem in zuidelijk Afrika al bekend dat het minder goed werkt bij patiënten die hiv hebben in combinatie met tuberculose. Keelin: ‘Hun immuunsysteem reageert anders op covid-19, waardoor de longfoto’s er anders uitzien en de ziekte mogelijk niet wordt herkend.’

In Nederland is het niet zo’n probleem als de kunstmatige intelligentie er een keer naast zit, want hier kijkt altijd nog een radioloog mee. Maar in zuidelijk Afrika zijn er veel te weinig radiologen en moeten artsen dus meer vertrouwen op CAD4COVID. ‘In de praktijk wordt het systeem dan ook gebruikt voor screening, om te bepalen wie alsnog een test krijgt. Zeker in landen waar een groot tekort is aan PCR-tests, kan dat helpen.’

Volgens Delft Imaging, het bedrijf dat het systeem verder heeft ontwikkeld, wordt het in meer dan honderd ziekenhuizen gebruikt, verspreid over veertig landen. In Nederland wordt het vooralsnog alleen in het Bernhoven Ziekenhuis in Uden gebruikt. 

Het Jeroen Bosch Ziekenhuis (regio ‘s-Hertogenbosch) heeft meegeholpen aan het ontwikkelen van CAD4COVID, maar maakt geen gebruik van het systeem. De reden: bij tests werden er nog altijd valse positieven gegeven. Het ziekenhuis gebruikt daarom voorlopig onder andere bloedwaarden om corona vast te stellen.

Kun je het vertrouwen?

De ervaringen van de verschillende ziekenhuizen leggen een belangrijk probleem bloot voor de toepassing van AI in de zorg: medische zorg is bijzonder ingewikkeld en stelt ook veel hogere eisen aan betrouwbaarheid van de data en analyses. Als er iets misgaat, worden patiënten niet goed behandeld en vallen er misschien zelfs doden.

Daan de Bruin, de datawetenschapper van Pacmed, maakte in een vorig leven als consultant AI voor bedrijven als Booking.com. ‘Als je daar een idee hebt, maak je een machine-learning-model. Dat kan je dan een dag later op de website uitproberen. Werkt het niet, dan pas je het aan. In de zorg kun je niet op die manier experimenteren.’

Dat ziet ook Arjen-Kars Boer, de klinisch chemicus van het Catharina Ziekenhuis. ‘Niemand accepteert het als een computer beslist over onze gezondheid. Er moet altijd een mens tussen zitten.’ 

En zelfs de radiologie, het voornaamste domein waar AI zich de afgelopen tijd heeft ontwikkeld, laat een computer niet beslissen over diagnoses of behandelingen. Boer: ‘De computer doet alleen een suggestie. De arts kan die naast zich neerleggen.’ AI zal volgens hem alleen geaccepteerd worden als de aanbevolen diagnose gecontroleerd kan worden.

Ook is het voor AI vaak nog lastig om oorzaak en gevolg te vinden in een dataset. Boer vertelt over een recente ontdekking, waarbij hij aan de hand van veel data een nierprobleem kon koppelen aan de aanwezigheid van een bepaald hormoon. De belofte was dat als je dat hormoon aantreft, dat iets zegt over de nierfunctie. 

Kunstmatige intelligentie is vooral goed in het vinden van correlaties

Bij nadere inspectie bleek dat niet het geval. De hormoonafwijking werd niet door de nieren, maar door een medicijn veroorzaakt. Volgens Boer zie je dit soort oorzaak-gevolgrelaties snel over het hoofd met kunstmatige intelligentie, die vooral goed is in het vinden van correlaties. 

Hij is dan ook sceptisch over de AI-miljarden die grote techbedrijven, zoals Google, op de zorgmarkt investeren. ‘Die grote firma’s zijn ervan overtuigd dat als je maar genoeg data hebt, je vanzelf een patroon vindt. Helaas is dat niet waar. Daar waar het de zorg van de patiënt raakt, moet je echt op een andere manier onderzoek doen.’

Iedereen die ik voor dit verhaal heb gesproken is het over één ding roerend eens: voor de ontwikkeling van bruikbare AI-systemen moeten de gezondheidsdata van betere kwaliteit zijn.

Daan de Bruin van Pacmed hoopt dat ziekenhuizen meer met elkaar gaan samenwerken, zodat informatie door iedereen op dezelfde manier wordt bijgehouden. Zo wordt het makkelijker om de data van ziekenhuizen te koppelen en onderzoek te doen. ‘Bij een nieuwe pandemie, of bij de reguliere ic-zorg, wordt het dan makkelijker om op grote schaal machine learning toe te passen. Het zou al veel schelen als we het monnikenwerk kunnen overslaan.’

‘Fatigue’

Lees ook: