Hoe zal COVID19 zich verspreiden? Hoeveel mensen zullen besmet raken en hoeveel dodelijke slachtoffers zullen er vallen? Om deze vragen te kunnen beantwoorden, moeten we gegevensgestuurde voorspellingen doen over de toekomstige verspreiding van het virus. Dit is geen gemakkelijke taak.
Ik ondervond dit aan den lijve toen ik een plaatselijk ziekenhuis hielp voorspellingen te doen over de benodigde IC-capaciteit. Omdat ik geen epidemioloog ben, antwoordde ik dat ik niet in staat was om echte voorspellingen te doen. Ik kon echter wel inzicht geven in de mogelijke effecten van deze voorspellingen op hun lokale IC-capaciteit. In de loop van dit project leerde ik twee dingen die een datagestuurde voorspelling van de verspreiding van Covid19 zo moeilijk maken.
Complexiteit van modellering
Het modelleren van de verspreiding van een virus is complex. Transmissiedynamica, die weergeeft hoe een ziekte zich verspreidt, vereist metingen van besmettelijkheid, lengte van incubatietijd, duur van hoe lang een patiënt besmettelijk is, om er een paar te noemen. De klinische dynamiek, die de effecten op de klinische praktijk beschrijft, vereist het sterftecijfer, het aantal ziekenhuisopnames, de duur van het ziekenhuisverblijf, om er maar een paar te noemen [1]. Bovendien zijn er beleidsinterventies zoals een lockdown of sociale distantiëring die (hopelijk) het verloop van de verspreiding van het virus veranderen.
Het modelleren van de spreiding is dus niet zo eenvoudig als het extrapoleren van historische resultaten naar de toekomst, het vereist inzicht in de wiskundige modellen, de dynamiek van een klinische operatie en de impact van beleid. Geen gemakkelijke taak.

De werkelijke gegevens in "gegevensgestuurd"
Om een voorspelling te doen op basis van gegevens, is de kwaliteit van de gegevens heel belangrijk. In het geval van COVID-19 is dit niet zo duidelijk als het op het eerste gezicht lijkt. Door de beperkte testcapaciteit hebben de meeste landen geen overzicht van het aantal mensen dat besmet is met het virus, wat van invloed is op de parameters van het voorspellingsmodel.
Tot overmaat van ramp kan een groot deel van de bevolking besmet zijn zonder symptomen te vertonen. Toen passagiers van het in quarantaine geplaatste cruiseschip Diamond Princess werden getest, leverde dat een verontrustend beeld op. 52% van de personen die positief getest waren op COVID19 (N = 326) op het schip, had niet symptomen hebben [2]. Het werkelijke aantal besmette mensen kan dus enorm onderschat worden, waardoor het nog verstandiger wordt om sociale afstand te nemen. Om deze problemen tegen te gaan zijn er verschillende teststrategieën bedacht, maar het probleem blijft bestaan. Het maken van nauwkeurige voorspellingen op basis van zulke onvolledige gegevens is op zijn zachtst gezegd problematisch.
Wat nu?
Ik denk dat het wel duidelijk is waarom je jaren van studie en een masterdiploma nodig hebt voordat je zinnige uitspraken kunt doen over de verspreiding van dit virus. Moeten we dan maar stoppen met het maken van datagestuurde modellen in het licht van deze hoge onzekerheidsniveaus? Nee, het begrijpen van gegevens blijft een waardevolle activiteit, mits uitgevoerd met expertise en adequate gegevens. Ook al zijn nauwkeurige en betrouwbare voorspellingen moeilijk, voorspellingen bieden besluitvormers een kader voor actie. Wat gebeurt er als we niets doen? Of als we afsluiten? De nauwkeurigheid van de modellen is minder relevant, de algemene richting des te meer.
Uit simulaties van overheidsinterventies distilleerden epidemiologen de nu "beroemde" "flatten the curve"-strategie. Je kunt de code downloaden om zelf te zien hoe deze strategie tot stand is gekomen [3]. Dat is waar de echte waarde ligt van het doen van deze analyses, het helpt besluitvormers om verschillende opties te waarderen onder hoge onzekerheidsniveaus.
Hartelijk dank
Zoals onze minister-president het zo treffend zei: "Ik moet 100% van de beslissing nemen met 50% van de informatie". Laten we even stilstaan bij de moeilijke taak die onze statistici, epidemiologen en wetenschappers hebben. Het is moeilijk om wijs te worden uit deze complexe situatie met onvolledige, rommelige gegevens en zeer complexe modellen. De implicatie van beleid en een hoge mate van onzekerheid is een flinke combinatie die zwaar op de schouders van onze wetenschappers moet wegen. Ik ben in ieder geval erg dankbaar dat we een goed opgeleid, slim team mensen hebben dat is toegerust voor deze moeilijke taak. Dus aan alle epidemiologen, statistici en wetenschappers: BEDANKT!

Bob Rietveld
Hoofd groei-analyse
Gerelateerde berichten
Strategieën om verstoring tegen te gaan of om zelf een verstoorder te worden
We zien hetzelfde gebeuren in de zakenwereld....
7 januari 2021
Vroegtijdige waarschuwingssignalen voor verstoring
Elke bedrijfstak kan worden ontwricht. Netflix is een beroemd voorbeeld....
15 december 2020
De grote reset: Ontwricht of word ontwricht
We leven in tijden van ongekende verandering. Om hiermee om te gaan...
3 december 2020