
Nieuwe statistiek-zonder-aannamen is de betere keuze voor veel onderzoek
Statistiek-promovendus Daniël Gomon ontwikkelde statistische methoden die bijvoorbeeld medisch en demografisch onderzoek sterk kunnen verbeteren. ‘Wiskundigen houden niet van onrealistische aannamen.’ Gomon promoveert op 19 juni.
Leren uit data. Dat is de essentie van bijna al het wetenschappelijke onderzoek. En bij het overgrote deel daarvan maken wetenschappers gebruik van statistiek om uit hun data te leren over de werkelijkheid. Met goede statistiek kunnen ze bijvoorbeeld bewijzen of aangetroffen verschillen tussen groepen patiënten toevallig zijn, of daadwerkelijk voortvloeien uit een verschillende behandeling.
Gomons favoriete onderwerp: statistiek
Statistiek is voor de meeste mensen geen favoriet onderwerp of bezigheid, maar wel voor Daniël Gomon. ‘Toen ik begon aan de bacheloropleiding Sterrenkunde & Wiskunde vond ik vooral de sterrenkunde interessant, maar aan het eind won toch de wiskunde, en vooral statistiek.’ Het werk aan zijn masterscriptie vond Gomon zo mooi en het ging zo goed, dat zijn promotieonderzoek eruit voortvloeide. ‘Ik heb gewerkt aan overlevingsanalyse. Dat draait om statistische modellen die uit onderzoeksdata kunnen laten zien hoelang het duurt voordat iets gebeurt.’
Gebruikelijke statistische modellen doen aannamen
Een bekend voorbeeld hiervan is hoelang het duurt voordat kanker terugkomt na een bepaalde behandeling, of hoelang iemand gezond blijft na een harttransplantatie. Hoeveel patiënten zijn na drie, vijf of tien jaar nog gezond of in leven? Gomon: ‘Een probleem bij dit soort analyses is dat statistische methoden altijd berusten op aannamen. Stel dat je iemand elk half jaar onderzoekt, en na anderhalf jaar blijkt de ziekte terug te zijn. Dan weet je niet of dat gebeurde na dertien of na zeventien maanden. Gebruikelijke statistische modellen nemen dan aan dat de ziekte precies anderhalf jaar later weer terug kwam.’ Om de werkelijkheid zo goed mogelijk te kunnen benaderen, helpt zo’n aanname niet. ‘Wiskundigen houden niet van onrealistische aannamen.’
De nieuwe modellen doen zo min mogelijk aannamen
Gomon ontwikkelde statistische modellen voor verschillende typen onderzoeksvraagstukken. De rode draad was steeds modellen te ontwikkelen die zo min mogelijk aannamen doen. Over het voorbeeld van de overlevingsanalyse na een medische behandeling legt hij uit: ‘Als iemand bij de derde halfjaarlijkse check ziek blijkt, kan dat dus begonnen zijn tussen de twaalf en achttien maanden. Mijn model neemt niet aan dat het na vijftien maanden begon, maar leert uit alle beschikbare data. Stel dat er meer mensen ziek bleken bij de vierde check dan bij de tweede check, dan is het aannemelijker dat de ziekte dichter bij de achttien maanden optrad dan vlak na de twaalf-maanden-check waarbij nog geen ziekte werd geconstateerd.’
Nu moeten wetenschappers ze nog gaan gebruiken
De modellen van Gomon verbeteren de benadering van de werkelijkheid. Dat is goed nieuws voor heel veel wetenschappers. Voor de medische wereld, maar bijvoorbeeld ook voor demografen die jaarlijks onderzoeken hoeveel Europeanen er emigreren naar een andere lidstaat. Het is alleen de vraag wannéér wetenschappers hun oude methoden loslaten en de nieuwe van Gomon gaan proberen. ‘De ervaring leert dat dat een tijd kan duren. Iemand moet ermee beginnen en de voordelen ervan inzien.’ Wie weet brengt dit artikel de ingebruikname sneller op gang.
Daniël Gomon promoveert 19 juni op het proefschrift Challenges in Survival Analysis.