Blog

Oorzaak en gevolg

  • Rode lichten
  • 6 minuten (1183 woorden)

Fotocredit: Pedro Ribeiro Simões, via Flickr

Voorspelt grijs haar hebben of je binnen 10 jaar zult overlijden? Die vraag stelden we als een van de eersten aan eerstejaars studenten geneeskunde. Allicht. Maar is grijs haar de oorzaak van overlijden? Dat niet. De meeste mensen zullen op hun klompen aanvoelen dat mensen met grijs haar doorgaans wat ouder zijn dan mensen met (nog) blond, rood of zwart haar, en dus ook een grotere kans hebben binnen 10 jaar te overlijden.

Door: Erna van Balen

Confounding heet dat in de epidemiologie, oftewel maskering van een werkelijk effect van leeftijd op sterftekans, in dit geval door grijs haar. Dat klinkt logisch. En toch trappen journalisten, maar ook wetenschappers zelf, regelmatig in die val.  

Zo zouden kale mannen een groter risico lopen op een ernstig verloop van Covid-19, berichtten onder andere Scientias en de Telegraaf in het voorjaar van 2020. Later schreven ook Forbes en het gerenommeerde Science erover. Het waren de eerste maanden van de pandemie, en wetenschappers wereldwijd waren naarstig op zoek naar kennis over het verloop van deze toen nog nieuwe longziekte.

Spaanse onderzoekers ‘ontdekten’ dat mannen die op de ic lagen, bovengemiddeld vaak kaal waren: 79 procent had geen haar meer (Dat ‘bovengemiddeld’ baseerden ze overigens op Australisch onderzoek onder 1390 mannen die meededen aan een studie naar prostaatkanker – een heel andere onderzoeksgroep dus). Zou die relatie tussen een kaal hoofd en ernstige covid-19 verklaard kunnen worden door androgenen - mannelijke hormonen die een eiwit maken dat Sars-CoV-2 mogelijk de toegang verschaft tot longcellen én zorgt voor kaalheid?

Klinkt plausibel. Maar er is een meer voor de hand liggende verklaring: leeftijd. Een hogere leeftijd is een bekende risicofactor voor zo’n beetje alle ziektes, inclusief covid. Dat was ook aan het begin van de pandemie al wel duidelijk. Daarnaast hadden veel ic-patiënten ook andere ziekten, zoals hart- en vaatziekten. Ook die zouden wel eens kunnen bijdragen aan het overlijdensrisico. De effecten mengen zich dus: dat van leeftijd, dat van andere aandoeningen, en wellicht dat van de androgenen. Alleen maten de onderzoekers geen androgenen, dus of en welk effect die hadden, bleef onduidelijk.

Wiens risico?

Confounding is geen nieuw probleem. Een klassiek voorbeeld uit de jaren zestig: hoe meer kinderen, hoe groter de kans dat de jongste het syndroom van Down heeft. Vooral het vijfde kind en latere kinderen hebben een drie keer zo grote kans om met het syndroom van Down ter wereld te komen als een eerste kind. Maakt het echt uit of je de jongste of de oudste bent?

Ook hier verstoort de volgorde het werkelijke effect: dat van de leeftijd van de moeder. Hoe ouder de moeder, hoe groter het risico. Moeders zullen bij de geboorte van hun vijfde kind vaak ouder zijn dan moeders die hun eerste kind baren. Pluis je de data verder uit, waarbij je moeders groepeert op leeftijd, dan blijkt inderdaad dat oudere moeders een groter risico hebben op een kind met het syndroom van Down, ongeacht het hoeveelste kind het is.

Soms is confounding nog wat subtieler. Vergelijk je hoe vaak mensen die antistollingsmiddelen gebruiken in het ziekenhuis belanden met mensen die geen antistollingsmiddelen gebruiken, dan zul je vinden dat die eerste groep vaker wordt opgenomen in het ziekenhuis. Dat komt niet zozeer door de antistollingsmiddelen zelf, maar doordat de mensen die ze gebruiken sowieso al een groter risico hadden om in het ziekenhuis terecht te komen, bijvoorbeeld omdat ze eerder trombose hebben gehad. Zelfs binnen een patiëntengroep met een verhoogd risico kan het uitmaken of iemand het ene of het andere medicijn krijgt: de arts heeft meestal een reden om het ene of juist het andere middel voor te schrijven, afhankelijk van hoe groot hij of zij het risico acht. Dat daar een keus achter zit, en niet het toeval, maakt dat de groepen onvergelijkbaar worden.

Niet alleen in de geneeskunde is confounding een veelvoorkomend probleem. Zo blijken jongeren met een migratieachtergrond vaker verdacht te worden van een misdrijf dan autochtone jongeren. Maar dat is niet het hele verhaal. Jongeren met een migratieachtergrond wonen ook vaker in steden (waar criminaliteit vaker voorkomt dan op het platteland), komen vaker uit gezinnen met een zwakke sociaal-economische positie (die vaker crimineel gedrag vertonen) en komen mogelijk vaker in beeld bij de politie door etnisch profileren.

Waar het vóórkomen van Down-syndroom volledig te verklaren was door de leeftijd van de moeder, is de oorzaak van crimineel gedrag wat ingewikkelder en niet te verklaren door alleen migratieachtergrond of alleen sociaal-economische positie of alleen etnisch profileren. Wel hebben beide voorbeelden gemeen dat effecten elkaar maskeren of zich mengen.

Doe eens een gedachtenexperiment

Bij elke claim over oorzaak-gevolg zou je je moeten afvragen: wie vergelijk je met wie, en hoe zijn die groepen tot stand gekomen? Verschillen de twee groepen niet sowieso al van elkaar? Bekende verschillen zijn leeftijd en sociaal-economische positie, maar bijvoorbeeld ook rook- en drinkgedrag; bij medisch onderzoek zijn dat de usual suspects als het gaat om verstorende effecten, en ook bij sociologisch onderzoek zijn ze vaak van toepassing.

Bij medisch onderzoek is het probleem van groepen die van elkaar verschillen op te lossen door een groep mensen willekeurig aan twee (of meer) groepen toe te wijzen. Daardoor zullen de mensen in de ene groep ongeveer even oud zijn als mensen in de andere groep, en zullen er in iedere groep ongeveer evenveel mensen zitten met een lage sociaal-economische positie. Geef je vervolgens de ene groep een nieuw medicijn en de andere een placebo (een nepmedicijn), dan kun je met redelijke zekerheid zeggen dat een verschil in gezondheidsuitkomsten dat je vindt te wijten is aan het medicijn, en niet stiekem aan een verschil in leeftijd of sociaal-economische positie of nog weer iets anders.

Een experiment dus, de gouden standaard van de wetenschap. Als je de relatie onderzoekt tussen kaalheid en ernstige covid, of tussen migratieachtergrond en criminaliteit, is dat natuurlijk geen experiment. Maar je kunt in gedachten wel doen alsof je een experiment doet, door je af te vragen: zijn de te vergelijken groepen net zo willekeurig gekozen als ze in een experiment zouden zijn? Zijn er verschillen tussen de groepen die óók je bestudeerde uitkomst (ernstige covid, criminaliteit) kunnen verklaren? Zo ja, dan ligt confounding op de loer.

Dat een experiment de gouden standaard is, betekent overigens niet dat al het andere, niet-experimentele onderzoek naar oorzaak-gevolgrelaties ‘dus’ waardeloos is. Ook zonder mensen willekeurig toe te wijzen aan wel of niet een leven lang sigaretten laten roken weten we immers dat roken longkanker veroorzaakt. Statistici hebben een hele gereedschapskist om bij dit soort onderzoek zo goed mogelijk een experiment na te bootsen. Als je genoeg gegevens hebt waarin mensen kunnen verschillen, lukt dat meestal vrij goed.

Het meeste onderzoek is niet-experimenteel, en dat is prima. Maar is de claim wat dubieus? Pas dan op voor het rode licht.

 

Dit is de derde aflevering in een reeks waarin wetjo's en wetco's elkaar waarschuwen voor nieuws dat geen nieuws is, de rode-lichten-serie. De eerste aflevering betrof de archeologie, de tweede de sterrenkunde.

Foto bovenaan dit blog via Flickr.


Eerste hulp bij de duiding van AI-nieuws
24jun

Eerste hulp bij de duiding van AI-nieuws

Als wetenschapsjournalist doe ik sinds 2010 verslag van kunstmatige intelligentie (AI) en ik heb dit deelgebied van de informatica zich...

Verslag excursie KNMI
03jun

Verslag excursie KNMI

Afgelopen mei waren we op bezoek bij het KNMI in De Bilt. VWN-lid Pim van Tend schreef een verslag van de middag, Bastienne Wentzel...