Laatste nieuws
6 minuten leestijd
onderzoek

Trial niet enige bron van wijsheid

2 reacties

De medische wereld heeft zich afhankelijk gemaakt van de randomized controlled trial (RCT). Hoewel waardevol, kunnen daarmee niet alle vragen worden beantwoord. Sietse Wieringa en Babette Rump willen andere manieren van wetenschappelijk redeneren weer eens onder de aandacht brengen.

Arts en schrijver Ivan Wolffers legt ons in zijn MC-column van 17 september een aangrijpend vraagstuk voor.1 Een versleten heup belemmert zijn functioneren en een prothese zou uitkomst bieden, maar uitzaaiingen van zijn prostaatkanker in het operatiegebied maken plaatsing van een kunstheup risicovol. Een lastig dilemma. Wolffers vraagt zich openlijk af of de medische wetenschap hem eigenlijk wel een antwoord kan geven. ‘Of’ stelt hij, ‘lossen we dit zoals zoveel in ons werk op zonder wetenschap, maar met wijsheid?’ Maar is wetenschap dan niet altijd synoniem voor wijsheid? Het is een retorische vraag en een onthutsende ontdekking: de huidige medische wetenschap is niet in staat om al onze medische vragen te beantwoorden.

Frequentie-inductie
Het is een gegeven dat we in de medische wereld afhankelijk zijn geraakt van de randomised controlled trial (RCT). David Sackett, een van de grondleggers van evidencebased medicine, vond de RCT – of nog beter: een systematische review van een paar RCT’s – de beste manier om tot de medische waarheid te komen. Hij noemde het ‘waarschijnlijker’ dat deze vorm van onderzoek ‘ons informeert en minder waarschijnlijk dat deze ons misleidt’.2 Waarom dit zo zou zijn, is helaas niet helemaal duidelijk.

Een RCT geeft geen verklaringen, maar biedt een handvat voor het voorspellen van de toekomst. Kort samengevat komt het neer op redenatie volgens ‘inductieve inferentie van het frequentietype’.

De filosoof Hacking legt dit redenatie-type heel aardig uit.3 Hij neemt ons mee naar de grote denker David Hume die in 1739 stelde dat we de toekomst niet kunnen voorspellen. Dat de zon gisteren en vandaag is opgekomen, wil niet zeggen dat we 100 procent zeker kunnen zijn dat hij morgen weer opkomt. Oftewel: resultaten uit het verleden bieden geen garantie voor de toekomst.

Dit ‘inductieprobleem’ kunnen we op een aantal manieren ontwijken. De frequentie-inductiebenadering, zoals onder andere gebruikt bij een RCT, onderkent dat we niet voor het individuele geval de toekomst kunnen voorspellen, maar stelt dat we wel ‘meestal’ gelijk kunnen hebben voor grote groepen mensen of frequente gebeurtenissen. Kort door de bocht gesteld gaat deze redenering ervan uit dat alles in de wereld zich gedraagt als een dobbelsteen; niet alleen materiële dingen, maar bijvoorbeeld ook een willekeurige groep mensen.

Het uitgangspunt is dat deze dobbelstenen zuiver rollen. Is één kant zwaarder dan de andere, dan heet dat bias. Nu kennen we al heel veel soorten bias. Middel A lijkt bijvoorbeeld in vergelijking met middel B beter te werken, maar middel A werd tijdens het vergelijken voorgeschreven aan mensen met andere kenmerken dan middel B. Daarin zijn we niet geïnteresseerd; we zoeken een verschil dat we niet al (van te voren) hadden kunnen verklaren.

P-waarde
Een randomized trial doen is als het frequent laten rollen van een dobbelsteen. Als de dobbelsteen zuiver is, dan moet elke uitkomst gemiddeld even vaak voorkomen. Als we telkens 6 gooien, is de dobbelsteen onzuiver, maar een aantal keer achter elkaar 6 gooien kan natuurlijk wel. Over de kans dat dat gebeurt, hebben we een uitspraak gedaan. In de medische wetenschap definiëren we ‘onwaarschijnlijk’ gewoonlijk als een kans kleiner dan 1 op 20 (p=0,05). Ter vergelijking: bij het zoeken naar het higgsdeeltje in de natuurkunde werd een kans kleiner dan 1 op 3.500.000 ‘onwaarschijnlijk’ gevonden.

Als iets onwaarschijnlijk is, dan moet het omgekeerde wel waar zijn. De dobbelsteen was onzuiver, een van de vlakken was zwaarder dan de andere, middel A is beter dan middel B. We weten niet waardoor dat komt – je zou het onbekende bias kunnen noemen – maar wel dat het zo is.

Deze manier van redeneren heeft nadelen. Ofschoon het goed werkt voor grote groepen mensen, kan het uit principe niets zeggen over het zogenaamde single case scenario, oftewel een enkele patiënt, hier en nu in onze spreekkamer. Je kunt maar één keer een eerste heupprothese krijgen, niet honderd keer. Het gaat goed of het gaat fout. En dat is precies het probleem waar Ivan Wolffers mee worstelt.

Leren van ervaring
Gelukkig zijn er ook andere manieren om het inductieprobleem te ontwijken. We gebruiken deze manieren van redeneren als moderne artsen volop, maar we zijn ons er niet zo van bewust dat ze, als het om waarheidsvinding gaat, net zo geldig zijn als inductie van het frequentietype

Zo is er de Bayesiaanse ontwijking. Dit type van inductief infereren zegt dat we de toekomst niet kunnen voorspellen, maar dat we wel redelijk goed kunnen leren van onze ervaringen. Daarmee kunnen we steeds betere voorspellingen doen. Omdat we ook kunnen leren van een enkele casus, is deze benadering veel meer geschikt voor het individuele geval. En deze vorm is zeker niet voorbehouden tot kwalitatief onderzoek. In de kwantitatieve vorm wordt dit type van redeneren gebruikt in bijvoorbeeld gezichtherkenningssoftware. Als we daarbij frequentie-inductie zouden toepassen, konden we alleen maar zeggen of iemand lijkt op het gemiddelde gezicht. Met statistiek berustend op Bayesiaanse inductie kunnen we specifieke gezichten onderscheiden.

Artsen gebruiken deze manier van redeneren zeer veel in de spreekkamer. Het vormt de basis voor patroonherkenning en lering trekken uit diagnostische uitslagen. De uitkomst van een test, het antwoord op een vraag of een kenmerk van de patiënt maakt iets in de toekomst meer of minder waarschijnlijk. In het concrete geval van collega Wolffers zouden we hem misschien aanraden een sterk vergelijkbare casus te vinden en daarvan te leren.

Falsifiëren
Dan is er nog de anti-inductie-ontwijking van Karl Popper.4 Hij gaf Hume gelijk: we kunnen niets zeggen over de toekomst. Er zijn slechts theorieën die niet eens bewezen kunnen worden. In het gunstigste geval kunnen we alleen maar aantonen dat ze fout (falsifieerbaar) zijn. Ook deze manier van redeneren gebruiken we (onbewust) veel in de spreekkamer. We doen bijvoorbeeld een proefbehandeling met salbutamol. Als dat niet werkt, dan is astma minder waarschijnlijk. Een proefbehandeling zoals het plaatsen van een heupprothese is in deze redenatievorm de ultieme test om de vraag te beantwoorden, maar dit is natuurlijk nogal vergaand en onbevredigend.

Er is ook een stroming die betwijfelt of het in de zorg überhaupt wel gaat om het voorspellen van de toekomst. In The Logic of Care stelt Annemarie Mol dat de gezondheidszorg meer een practice is, iets wat we gewoon doen.5 Deze benadering legt meer nadruk op het belang van goed zorgen voor de patiënt en het voorkomen van verwaarlozing. Dit speelt natuurlijk in elke spreekkamer een belangrijke rol. Dokter Wolffers zou ervoor kunnen kiezen om de prothese te nemen, al was het maar om íets te doen, om actief te blijven streven naar wat hij belangrijk vindt in het leven, zoals genieten van een boswandeling.

Eerherstel
De harde realiteit is dat dit vraagstuk voor collega Wolffers meer is dan alleen een gedachte-experiment. Hij wordt werkelijk geconfronteerd met dit dilemma. Onder de online versie van de column van Ivan Wolffers staan reacties van collega’s die meedenken. Een enkeling verwijst naar een RCT, de meesten verwijzen naar een goed gesprek met de huisarts. En vanuit bovenstaand perspectief is dat laatste wijsheid. In een consult gebruiken we veel meer vormen van redeneren om tot een waar antwoord te komen. Misschien is het voor de medische wetenschap tijd om ook deze vormen van redeneren in ere te herstellen. Zodat wijsheid en wetenschap weer dichter bij elkaar komen te liggen.


Sietse Wieringa, huisarts en research fellow primary care & public health, Londen

Babette Rump, profielarts infectieziektebestrijding, arts maatschappij en gezondheid in opleiding


contact: s.wierenga@qmul.ac.uk; cc: redactie@medischcontact.nl

Geen belangenverstrengeling gemeld



Voetnoten

1 Wolffers I. Waarde collega’s. Medisch Contact 2013; 38: 1893. Voor reacties, zie column 'Waarde collega's'.
2 Sackett DL, Rosenberg WC, Gray JAM. Evidence based medicine - what it is and what it isn't. BMJ 1996; 312: 71-2.
3 Ian Hacking. An introduction to Probability and Inductive Logic. Cambridge University Press, 2001.
4 Karl Popper. Objective Knowledge. An Evolutionary Approach. Oxford University Press, 1972.
5 Annemarie Mol. The Logic of Care. Health and the problem of patient choice. Routledge, 2008.

getty images
getty images
<b>Download dit artikel (PDF)</b>
onderzoek
Op dit artikel reageren inloggen
Reacties
  • ,

    Geachte collega’s Wieringa en Rump,
    Geweldig dat jullie de moed hebben genomen om het artikel “Trial niet enige vorm van wijsheid” te schrijven, gepubliceerd in Medisch Contact van 5 december 2013.
    Het wordt tijd dat artsen weten dat er een goede al...ternatief bestaat op de RCT-trialmethodologie, m.n.de Bayesiaanse. Zijnde een Bayesiaan,heb ik toch enkele kanttekeningen op jullie artikel.
    1.De titel.Tav.waarheidsvinding zou ik liever het woord Kennis in plaats van Wijsheid gebruiken. Wijsheid heeft vele connotaties, afhankelijk van de context en de lezer.
    2.De RCT wordt beschreven als een “ïnductieve inferentie van het frequentietype”. Nee, RCT is in de grond van de zaak een “hypothetico-deductieve” methode met een vleugje inductie. Bij het trial design begint men met zowel de nulhypothese (Ho) als de alternatieve hypothese (Ha). De data moet de Ho falsifiëren en wanneer dit gebeurt,dan wordt Ha aangenomen. Dit is een inductieve stap, weliswaar een merkwaardige (niet volgens de regel van de logica), want de afleiding (inference) komt van de negatie van Ho, dwz. niet rechtstreeks.
    3.P-value. In de medische wetenschap definiëren we “onwaarschijnlijkheid” gewoonlijk als een kans kleiner dan 1 op 20 (p=0.05). Sorry, een veel gemaakte fout. Dus nee, p<0.05 betekent, er is genoeg bewijskracht, gezien de data (significantie op 5 % niveau) om de Ho te verwerpen. Het is een mate van precisie van het design (significance-level), de p-waarde moet alvorens de data gekozen worden.
    4.Falsifiëren. Het is niet een anti-inductie-ontwijking van Popper, maar deze falsificatie van de nulhypothese is veeleer een inductie-ontwijking.

    Als laatste: mijn lof voor het opzet van het artikel.

    Met een collegiale groet,

    SH Kwee,arts-acupuncturist, Amsterdam

  • W.J. Duits

    Bedrijfsarts, HOUTEN

    Is dit niet de essentie van het verschil tussen Geneeskunde en Geneeskunst?

 

Cookies op Medisch Contact

Medisch Contact vraagt u om cookies te accepteren voor optimale werking van de site, kwaliteitsverbetering door geanonimiseerde analyse van het gebruik van de site en het tonen van relevante advertenties, video’s en andere multimediale inhoud. Meer informatie vindt u in onze privacy- en cookieverklaring.