Gebruik van kansschattingen in diagnostische processen in de Verloskunde en Gynaecologie dr. B.W. Mol, gynaecoloog, dr. B.C. Opmeer, psycholoog*, D. Veersema en dr. L.G.M. Mulders, gynaecologen Samenvatting In de geneeskunde wordt in diagnostische processen veelal gewerkt met testen met vaste afkapwaarden. Deze conventionele deterministische benadering leidt tot relatief meer fout-positieve en fout-negatieve diagnostiek, en daaruit voortvloeiend suboptimale behandeling, additionele schade door onnodig testen en extra kosten. In de verloskunde en gynaecologie bestaan hier talloze voorbeelden van, zoals de diagnostiek van een extra-uteriene zwangerschap, de kans op endometriumcarcinoom bij postmenopauzaal bloedverlies, de diagnostiek van tubapathologie bij onvervulde kinderwens, de predictie van longhypoplasie bij immatuur gebroken vliezen en de screening op zwangerschapsdiabetes. In deze gebieden werken nationale en internationale richtlijnen vaak met vaste afkapwaarden, daarmee voorbijgaand aan het feit dat voorafkansen voor een bepaalde ziekte sterk af kunnen wijken van het gemiddelde. Bovendien wordt veelal continue testinformatie met deze afkapwaarden aanzienlijk gereduceerd tot ofwel een positief ofwel een negatief testresultaat. Het gebruik van het theorema van Bayes maakt calculatie van patiëntspecifieke achterafkansen vanuit de voorafkans en de bij voorkeur continue testuitslag mogelijk. Zo’n werkwijze wordt al gehanteerd bij de screening voor het Down syndroom, waarbij de achterafkans wel optimaal wordt berekend op basis van maternale leeftijd, serumscreening en echoscopie. De achtergrond van deze problematiek wordt besproken. Vervolgens wordt een onderzoeksvoorstel toegelicht, dat in de komende vijf jaar in het kader van het NWO-subsidie programma zal worden uitgevoerd. Het voorgestelde onderzoek betreft de ontwikkeling, evaluatie en implementatie van probabilistische in plaats van de traditionele deterministische diagnostische regels. Voor een aantal diagnostische problemen zal een probabilistisch diagnostisch model worden ontwikkeld, gebaseerd op klinische data. Behalve naar de klinische (gezondheids) uitkomsten zal ook worden gekeken naar praktische aspecten van implementatie van probabilistische beslisregels (computerprogramma’s) en acceptatie van deze werkwijze door patiënten en artsen. Inleiding Het doel van diagnostiek is het aantonen of uitsluiten van ziekte. Het diagnostisch proces begint met de *Afdeling Klinische Epidemiologie, Academisch Medisch Centrum, Amsterdam, Nederland. Medisch Journaal, jaargang 33, no. 2 hoofdklacht van de patiënt. Bij deze hoofdklacht hoort in feite een a-priori kans die een patiënt heeft op een bepaalde ziekte. Vervolgens kan door het stellen van gerichte vragen in de anamnese en het verrichten van een lichamelijk onderzoek de kans op ziekte beter ingeschat worden. Soms is na anamnese en lichamelijk onderzoek al met grote zekerheid vast te stellen of een patiënte een bepaalde ziekte wel of niet heeft. In deze gevallen is aanvullende diagnostiek niet nodig, maar kan een behandeling gestart worden of de patiënte gerustgesteld worden, afhankelijk van de aan- of afwezigheid van ziekte. Vaak echter geven anamnese en lichamelijk onderzoek onvoldoende zekerheid om een beleid te kunnen bepalen, en is aanvullend onderzoek nodig. Het kan hierbij gaan om laboratorium onderzoek, beeldvormend onderzoek of om functietesten. Het is opmerkelijk dat bij aanvullend onderzoek vaak geen rekening wordt gehouden met de informatie verkregen bij anamnese en lichamelijk onderzoek. De uitslag van het aanvullende onderzoek wordt geïnterpreteerd als een entiteit op zich, zonder dat rekening gehouden wordt met de eerdere inschatting van de kans op ziekte op basis van anamnese en lichamelijk onderzoek. Gebruik makend van de regel van Bayes kan in veel gevallen door combinatie met eerder verkregen informatie de kans op ziekte nauwkeuriger worden geschat dan op basis van alleen de uitslag van het aanvullend onderzoek. Binnen het vakgebied Gynaecologie en Verloskunde zijn van deze situatie talrijke voorbeelden te geven. Bij een vrouw met postmenopauzaal bloedverlies bijvoorbeeld wordt op basis van endometriumdiktemeting bij transvaginale echoscopie een inschatting verkregen van de kans op endometriumcarcinoom. Indien de endometriumdikte 4 mm of minder is, wordt de kans op endometriumcarcinoom zo laag geacht dat vervolgonderzoek niet geïndiceerd is. Bij een endometriumdikte boven de 4 mm is vervolgonderzoek wel geïndiceerd, maar bij deze beslissing wordt geen rekening gehouden met verschillen in voorafkans op deze ziekte1. Talrijke observationele studies hebben echter aangetoond dat veel factoren, of beter gezegd indicatoren, van invloed zijn op de kans op de aanwezigheid van een endometriumcarcinoom. Zo is de kans op endometriumcarcinoom verhoogd bij mensen met diabetes, hypertensie of overgewicht2. Aan de andere kant komt endometriumcarcinoom relatief minder vaak voor bij vrouwen die nog slechts korte tijd postmenopauzaal zijn. 68 Andere voorbeelden waarbij gegevens uit de voorgeschiedenis niet worden meegenomen zijn het gebruik van het CA-125 als test voor een maligniteit van het ovarium bij een adnexal mass, het gebruik van de chlamydia-antistoftiter bij de kans op tubapathologie bij vrouwen met onvervulde kinderwens en de interpretatie van de cor-thorax ratio of thoraxomvangbuikomvang ratio bij zwangeren met immatuur gebroken vliezen waarbij de foetus risico heeft op longhypoplasie. Interessant is dat bij een beperkt aantal diagnostische strategieën binnen het vakgebied Gynaecologie en Verloskunde wel informatie uit de anamnese wordt gebruikt. Een voorbeeld hiervan is het gebruik van de a-priori kans op een baby met het syndroom van Down bij de prenatale screening. Het voorbeeld van prenatale screening. Traditioneel wordt screening op syndroom van Down in Nederland uitgevoerd aan de hand van de maternale leeftijd. Als een zwangere vrouw 36 jaar of ouder is heeft zij op basis van haar leeftijd een verhoogd risico op het syndroom van Down ten opzichte van vrouwen die jonger zijn. Op grond hiervan stelt de richtlijn dat aan alle vrouwen die bij 18 weken zwangerschap 36 jaar of ouder zijn invasieve prenatale diagnostiek dient te worden aangeboden in de vorm van aan vruchtwaterpunctie of vlokkentest. Sinds enkele decennia is echter bekend dat de kans op het syndroom van Down op basis van de maternale leeftijd (het zogenaamde leeftijdsrisico) genuanceerd kan worden met bloedonderzoek bij de moeder, waarbij een drietal serum markers bepaald kunnen worden, te weten alfafoetoproteïne, ongeconjugeerd oestriol (uE3), en de vrije ß subunit van humaan choriongonadotrofine (fß-hCG). De concentratie van deze drie ‘markers’ is bij vrouwen met een baby met Down syndroom gemiddeld genomen iets afwijkend van de concentratie van deze ‘markers’ bij vrouwen met een baby met een normaal chromosoompatroon. Indien een vrouw deze stoffen in haar zwangerschap laat bepalen (met de zogenaamde ‘triple test’), kan een kansschatting worden verkregen voor de aanwezigheid van het syndroom van Down op basis van haar leeftijd en de verschillende bloedbepalingen3. Het gebruik van het theorema van Bayes maakt calculatie van patiëntspecifieke achterafkans vanuit de voorafkans mogelijk4. Omdat er sprake is van volstrekte onafhankelijkheid tussen de maternale leeftijd en de serumbepalingen kunnen de kansen die voortvloeien uit verschillende bepalingen met elkaar vermenigvuldigd worden. Een jonge vrouw heeft een lagere a-priori kans dan een relatief oudere vrouw, waardoor zij bij dezelfde waarden uit de triple test, ook een lagere a posteriori kans heeft op een Down syndroom. Naast de triple test zijn sinds een aantal jaren ook andere niet-invasieve kansschattende testen beschikbaar voor de screening voor syndroom van Down. Het gaat hierbij onder andere om de nekplooimeting (nuchal translucency meting) en om eerste trimester serummarkers5. Ten aanzien van de nekplooimeting is een positieve correlatie aangetoond met de kans op Down syndroom: hoe dikker de echoscopisch gemeten nekplooi, hoe groter de kans op Down syndroom. Bij een gelijke nekplooidikte heeft een vrouw van 40 69 jaar een beduidend hogere kans op een aangedaan kind dan een vrouw van 25 jaar. Het elegante van het gebruik van kansschattingen bij de screening voor syndroom van Down is dat optimaal gebruikt wordt gemaakt van de beschikbare informatie: eerst wordt een voorafkans geschat, vervolgens wordt de achterafkans berekend uit de voorafkans in combinatie met de testuitslag. Buiten het terrein van de prenatale screening wordt de methodiek van het berekenen van achterafkansen in formele zin weinig toegepast in het vakgebied van de gynaecologie en verloskunde. Ten aanzien van het schatten van de kans op de aanwezigheid van endometriumcarcinoom bij vrouwen met postmenopauzaal bloedverlies wordt zoals hierboven gesteld een afkapwaarde van 4 mm gehanteerd. Bij ‘verdikt’ endometrium (i.e. 5 mm of dikker) wordt zonder rekening te houden met de voorafkans invasieve vervolgdiagnostiek geadviseerd. Het is echter bekend dat bijvoorbeeld bij vrouwen met diabetes mellitus, bij adipeuze vrouwen en bij vrouwen die langere tijd postmenopauzaal zijn, de kans op endometriumcarcinoom verhoogd is ten opzichte van vrouwen die deze kenmerken niet hebben. Toch wordt, althans in de richtlijnen van de beroepsvereniging, deze informatie niet gebruikt bij het bepalen van het beleid. De kans op longhypoplasie bij immatuur gebroken vliezen Een ander klinisch voorbeeld betreft de kans op longhypoplasie bij immatuur gebroken vliezen. Aanwezigheid van vruchtwater is een essentiële voorwaarde voor de ontwikkeling van de foetale longen. Indien de vliezen voor een zwangerschapsduur van 26 weken breken bestaat de kans op longhypoplasie. Bij counseling van patiënten met immatuur gebroken vliezen wordt in veel gevallen de cor-thorax ratio of de thoraxomvang-buikomvang ratio gemeten. Indien de omvang van het hart relatief groot is ten opzichte van de grootte van de thorax of indien de omvang van de thorax relatief klein is ten opzichte van de omvang van de buik (de klokvormige thorax of het echoscopische champagnekurkfenomeen) zou dit indicatief zijn voor de aanwezigheid van longhypoplasie6. Vaak wordt deze maat gebruikt bij de counseling van patiënten met immatuur gebroken vliezen, waarbij een thoraxomvang-buikomvang ratio < 0,80 indicatief zou zijn voor longhypoplasie. Bij het stellen van de diagnose wordt vaak geen rekening gehouden met andere factoren. De kans op hypoplasie wordt groter naarmate de vliezen eerder breken. Vergani rapporteerde in 1994 over factoren die deze kans beïnvloeden7. Hij vond dat twee factoren sterk van invloed waren, te weten de zwangerschapsduur ten tijde van het breken van de vliezen en de aanwezigheid van oligo- of anhydramnion in de periode tussen breken van de vliezen en geboorte van het kind. De invloed van deze factoren op de kans op longhypoplasie is zo groot dat ze in de achterafkans veel meer wegen dan de cor-thorax ratio of thoraxomvang-buikomvang ratio sec. Toch is bij patiëntenbesprekingen het belang dat aan de thoraxomvang-buikomvang ratio gehecht wordt groter dan aan de andere factoren. Een poging de kans op longhypoplasie te kwantificeren op basis van de beschikbare informatie wordt al helemaal niet Medisch Journaal, jaargang 33, no. 2 ondernomen, zeker ook omdat geschikte predictiemodellen voor deze diagnose ontbreken. De bovenstaande twee voorbeelden van de screening voor syndroom van Down en antenatale kansschatting voor de aanwezigheid van longhypoplasie laten zien dat in de hedendaagse geneeskunde op twee manieren met kansen wordt omgegaan. Bij screening voor het syndroom van Down wordt de kans met behulp van rekenmodellen formeel geschat aan de hand van de leeftijd van de vrouw en de testuitslagen. Bij de predictie van longhypoplasie wordt echter geen gebruik maakt van zulke rekenmodellen, en wordt het beleid bepaald op basis van de inschatting die de arts maakt op basis van persoonlijke expertise. Dit contrast heeft geleid tot een onderzoeksvoorstel getiteld: ‘Use of probabilistic diagnosis in Obstetrics and Gynecology’. In dit voorstel, inmiddels gehonoreerd in de VIDI-ronde van het NWO subsidieprogramma ‘VENI, VIDI, VICI’, wordt gekeken of in een diagnostisch proces met gebruik van kansschattingen diagnostische winst is te boeken ten opzichte van een klassiek diagnostisch proces, waarbij een testuitslag als een opzichzelfstaand resultaat wordt geïnterpreteerd met gebruikmaking van vaste afkapwaarden voor de definitie van een normale en een abnormale test. Indien blijkt dat gebruik van kansschattingen inderdaad tot diagnostische winst kan leiden -en dus gezondheidswinst en meer optimale zorg- is het vervolgens de vraag op welke wijze artsen die kans met de patiënt dienen te communiceren. Artsen moeten zich afvragen of de patiënt met deze kans om kan gaan, of dat een absoluut advies de voorkeur heeft8. Aan de hand van een viertal voorbeelden uit de verloskunde en gynaecologie, te weten endometriumdikte voor het uitsluiten van endometriumcarcinoom bij postmenopauzaal bloedverlies, de chlamydia antistoftiter bij de kansschatting op tubapathologie bij kinderwens, het serum ß-hCG voor de diagnostiek van een EUG en de screening voor diabetes gravida- Medisch Journaal, jaargang 33, no. 2 rum zal deze problematiek verder worden uitgewerkt. Het voorgestelde onderzoek betreft de ontwikkeling, evaluatie en implementatie van probabilistische in plaats van de traditionele deterministische beslisregels. Voor de genoemde diagnostische problemen wordt een probabilistisch diagnostisch model ontwikkeld gebaseerd op klinische data. Behalve naar klinische (gezondheids) uitkomsten zal ook gekeken worden naar praktische aspecten van implementatie van probabilistische beslisregels (computerprogramma’s) en acceptatie van deze werkwijze door patiënten en artsen. Het theoretisch gedeelte van dit onderzoek zal uitgevoerd worden op de afdeling Klinische Epidemiologie van het Academisch Medisch Centrum te Amsterdam. Het klinisch-praktische gedeelte zal uitgevoerd worden in een zestal ziekenhuizen, waaronder Máxima Medisch Centrum. Literatuur 1. Richtlijn postmenopauzaal bloedverlies. NVOG 2003. 2. Van Doorn HC, Dijkhuizen FPHLJ, Kruitwagen R, Heintz APM, Kooi GS, Mol BWJ. Transvaginal sonography is less accurate in women with postmenopausal bleeding in the presence of diabetes and obesity. Obstet Gynaecol. In press. 3. Standpunt serumscreening naar Neuraal buis defect en Downsyndroom. NVOG. Februari 1997 (http://www.nvog.nl/files/06_ serumscr_neuraal_def_down.pdf 4. Feinstein AR. The architecture of clinical research. WB Saunders company. Philadelphia, 1985. 5. Standpunt nuchal translucency. NVOG. Januari 2000. (http:// www.nvog.nl/files/10_nuchal_translucency.pdf) 6. Yoshimura S, Masuzaki H, Gotoh H, Fukuda H, Ishimaru T. Ultrasonographic prediction of lethal pulmonary hypoplasia: comparison of eight different ultrasonographic parameters. Am J Obstet Gynecol. 1996;175:477-483. 7. Vergani P, Ghidini A, Locatelli A, Cavallone M, Ciarla I, Cappellini A, Lapinski RH. Risk factors for pulmonary hypoplasia in second-trimester premature rupture of membranes. Am J Obstet Gynecol. 1994;170:1359-1364. 8. Opmeer BC, de Borgie CAJM, Bossuyt PMM Treatment tradeoffs & preferences: final report HTA methodology; Health Care Efficiency Research Programme ZonMw; grant 945-10-016. 70