Cover Page The handle http://hdl.handle.net/1887/37763 holds various files of this Leiden University dissertation. Author: Boef, Anna Gunnel Christina Title: Obtaining causal estimates of therapeutic effects in observational studies : the usefulness and validity of physician’s preference as an instrumental variable Issue Date: 2016-02-10 Nederlandse samenvatting Nederlandse samenvatting Introductie Voor het beoordelen van een effect van een behandeling worden resultaten van een gerandomiseerde trial vaak als ideaal beschouwd. Gegevens uit gerandomiseerde trials zijn voor veel belangrijke vragen rondom medische behandelingen echter niet beschikbaar. Er is daarom dringend behoefte aan methoden waarbij de effecten van een behandeling op valide wijze geschat kunnen worden in observationele data. Een belangrijk probleem in observationeel onderzoek is dat patiëntkarakteristieken meewegen bij behandelingsbeslissingen: behandelde patiënten en niet-behandelde patiënten (of patiënten behandeld met A en patiënten behandeld met B) zijn daardoor niet vergelijkbaar. Anders geformuleerd, factoren (kenmerken van de patiënt) die zowel de behandelingsbeslissing als de uitkomst beïnvloeden zullen het effect van de behandeling vertekenen. Dit wordt confounding by indication genoemd. Gebruikelijke analysemethodes kunnen alleen corrigeren voor die kenmerken van de patiënt die gemeten zijn en nemen daarbij aan dat er geen verdere ongemeten factoren zijn die het effect nog vertekenen, wat veelal niet plausibel is. Een methode, afkomstig uit de econometrie, die in potentie zowel gemeten als ongemeten confounding kan omzeilen is de instrumentele variabele analyse. Deze methode zoekt een surrogaat voor de randomisatie; een factor die de behandeling mede bepaalt, maar niet op een andere manier dan via de behandeling geassocieerd is met de uitkomst. Voorbeelden zijn afstand tot een ziekenhuis met bepaalde behandelingsmogelijkheden, of behandelingsvoorkeur van ofwel het ziekenhuis, ofwel de arts. In formelere zin moet een instrumentele variabele (instrument) aan 3 hoofdaannames voldoen: 1) het instrument is geassocieerd met de behandeling; 2) het instrument heeft geen effect op de uitkomst, anders dan via de behandeling; 3) er zijn geen factoren die een effect hebben op zowel het instrument als op de uitkomst. Als aan deze aannames wordt voldaan is een associatie tussen het instrument en de uitkomst volledig toe te schrijven aan verschillen in de behandeling. Hiermee kan het oorzakelijke effect van de behandeling op de uitkomst geschat worden. Het doel van dit proefschrift was te onderzoeken hoe valide instrumentele variabele analyse is als methode om zowel beoogde effecten als bijwerkingen van een behandeling te bepalen, en voor welke vragen en in welke situaties deze analyse bruikbaar is. Voorschrijfvoorkeur als instrumentele variabele We hebben ons vooral gericht op het gebruik van ‘voorschrijfvoorkeur’ als instrumentele variabele. De keuze voor een behandeling door artsen wordt bepaald 181 Nederlandse samenvatting door zowel kenmerken van de patiënt als door een onderliggende voorkeur van de arts voor een bepaalde behandeling. Door verschillen in deze onderliggende voorkeur kan het zijn dat verschillende artsen verschillende behandelingskeuzes zouden maken voor dezelfde patiënt. Door verschillen in onderliggende voorkeur ontstaat dus variatie in behandeling die onafhankelijk is van patiëntkenmerken: ofwel, onderliggende behandelingsvoorkeur (of ‘voorschrijfvoorkeur’) kan fungeren als instrumentele variabele. Het concept ‘voorschrijfvoorkeur’ hebben we nader onderzocht in Hoofdstuk 2: bestaat er echt variatie in voorkeur voor behandeling, of komt de variatie in keuze voor behandeling tussen artsen door verschillen in hun patiëntenpopulatie? We bekeken gegevens uit een enquête onder huisartsen, waarin werd gevraagd of zij acht fictieve patiënten met subklinische hypothyreoïdie zouden behandelen met levothyroxine. We vonden aanzienlijke variatie in de keuze om patiënten al dan niet met levothyroxine te behandelen, waaruit we concluderen dat verschillen in voorschrijfvoorkeur bestaan. Om met een instrumentele variabele analyse een puntschatting te krijgen van het effect van de behandeling is naast de hierboven besproken 3 hoofdaannames nog een vierde aanname nodig. Er bestaan verschillende mogelijkheden voor deze vierde aanname, en voor elk van deze mogelijkheden is de interpretatie van het geschatte effect iets anders. In Hoofdstuk 2 concluderen we op basis van de voorschrijfpatronen uit de enquête dat voor voorschrijfvoorkeur de zgn. stochastische monotoniciteitsassumptie aannemelijk is (maar de strengere deterministische monotoniciteitsassumptie niet). De interpretatie van de effectschatting onder deze aanname is ingewikkeld: het is een gewogen gemiddelde van de effecten in bepaalde subgroepen van de studiepopulatie. Hoe sterker het instrument gerelateerd is aan de behandeling in de subgroep, hoe zwaarder het effect in die subgroep meeweegt. In welke situaties is instrumentele variabele analyse een geschikte analyse? In Hoofdstuk 3 werd instrumentele variabele analyse met voorschrijfvoorkeur als instrument toegepast in een studie met enkele honderden patiënten, een populatiegrootte die gebruikelijk is in epidemiologische studies. Schattingen van het effect van preoperatieve corticosteroïden op beademingsduur, verblijf op de intensive care en in het ziekenhuis, het optreden van infecties, boezemfibrilleren, hartfalen en delier bij patiënten die een hartoperatie ondergingen waren qua richting hetzelfde als effectschattingen uit een gerandomiseerde trial. De gevonden effecten waren echter veel groter, en de schattingen waren zo onnauwkeurig dat ze weinig informatief waren. Hieruit concluderen we dat de geringe precisie van instrumentele variabele analyse een grote beperking vormt voor de toepasbaarheid in studies met patiëntaantallen die voor gebruikelijke analyses groot genoeg zijn. 182 Nederlandse samenvatting Als er sprake is van ongemeten confounding zal een analyse waarbij alleen gecorrigeerd wordt voor gemeten confounding een systematisch vertekende schatting geven: er is sprake van bias. Als een instrumentele variabele beschikbaar is die aan de drie hoofdaannames voldoet dan zal de schatting uit de instrumentele variabele analyse niet systematisch vertekend zijn (enkele kanttekeningen hierbij laten we hier buiten beschouwing), maar deze schatting is veel onnauwkeuriger: de variantie is veel groter. Welke schatting gemiddeld dichter bij het ware effect zal zijn is een trade-off tussen de bias van de gebruikelijke analyse en de variantie van de instrumentele variabele analyse. In Hoofdstuk 4 hebben we in een simulatiestudie laten zien dat de richting waarin deze balans uitslaat in grote mate afhangt van de grootte van de studiepopulatie, en daarnaast van de sterkte van het instrument en de sterkte van de ongemeten confounding. We hebben een formule opgesteld waarmee kan worden berekend vanaf welke studiepopulatiegrootte de instrumentele variabele schatting gemiddeld minder ver afwijkt van het ware effect dan de gebruikelijke schatting. Dit geldt in het algemeen pas vanaf zeer grote aantallen . In Hoofdstuk 5 werd onderzocht of in observationele studies naar bijwerkingen instrumentele variabele analyse bruikbaar is als sensitiviteitsanalyse om te beoordelen of er sprake is van confounding. In een grote groep nieuwe gebruiksters van gecombineerde hormonale anticonceptiepillen hebben we het risico op diep veneuze trombose en longembolieën vergeleken tussen gebruikers van de tweede en derde generatiepil. In principe is dit een weinig voorspelbare bijwerking: we verwachtten daarom niet dat de soort pil die wordt voorgeschreven gerelateerd is aan het onderliggende risico op trombose van de patiënt (geen confounding). Als dit het geval is zou een instrumentele variabele analyse een zelfde schatting geven als een gebruikelijke analyse. Dit is ook wat we vonden: de schattingen uit beide soorten analyses suggereerden een hoger risico op trombose voor de derde generatiepil. Echter, zelfs in deze zeer grote studiepopulatie van enkele honderdduizenden vrouwen was de instrumentele variabele schatting onnauwkeurig, omdat trombose een zeldzame uitkomst is. Vanwege de overeenkomst tussen de resultaten van de verschillende analyses die rusten op verschillende aannames concluderen we dat de aanwezigheid van een aanzienlijke hoeveelheid confounding onwaarschijnlijk is. Het rapporteren van een instrumentele variabele analyse In Hoofdstuk 6 gaven we de aanbeveling om in een studie waarin een instrumentele variabele analyse wordt gedaan altijd eerst te laten zien wat de associatie is tussen de instrumentele variabele en de uitkomst (voordat de formele instrumentele variabele analyse wordt gedaan). Dit is belangrijk, omdat dit de associatie is die in een formele instrumentele variabele analyse wordt geëxtrapoleerd. Deze aanbeveling hebben 183 Nederlandse samenvatting we gedaan in reactie op een artikel waarin richtlijnen voor het rapporteren van een instrumentele variabele analyse waren opgesteld. Mendeliaanse randomisatie In de laatste twee hoofdstukken hebben we ons gericht op een andere vorm van instrumentele variabele analyse: mendeliaanse randomisatie. Hierbij worden genetische varianten als instrumentele variabele gebruikt om het effect van een blootstelling op een uitkomst te onderzoeken. Het idee is dat genetische varianten willekeurig overerven van ouders naar hun kinderen en dat deze varianten daarom over het algemeen niet gerelateerd zijn aan andere factoren die een effect hebben op de uitkomst (zoals leefstijlfactoren). Het effect op de uitkomst van deze genetische variatie in de blootstelling zou daarom niet vertekend moeten worden door deze andere factoren. In Hoofdstuk 7 hebben we d.m.v. een systematische review onderzocht wat voor aanpak in mendeliaanse randomisatie studies werd gebruikt. Hierbij werden drie hoofdcategorieën onderscheiden: 1) alleen onderzoeken van de associatie tussen het genetische instrument en de uitkomst; 2) een formele instrumentele variabele analyse met een genetisch instrument; 3) een vergelijking van de geobserveerde en de verwachte associatie tussen het genetische instrument en de uitkomst. Verder hebben we gevonden dat de hoofdaannames voor een instrumentele variabele, die ook gelden voor Mendeliaanse randomisatie, vaak onvoldoende besproken werden en dat de gebruikte statistische methoden vaak niet duidelijk gerapporteerd werden. Daarom hebben we een checklist opgesteld voor het rapporteren van mendeliaanse randomisatie studies. In Hoofdstuk 8 hebben we uitgelegd dat in mendeliaanse randomisatiestudies in oudere populaties (bijv. >80 jaar) sprake kan zijn van vertekening van het onderzochte effect door de selectie op leeftijd. De genetische variant die de instrumentele variabele is in een dergelijke studie, kan invloed hebben gehad op overleving tot 80 jaar. Andere factoren, zoals roken, zullen de overleving tot 80 jaar beïnvloed hebben. Hoewel op jonge leeftijd geen verband zal bestaan tussen de genetische variant en rookgedrag, kan dit verband er in een oudere populatie wel zijn: extreem geformuleerd zullen mensen die ondanks een ongunstige genetische variant de leeftijd van 80 jaar hebben bereikt waarschijnlijk niet roken. Als dit verband bestaat voldoet de genetische variant niet meer aan één van de onderliggende aannames van mendeliaanse randomisatie: aan de aanname dat het instrument niet gerelateerd is aan andere factoren die een effect hebben op de uitkomst wordt niet voldaan. 184 Nederlandse samenvatting Conclusies Een belangrijke conclusie van dit proefschrift is dat instrumentele variabele analyse alleen in zeer grote epidemiologische studies met aanzienlijke ongemeten confounding en een sterk verband tussen het instrument en de behandeling of blootstelling zinvol is als primaire analyse. Veel epidemiologische studies hebben een studiepopulatie van enkele honderden personen. In dit geval zal een schatting uit een instrumentele variabele analyse dusdanig onnauwkeurig zijn dat het weinig informatie geeft. Een instrumentele variabele analyse zal wellicht vaker geschikt zijn als sensitiviteitsanalyse, bijvoorbeeld om te beoordelen of er sprake is van confounding in studies naar bijwerkingen. Verder hebben we gevonden dat artsen verschillen in hun behandelingsvoorkeur voor eenzelfde patiënt, onafhankelijk van kenmerken van deze artsen en hun patiëntpopulaties. De stochastische monotoniciteitsassumptie lijkt een plausibele aanname om een puntschatting te verkrijgen, (als het behandelingseffect niet gelijk verondersteld kan worden). Een probleem hierbij is dat het geschatte effect uit een IV analyse moeilijk interpreteerbaar is. Tenslotte concluderen we dat door mendeliaanse randomisatiestudies als instrumentele variabele studies te beschouwen het rapporteren van mendeliaanse randomisatiestudies kan worden verbeterd, ook als geen formele instrumentele variabele analyse wordt verricht. 185