Commentaren De ontrafeling van het humane genoom: een mijlpaal, geen eindstreep n.j.leschot en m.m.a.m.mannens Dat de tijd nadert waarop de totale basenvolgorde van het menselijk DNA bekend zal zijn, kan haast geen krantenlezer zijn ontgaan. Genetici lijken er bijna een sport van te maken om hun voorspelling over het verwachte tijdstip steeds vaker naar beneden bij te stellen. Recente schattingen komen uit op 2002, terwijl 90% van de kaart reeds in 2000 klaar zou zijn.1 En als het zover is, wat dan? Wat verandert er dan? Wat zijn de directe gevolgen voor de geneeskunde? achtergrond Het DNA ligt bij de mens in de celkernen gerangschikt in 46 chromosomen: 22 paar autosomen en één paar geslachtschromosomen (XX of XY). Het haploïde (enkelvoudige) aantal chromosomen bij de mens bedraagt 23, terwijl het bij het in kaart brengen gaat om in totaal 24 verschillende chromosomen. De genetische code van het menselijk DNA ligt vast in de volgorde van ongeveer 3.000.000.000 basen per haploïd genoom. Het gaat om slechts 4 verschillende basen. Die worden meestal alleen met hun beginletter aangegeven: A(denine), G(uanine), C(ytosine) en T(hymidine). Als men de genetische code achter elkaar zou willen printen in het lettertype en de lay-out van dit tijdschrift, zou men 267 jaargangen kunnen vullen met alleen A’s, G’s, C’s en T’s. Geschat wordt dat slechts 3% van het totale DNA gebruikt wordt voor de codering van zo’n 100.000 structurele genen, die weer coderen voor zo’n 200.000-300.000 eiwitten. Tegen deze achtergrond is het niet vreemd dat er veel discussie is geweest over de te volgen strategie voor het in kaart brengen van het DNA. De keuze daarbij was óf de volgorde van het totale DNA te bepalen óf alleen de coderende genen in kaart te brengen. Uiteindelijk is gekozen voor de eerste optie. Begin 1999 waren ongeveer 16.000 genen geïdentificeerd. Van ongeveer 10% weten wij inmiddels dat het gen met een ziektebeeld samenhangt. Slechts 650 van deze genen zijn daadwerkelijk gekloneerd. Voor de meeste bekende genen geldt overigens dat men weet voor welk eiwit het betreffende gen codeert. Voor ongeveer 90% van de aandoeningen waarvoor het gen bekend is, weten wij welke mutaties zoal in het gen kunnen voorkomen, wat het functionele effect daarvan is op het betreffende eiwit en soms wat dat voor het fenotype betekent (http://www3. ncbi.nlm.nih.gov/omim/searchomim.html). Academisch Medisch Centrum/Universiteit van Amsterdam, afd. Klinische Genetica, Postbus 22.660, 1100 DD Amsterdam. Prof.dr.N.J.Leschot, klinisch geneticus; dr.M.M.A.M.Mannens, moleculair geneticus. Correspondentieadres: prof.dr.N.J.Leschot ([email protected]). Voor de volledigheid wordt hier nog vermeld dat naast het DNA in de celkern ook nog DNA in de mitochondriën voorkomt. Dit zogeheten mitochondriële DNA is al geheel in kaart gebracht. Het gaat om 37 coderende genen.2 Een specifieke categorie ziektebeelden wordt veroorzaakt door mutaties in dit mitochondriële DNA. Deze aandoeningen erven alleen via de moeder over. de huidige situatie Erfelijke ziekten. Wat betreft erfelijke ziekten zijn er op dit moment enorme verschillen in de mate waarin de genetische ontrafeling voor verschillende aandoeningen is gevorderd. Zo zijn er aandoeningen waarbij alleen uit het vóórkomen binnen families bekend is dat het om een autosomaal dominante erfmodus gaat. De plaats van het betrokken gen op één van de chromosomen, laat staan de structuur van het gen en de mutaties die daarin kunnen voorkomen, zijn nog niet bekend. Aan de andere kant is voor de (autosomaal recessief overervende) ziekte cystische fibrose inmiddels nauwkeurig bekend hoe het eiwit er uitziet en wat de meer dan 895 verschillende mutaties voor effect hebben op dat eiwit in de celmembraan (http://www.genet.sickkids.on.ca/cftr-cgi-bin/ FullTable). Voor adviesvragers en patiënten die gezien worden door de klinisch geneticus ontstaat vaak een moeilijke situatie als zij te horen krijgen dat er, ondanks de vaak optimistische berichten in de media over de vorderingen van de genetica, voor ‘hun’ ziekte helaas nog geen DNA-diagnostiek mogelijk is. Met het in kaart brengen van het totale DNA zullen nog vele ‘nieuwe’ genen ontdekt worden. Die kunnen worden herkend, omdat elk gen op een bepaalde manier is opgebouwd. Zo is bijvoorbeeld de promotor van een gen (een soort aan-/uitschakelaar) te herkennen aan een zogeheten TATA-box, terwijl het einde van een coderende sequentie wordt gemarkeerd door een zogeheten stopcodon. Het is goed om te bedenken dat wij hier spreken over genen waarvan wij in de normale situatie het eiwit niet kennen en waarvan wij dus ook niet weten wat voor gevolgen mutaties in dat gen zullen hebben. Wij hebben dus op dit moment te maken met de situatie dat wij voor monogene aandoeningen drie stadia van moleculaire ontrafeling kunnen onderscheiden: – Een volledig ‘gesequencet’ gen, waarin mutaties zijn beschreven die passen bij een bepaalde aandoening en die coderen voor een eiwit waarvan de normale functie bekend is én waarvan begrepen wordt waarom een bepaalde mutatie tot verlies of vermindering van die functie leidt. – Een DNA-sequentie die qua structuur een gen lijkt te Ned Tijdschr Geneeskd 2000 3 juni;144(23) 1093 zijn, terwijl het eiwit waar dat gen voor zou moeten coderen nog niet aangetoond is en/of waarvan de functie onbekend is en/of waarbij de aandoening die mogelijk het gevolg is van mutaties in het gen onbekend is. – Een duidelijk erfelijk bepaalde aandoening, waarvan het verantwoordelijke gen nog niet is geïdentificeerd. Een belangrijk punt voor de klinische praktijk is het verschijnsel van de soms sterk wisselende expressie van een bepaalde erfelijke aandoening tussen verschillende aangedane personen. Die kan zich zowel interfamiliaal als intrafamiliaal manifesteren. Voor de eerstgenoemde situatie kan het verschijnsel vaak worden verklaard, doordat het in verschillende families om verschillende mutaties in hetzelfde gen gaat. Voor intrafamiliale verschillen in de expressie, waarbij dezelfde mutatie in het spel is, betekent het dat er ook andere (modificerende) genen betrokken moeten zijn, die mede van invloed zijn op het uiteindelijke fenotype. De ontrafeling van de moleculaire interactie tussen twee of meer genen is nog maar amper begonnen. Daarnaast is er nog de interactie tussen meerdere genen en eventuele exogene factoren die van invloed zijn op het fenotype. Ook dit gebied, dat de ‘multifactoriële erfelijkheid’ wordt genoemd, is moleculair gezien nog een praktisch braakliggend onderzoeksterrein. Genoomproject. Inmiddels is de internationale zoektocht naar de volgorde van het totale menselijk DNA niet meer zo’n eensgezinde onderneming als bij de start in 1987. De Amerikaan Craig Venter begon in het begin van de jaren negentig met een eigen onderneming, waarbij hij op grote schaal werkte met zogenaamde ‘expressed sequence tags’ (EST’s). Dat zijn kleine stukjes DNA die tot expressie komen en dus behoren tot een coderende (gen)sequentie. Het is niet zo dat deze stukjes DNA ‘in vivo’ afzonderlijk worden afgelezen. Binnen een aantal jaren had hij de grootste humane genenbank ter wereld. Op dit moment zijn EST’s beschikbaar voor de meeste genen. Er zijn meer EST’s bekend dan er genen vermoed worden. Welke EST-fragmenten afkomstig zijn van hetzelfde gen is echter grotendeels onbekend. Venter en anderen vroegen patent aan op een groot aantal DNA-sequenties. De discussie over de juridische, praktische en ethische aspecten van het patenteren van DNA-sequenties valt buiten het bestek van dit commentaar. Vermeld kan worden dat de president van de Verenigde Staten en de premier van het Verenigd Koninkrijk zich recentelijk hebben uitgesproken tegen het patenteren van genen. Desalniettemin heeft het US Patent Office al ruim 1500 patentaanvragen op DNAfragmenten toegekend. Dezelfde Venter zorgde enkele jaren geleden opnieuw voor een revolutie in het genoomproject door met een nieuw opgericht bedrijf Celera te kiezen voor een radicaal nieuwe methode om het genoom in korte tijd te beschrijven. In tegenstelling tot het internationale sequenceconsortium, koos Venter niet voor de methode waarbij gekloneerde DNA-fragmenten (‘P1 artificial chromosomes’ (PAC’s)) van ongeveer 100 kilobasen één voor één beschreven werden. Hierbij kan, omdat de plaats van deze PAC’s in het genoom bekend is, de ba1094 Ned Tijdschr Geneeskd 2000 3 juni;144(23) senvolgorde van een chromosoom aan de hand van deze fysische kaart exact bepaald worden. Venters aanpak bestond uit een willekeurige klonering van DNA-fragmenten, waarvan vervolgens de basenvolgorde bepaald wordt. Supercomputers zorgden ervoor dat de overlappende sequenties van deze fragmenten aan elkaar gekoppeld werden, waardoor de kaart van het genoom ontstaat. Deze methode werkt razendsnel, aangezien die volledig geautomatiseerd kan plaatsvinden en er geen fysische kaarten van DNA-fragmenten nodig zijn. Het nadeel van deze methode ligt in het feit dat hoogrepeterende DNA-fragmenten (dat wil zeggen fragmenten waarin bepaalde sequenties in veel kopieën aanwezig zijn) door de computer niet eenduidig aan een ander fragment gekoppeld kunnen worden, omdat de betreffende sequentie te vaak in het genoom voorkomt. De methode-Venter heeft zichzelf in het recentelijk afgeronde genoomproject van de fruitvlieg echter al bewezen.3 Het humane genoom is echter vele malen groter en bevat aanzienlijk meer repetitief DNA, zodat hier nog problemen kunnen ontstaan. Begin april 2000 kondigde Celera aan dat de eerste stap in het ontrafelen van het humane genoom, het beschrijven van de talloze kleine DNA-fragmenten, was voltooid. Het zal dus snel duidelijk worden of de computers in staat zullen zijn deze sequenties te koppelen. De opslag van de openbare en de niet-toegankelijke commerciële sequentiegegevens gebeurt in reusachtige databases. Steeds vaker zal in een poging om een kandidaatgen aan een aandoening te koppelen de computer een centrale rol spelen. Als men een kandidaatgen in handen denkt te hebben, is het gebruikelijk om in de verschillende databases na te gaan of de gevonden sequentie daarin misschien al aanwezig is. Dat kan vrij simpel door een deel van de sequentie in te voeren, waarna de computer kijkt of die sequentie al bekend is. Het is bijvoorbeeld mogelijk dat iemand anders dezelfde sequentie als zogenaamde anonieme sequentie heeft gedeponeerd, waarvan alleen de plaats op een bepaald chromosoom is vastgelegd. Dan kan vervolgens blijken dat die sequentie opeens aan een aandoening kan worden gekoppeld. wat betekent het als de totale basenvolgorde bekend zal zijn? Recentelijk werd de basenvolgorde van het allerkleinste chromosoom nummer 22 gepubliceerd.4 De gepubliceerde gegevens illustreren op een wat kleinere schaal de genoemde driedeling. Totaal werden op chromosoom 22 naast 247 bekende genen nog 150 gerelateerde genen beschreven (dat zijn genen die gedeeltelijke homologie vertonen met bekende genen bij de mens of lagere organismen), 148 nieuwe genen (waarvan het bijbehorende eiwit wel bekend is, maar waarbij nog niet bekend is welk gen codeert voor welk eiwit; deze genen worden ‘voorspelde genen’ genoemd) en 134 zogenaamde pseudo-genen (een pseudo-gen is een niet-functioneel gen dat (gedeeltelijke) homologie vertoont met een bekend functioneel gen bij de mens). Inmiddels was er al geruime tijd geleden een aantal aandoeningen (27) op chro- mosoom 22 gelokaliseerd, zoals vormen van kanker, schizofrenie, het kattenoogsyndroom, het velocardiofaciaal/DiGeorge-syndroom. Het laatstgenoemde syndroom behoort tot de zogenaamde microdeletiesyndromen. De moleculaire achtergrond was en is nog steeds niet opgehelderd. Daar heeft ook de publicatie van de totale sequentie van chromosoom 22 helaas (nog) niets aan kunnen veranderen. Dit illustreert eens temeer dat de DNA-legpuzzel de onderzoeker telkens voor nieuwe uitdagingen plaatst. Overigens blijkt dat de gepubliceerde sequentie van chromosoom 22 ook nog niet geheel compleet is: 11 kleine gebieden konden niet in kaart worden gebracht, door technische problemen. Het is de vraag of deze sequenties binnen afzienbare tijd nog ontrafeld zullen worden. Dit betekent dat, als wij de complete basenvolgorde van het menselijk DNA in handen zullen hebben, er nog een enorm aantal ‘voorspelde’ genen moet worden gekoppeld aan fysiologische en pathologische processen. Eiwitonderzoek. De bestudering van eiwitten gaat de komende tijd (weer) heel belangrijk worden. In Engelstalige artikelen spreekt men al over a ‘human proteome project’.5 De technologie voor het bestuderen van eiwitten is op dit moment veel minder ver ontwikkeld dan de genetische technologie. Daarom zal het nog vele jaren duren voordat het ‘proteome’, de karakterisering en functie van alle eiwitten die een organisme gedurende zijn/haar leven kan synthetiseren, bekend zal zijn. In het verlengde daarvan duiken termen op als ‘proteomics’, waarmee het onderzoek wordt bedoeld van alle eiwitten die tot expressie worden gebracht door het genoom gedurende het leven van een cel. De twee belangrijkste stappen in ‘proteomics’ zijn het scheiden van eiwitten in een monster van cellen of weefsels, gevolgd door de identificatie van de afzonderlijke eiwitten. De beste scheidingsmethode voor eiwitten op dit moment is de tweedimensionale gelelektroforese. Voor de identificatie worden de eiwitten eerst behandeld met proteasen, daarna worden de verkregen eiwitfragmenten geanalyseerd in de massaspectroscoop, in een proces dat ‘peptide mass fingerprinting’ wordt genoemd. RNA-expressieprofielen. Ook wordt inmiddels gesproken over ‘transcriptomics’, waarmee het genereren van ‘messenger-RNA’(mRNA)-expressieprofielen op een gegeven tijdstip wordt bedoeld. Het totaal van mRNA's dat kan worden afgelezen van het genoom van een cel wordt het transcriptoom genoemd. Bij het genereren van mRNA-expressieprofielen wordt gebruikgemaakt van geautomatiseerde analyse door middel van ‘microarrays’ (RNA-chip). Daarmee ziet men in één oogopslag welke genen op een bepaald moment ‘aanstaan’. De grootste uitdaging ligt in het bestuderen van de talloze eiwit-eiwit- en eiwit-DNA-interacties. Farmacogenomica. Abbott vergelijkt de huidige positie van eiwitwetenschappers met die van moleculair genetici in 1986, toen voor het eerst plannen werden gemaakt voor het humanegenoomproject.5 Het onderzoek naar de structuur en de functie van eiwitten is niet alleen voor de wetenschap een nieuwe uitdaging. Ook de farmaceutische industrie is natuurlijk geïnteresseerd in dit gebied. Het gebruikmaken van DNA-sequentie-informatie bij de ontwikkeling van nieuwe geneesmiddelen wordt inmiddels ‘farmacogenomics’ genoemd. Deze ontwikkeling staat zeer in de belangstelling, zeker nu het erop lijkt dat een doorbraak in de mogelijkheden voor gentherapie nog wel even op zich zal laten wachten. Farmacogenetica. In het verlengde hiervan is er opeens ook weer belangstelling voor farmacogenetica, een aantal jaren geleden al bijna vergeten stukje van de genetica. In de farmacogenetica staat de individuele variabiliteit van de reacties van mensen op lichaamsvreemde stoffen, waaronder geneesmiddelen, centraal. Het onderliggende mechanisme hiervoor bestaat uit kleine variaties (polymorfismen) in het DNA, die op zichzelf schijnbaar geen gevolgen hebben voor het individu. Deze variatie is ontstaan tijdens de meiotische deling, die voorafgaat aan de vorming van geslachtscellen, in eerdere generaties. Deze polymorfismen kunnen evenwel bijdragen aan de mate waarop iemand reageert op bijvoorbeeld medicatie of op een reeds aanwezige pathogene mutatie in een bepaald ziektegen. Voorbeelden van zulke DNA-veranderingen zijn ‘single nucleotide polymorphisms’. Deze zijn zeer frequent (circa 1 op 1000 basenparen). Omdat er jaarlijks veel mensen in ziekenhuizen belanden door overgevoeligheid voor geneesmiddelen, staan er hier grote belangen, ook financieel, op het spel. Verschillende patiënten reageren nu eenmaal vaak verschillend op dezelfde medicatie. Het ziet ernaar uit dat, naarmate de farmacogenetica meer gebruik kan maken van de resultaten van de ontrafeling van het DNA, het steeds vaker mogelijk zal worden om individuele reacties op bepaalde geneesmiddelen in de klinische praktijk vooraf te bepalen op grond van individuele DNA-profielen. slotbeschouwing Met het in kaart brengen van het totale menselijk DNA krijgt de moleculaire geneeskunde van de 21e eeuw een solide basis. Dat zal, zoals al is aangegeven, niet van de ene op de andere dag gebeuren. Wel staat ons een groot aantal revolutionaire doorbraken te wachten, waardoor wij zicht zullen krijgen op de pathogenese van veel, thans nog onbegrepen, ziekteprocessen. Er breekt een tijd aan waarin met de regelmaat van de klok onbegrepen medische symptomen plotseling op hun moleculaire plaats zullen vallen. Onderzoekers en artsen zullen moeite hebben om de ontwikkelingen, die in een ware stroomversnelling terecht zullen komen, bij te kunnen houden. Er staat ons een boeiende tijd te wachten. Therapeutische mogelijkheden. Een punt van zorg is echter de discrepantie die zal optreden tussen de sterk verbeterde mogelijkheden voor moleculaire diagnostiek en de therapie die noodgedwongen enige tijd achter de diagnostische feiten zal aanlopen. Waar het om prenatale diagnostiek gaat, kunnen aanstaande ouders, net als dat nu al het geval is, bij afwijkende bevindingen eventueel besluiten tot het afbreken van de zwangerschap. Wellicht zal er ook meer vraag komen naar preïmplantatiediagnostiek. De presymptomatische DNA-diagnostiek voor de later in het leven optredende aandoeningen Ned Tijdschr Geneeskd 2000 3 juni;144(23) 1095 gebeurt op dit moment in ons land in de 8 centra voor klinische genetica volgens een standaardprotocol. Daarin is ruim plaats voor het bespreken van alle psychosociale gevolgen van deze vorm van diagnostiek. Ook de eventuele consequenties voor directe familieleden komen daarbij ter sprake. Voor deze groep aandoeningen, bijvoorbeeld bepaalde vormen van dementie, waarvoor (nog) geen behandeling mogelijk is, blijft het ook in de nabije toekomst zaak om adviesvragers zorgvuldig te begeleiden bij de vraag ‘of zij het echt wel willen weten’. DNA-chips. Een ontwikkeling die in dit stuk nog niet ter sprake kwam, is de toepassing van zogenaamde DNA-chips. Daarmee is het mogelijk om in één test honderden mutaties tegelijk te onderzoeken.6 Zo is de DNA-diagnostiek bij familiaire borstkanker op dit moment onder andere gericht op het vinden van mutaties in het BRCA-1-gen. Dat is moleculair gezien een groot gen.7 Het kost in de gangbare praktijk, met de conventionele methoden van mutatieanalyse en het beschikbare budget, dan ook gemiddeld zo’n drie maanden voor een mutatie in het gen kan worden aangetoond of kan worden uitgesloten. Als in een bepaalde familie met erfelijke borstkanker een mutatie is vastgesteld, is het overigens technisch veel simpeler om bij familieleden dezelfde mutatie aan te tonen of uit te sluiten. Met een DNA-chip zou het onderzoek naar een nog onbekende mutatie in het BRCA-1-gen in enkele dagen kunnen worden afgerond. Dergelijke chips zijn nu nog niet commercieel verkrijgbaar, maar dat zal niet lang meer duren. De kosten ervan zijn echter hoog. De schaalvergroting waarmee mutatieanalyse dan mogelijk zal worden, zal wellicht ook betekenen dat dergelijke tests ook gemakkelijker een plaats krijgen in de diagnostiek. De toekomst zal leren of daarmee de zorgvuldigheid waarmee dergelijke diagnostiek thans wordt omgeven, niet op de tocht komt te staan. Pas op het moment dat ons genetisch materiaal ook gemakkelijker therapeutisch toegankelijk zal worden, zal veel van de zorg rond deze voorspellende diagnostiek tot het verleden kunnen gaan behoren. Bij het vinden van afwijkingen in het DNA heeft de dokter dan namelijk ook nog een therapeutische optie aan te bieden. Zoals het er nu naar uitziet, zal het moment waarop het totale menselijk DNA in kaart is gebracht niet een eindpunt markeren, maar veeleer het begin van een nieuw ‘eiwittijdperk’ inluiden. abstract The decoding of the human genome will be a milestone, not the end of the road. – The base sequence of the entire human DNA will be known within only a few years. So far, 16,000 of an expected total of 100,000 genes have been identified. Nowadays there are different stages of molecular unraveling: from fully sequenced genes, including mutations responsible for diseases, down to ‘predicted’ genes for which no corresponding protein is yet known. Moreover, the genes responsible for many monogenetic conditions have not yet been identified. The revolutionary approach of at random cloning and sequencing was shown to be successful in the recently published genome sequence of the fruit fly. The next landmark will be an overview of the characteristics and activity of every protein that this organism can synthesize. However, protein technology has developed less far than DNA-technology and will be subject of the next project. 1 2 3 4 5 6 7 literatuur Little P. The book of genes. Nature 1999;402:467-8. Attardi G. Animal mitochondrial DNA: an extreme example of genetic economy. Int Rev Cytol 1985;93:93-145. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, et al. The genome sequence of Drosophila melanogaster. Science 2000;287:2185-95. Dunham I, Shimizu N, Roe BA, Chissoe S, Hunt AR, Collins JE, et al. The DNA sequence of human chromosome 22. Nature 1999; 402:489-95. Abbott A. A post-genomic challenge: learning to read patterns of protein synthesis. Nature 1999;402:715-20. Lipshutz RJ, Fodor SPA, Gingeras TR, Lockhart DJ. High density synthetic oligonucleotide arrays. Nat Genet 1999;21(1 Suppl):20-4. Miki Y, Swensen J, Shattuck-Eidens D, Futreal PA, Harshman K, Tavtigian S, et al. A strong candidate for the breast and ovarian cancer susceptibility gene BRCA1. Science 1994;266:66-71. Aanvaard op 27 april 2000 Commentaren Bevolkingsonderzoek naar borstkanker: een tussenbalans p.j.van der maas In 1989 werd begonnen met de invoering van het landelijk bevolkingsonderzoek naar borstkanker. Bijna 10 jaar later was het hele landelijke netwerk voltooid en waren alle vrouwen uit de doelgroep tenminste eenmaal uitgenodigd. Van de oorspronkelijke doelgroep, vrouwen van 50 tot 70 jaar, geeft ongeveer 80% gevolg aan de uitnoErasmus Universiteit, Instituut Maatschappelijke Gezondheidszorg, Postbus 1738, 3000 DR Rotterdam. Prof.dr.P.J.van der Maas, arts-epidemioloog ([email protected]. eur.nl). 1096 Ned Tijdschr Geneeskd 2000 3 juni;144(23) Zie ook de artikelen op bl. 1099, 1119 en 1124. diging, een blijk van groot vertrouwen in het nut van deelname. Is dat vertrouwen gerechtvaardigd? Rechtvaardigt het resultaat de inzet van allen die het bevolkingsonderzoek mogelijk maken, van de bijna 4 miljoen vrouwen die inmiddels hebben deelgenomen en van de 63 miljoen gulden die het onderzoek op dit moment jaarlijks kost? Het is tijd om een balans op te maken. Niet