Samenvatting Moleculaire biologie: Chapter 12: Transcription activators in Eukaryotes 1 Categories of activators Activators kunnen zowel de transcritptie stimuleren als inhiberen (eerder inhibitor genoemd dan activator. Ze functioneren echter op eenzelfde moleculair mechanisme). Het zijn polypeptiden met minimaal twee functionele domeinen: een DNA bindend domein en een transcriptie activerend (of inhiberend) domein. Velen hebben ook een dimerisatie domein, dat de polypeptiden toelaat om homodimeren, heterodimeren of multimeren te vormen. Sommige hebben zelfs domeinen waarop effectors zoals hormonen kunnen binden. 1.1 DNA bindend domein Een proteïne domein is een onafhankelijk gevouwen regio van een proteïne, dat een specifieke functie uitoefent. Elk DNA bindend domein heeft een DNA bindend motief, wat het gedeelte van het domein is dat een karakteristieke vorm heeft voor de binding van DNA. De meeste DNA bindende motieven behoren tot volgende klassen: Zink bevattende modules. Op zijn minst drie zink bevattende modules kunnen optreden als een DNA bindend motief. Zij gebruiken allen één of meerdere zink ionen om de juiste vormt te creëren. Hierdoor wordt er een α helix gevormd in het motief die past in de grote groeve van het DNA. Deze zink bevattende modules zijn onder andere de zink vingers. Homeodomeinen (HD). Deze bestaan uit ongeveer 60 AZ en vormen zo een vergelijkbare structuur als de prokaryote helix turn helix DNA bindende domeinen van prokaryoten zoals in het λ faag repressor proteïne. bZIP en bHLH motieven. 1.2 Transcriptie activatie domeinen. De meeste activators hebben één activatiedomein, sommige hebben er echter meer dan één. De meeste van deze domeinen kunnen geclassificeerde worden in onderstaande groepen: Zure domeinen: Deze komt bijvoorbeeld voor in een activator van gist (GAL4) Glutamine rijke domeinen: Sp1 Proline rijke domeinen CTF De beschrijvingen van de transcriptie activerende domeinen zijn vaag, daar de domeinen zelf zeer slecht afgelijnd zijn in de proteïnen. Het zure domein bijvoorbeeld lijkt niets anders nodig te hebben dan een proportioneel grote aanwezigheid van zure AZ resdu’s om te kunnen functioneren. Dit leidde tot de naam “acidic blob” om deze waarschijnlijk ongestructureerd domein aan te duiden. Uit onderzoek blijkt dat het zure activatie domein van GAL4 een gedefinieerde structuur vormt in zure omstandigheden (β-vouwblad). Het is mogelijk dat dit vouwblad ook gevormd wordt in de licht basische omstandigheden in levende cellen, maar dit is op dit moment nog niet geweten. De structuur van het domein is niet het enige wat onduidelijk is, ook het belang van het zure karakter van het domein is nog een raadsel. Met zoveel onduidelijkheden is het op dit moment niet mogelijk om conclusies te trekken van hoe de structuur en de functie van het domein met elkaar gerelateerd zijn. 1 2 Structures of the DNA binding motifs of activators In tegenstelling tot de transcriptie activerende domeinen hebben de DNA bindende domeinen, wel goed gedefinieerde structuren. Met behulp van X-stralen kristallografie heeft men kunnen achterhalen hoe deze domeinen interageren met het DNA. Deze kristallografische studies hebben verder ook kunnen aantonen welke domeinen verantwoordelijk zijn voor de dimerisatie. Deze domeinen zijn vaak van cruciaal belang, daar de meeste transcriptie activators niet werkzaam zijn in een monomere vorm. 2.1 Zinc Fingers In 1985 vond Aaron Klug een periodiciteit in de algemene transcriptiefactor TFIIIA. Dit proteïne heeft een repeat van een element dat is opgebeouwd uit 30 AZ residu’s. Elk element bevat twee cysteïnes, die dicht in elkaars buurt staan, gevolgd, na 12 AZ, door dicht bij elkaar zittende histidines. Het proteïen is rijk aan zink. Zink is in zo’n concentratie aanwezig, dat er één ion per repeat kan voorkomen. Hieruit werd geconcludeerd dat de zink ionen gecomplexeerd werden door de twee cysteïnes en histidines, die voorkomen in de repeat. Deze complexatie zorgt voor de vorming van een vingervormig domein. Zink vingers zijn opgebouwd uit een anti-parallel β-vouwblad, gevolgd door een α-helix. Het βvouwblad bevat twee cysteïnes, en de α-helix twee histidines, die samen een gecoördineerde binding vormen met een Zinc-ion. De coördinatie van het zink-ion helpt bij de vorming van de vingervormige structuur. De zink vinger interageert met de grote groeve van het DNA. 2 2.2 The GAL 4 protein Het GAL 4 proteïne is een activator in gist, dat de expressie van genen controleert die instaan voor het metabolisme van galactose. Elk van deze genen die reageert op de aanwezigheid van van GAL4 hebben een sequentie die erdoor herkend kan worden (enhancer), die upstream van de startplaats gelegen is. Deze sequenties worden upstream activating sequences genoemd. GAL4 zal aan deze sequenties binden als een dimeer.Het DNA bindend motief is gelegen in de eerste 40 AZ van het proteïne; de dimerisatie site is gevonden in de residu’s 50-94. Het DNA bindend domein is vergelijkbaar met de zink vingers in het feit dat het ook zink-ionen en cysteïne residus bevat. De structuur is echter zeer verschillend: elk motief heeft 6 cysteïnes en bevatten geen histidines. De verhouding zink ionen tot het aantal cysteïnes bedraagt 1:3. The DNA binding motif Onderstaande figuur geeft de structuur van het GAL4 dimeer DNA complex weer. Elk monomeer bevat een domein dat in staat is om DNA te binden, waarin de cysteïne residu’s 2 zinkionencomplexeren. Door complexatie wordt wordt een bimetaal thiolaat cluster gevormd. Deze 3 motieven kunnen een α helix vormen die specifieke interacties met het DNA kan aangaan. Het andere uiteinde van het monomeer dient voor de dimerisatie. The dimerisation motif GAL4 monomeren maken ook gebruik van α helices om dimeren te vormen; Deze helices vormen een parallelle gespilaliseerde spiraal (coiled coil), zoals weergegeven in bovenstaande figuur B en C. De dimerisatie van de α helices treedt op ter hoogte van de kleine groef van het DNA. De DNA bindings site en de dimerisatie site van beide monomeren worden met elkaar verbonden door een linker sequentie. 2.3 The nuclear receptors Een derde klasse van zink modules is aanwezig in nucleaire receptoren. Deze proteïnen interageren met verschillende endocriene signaal moleculen, zoals hormonen, die door de cel membraan diffunderen. Hierdoor worden hormoon- receptor complexen gevormd die functioneren als activators door te binden aan enhancers, in dit geval ook wel hormoon respons elementen genoemd. Door binding wordt de transcriptie van het met de enhancer geassocieerde gen gestimuleerd. Deze activators verschillen van de voorgaande door het feit dat ze eerst een effector (een hormoon) moeten binden om te kunnen optreden als activator. Dit impliceert dat zij een extra domein nodig hebben, die het hormoon kan binden (= hormoon bindend domein). De nucleaire receptoren worden traditioneel onderverdeeld in 3 klassen. De type I (GR) receptoren worden gekenmerkt door een glucocorticoid receptor. In afwezigheid van hun ligand, zijn deze receptoren aanwezig in het cytoplasma, waar ze gekoppeld zijn aan andere proteïnen. Als een type I receptor bind met zijn ligand, zal het loskomen van het andere proteïne en naar de kern migreren, waar het als homodimeer zal binden op zijn hormoon respons element. Een voorbeeld van een proteïne waar type I receptoren aan gebonden kunnen zijn is Heat shock proteïne 90 (Hsp 90). De enhancers waarop deze receptoren binden worden glucocorticoid respons elementen genoemd. 4 Type II receptoren zijn steeds in de nucelus aanwezig, waar ze dimeren vormen met een ander proteïne dat retinoic acid receptor X (RXR) genoemd wordt. Deze receptoren binden zowel in aan- als afwezigheid van hun ligand. Indien deze binden in afwezigheid van hun ligand zal dit lijden tot repressie van de transcriptie. In aanwezigheid van het ligand zal de transcriptie gestimuleerd worden. Dus hetzelfde proteïne kan optreden als een activator of als repressor, afhankelijk van de omgevingsomstandigheden. Type III receptoren zijn nog niet voldoende bestudeerd om ze volledig te begrijpen. Ze zijn ook bekend als “orphan (wees)” receptoren omdat hun ligand nog niet geïdentificeerd werd. Mogelijk toont verder onderzoek aan dat receptoren die in deze klasse zijn ingedeeld behoren tot klasse I of II. De DNA bindende domeinen van de drie klassen bevatten 2 zink ionen die elk een coördinatieve binding aangaan met 4 cysteïne residu’s. Het DNA bindend motief is een α helix. De nucleaire receptoren interageren met het DNA als dimeer. Hierbij zal slechts één DNA bindend domein interageren met de enhancer. 2.4 Homeodomains Homeodomeinen zijn DNA bindende domeinen die voorkomen in een grote groep van activators. De naam van deze domeinen is afkomstig van het gen, homeoboxen, waarop ze gecodeerd zijn. Homeoboxen werden voor het eerst ontdekt in regulatorische genen van Drosophila, die homeotische genen werden genoemd. Indien er mutaties in deze genen optreden, lijdt dit tot vreemde transformaties van de lichaamsdelen in de fruitvlieg. Bijvoorbeeld een mutatie gekend onder de naam antennapedia zorgt ervoor dat er poten groeien op de plaats waar normaalgezien de antennes aanwezig moeten zijn. 5 Homeodomein proteïnen hebben een helix-turn-helix motief in hun DNA bindend domein. Elk homeodomein bestaat uit 3 α helices, waarvan de tweede en de derde het helix-turn-helix motief vormen. De derde α-helix zal instaan voor de herkenning van van het DNA. De meeste homeodoeminen hebben nog een ander DNA herkennen motief: de N-terminus die een arm vormt. Deze arm kan zich nestelen in de kleine groeve van het DNA. Onderstaande figuur geeft de interactie van homoeodomeinen met DNA weer. 2.5 The bZIP and bHLH domains bZIP en bLH domeinen combineren twee functies: DNA binding en dimerisatie. ZIP en HLH in de namen van de domeinen refereert naar Leucine zipper en Helix-loop-helix gedeelten van de respectievelijke domeinen. Deze motieven staan in voor de dimerisatie van de proteïnen. De b in de namen refereert naar een basische regio die instaat voor de binding van het DNA. Het bZIP domein bestaat uit twee polypeptide ketens, die elk de helft van de zipper vormen. Deze ketens zijn α helices die leucine residu’s bevatten. De verschillende leucine residu’s worden van elkaar gescheiden door 7 AZ. Dit lijdt ertoe dat elk leucine residu kan interageren met het DNA. De ruimte tussen de verschillende basische aminozuren zorgt ervoor dat er interactie met een tweede monomeer kan ondergaan worden. De beide helices gedragen zich zo als twee helften van een ritssluiting. Leucine zippers herkennen het DNA in de grote groeve. (zipper). In onderstaande figuur staat de leucine zipper weergegeven . 6 De structuur van het bHLH domeins is zeer gelijkaardig aan deze van het bZIP domein. Het helixloop-helix motief staat in voor de dimerisatie. De langste helix (Helix 1) bevat de basische regio waarmee het domein zal interageren met het DNA. Deze interactie zal ook plaatsgrijpen in de grote groeve van het DNA. Er zijn activators die beide domeinen bevatten (bHLH-ZIP domeinen). Deze interageren op een zeer gelijkaardige manier met het DNA als bHLH domeinen. Het grootste verschil is dat het bHLH-ZIP domein gebruik kan maken van de leucine zipper om dimerisatie te verzekeren. 3 Independence of the domains of activators De domeinen in transcriptie activators zijn fysiek van elkaar gescheiden op de proteïnen, ze vouwen zich onafhankelijk van elkaar om zo verschillende driedimensionale structuren te vormen. De onafhankelijkheid van de verschillende domeinen werd aangetoond door Brent en Ptashne door de vorming van een chimere constructie die opgebouwd was uit een DNA bindend domien van één proteïne en het activerende domein van een ander. Volgende proteïnen werden egebruikt: GAL4 en LexA. De DNA bindingsdomeinen en de activatiedomeinen van GAL4 zijn al eerder besproken. LexA is een prokaryote repressor, die bind op de laxA operator en zo de downstream gelegen genen represseert in E.coli. Normaalgezien heeft dit proteïne geen activatiedomein, daar dit niet de functie van het proteïne is. Door recombinatie van delen van de genen van beide proteïnen creëerden Brent en Ptashne een chimeer ge, dat een hybride proteïne zal coderen. Om de activiteit van het chimere proteïne te kunnen meten, werden twee plasmiden in gistcellen ingebracht. Het erste plasmide bevatte 7 het chimere gen en het tweede bevatte een promotor die gevoelig is voor activatie door GAL4. Deze promotor werd gekoppeld aan het E.coli β-galactosidase gen (=reporter gen, om de transcriptie vanaf de GAL4 gevoelige promotor te kunnen meten). No een extra elment is nodig voor deze aasay, namelijk een bindingsplaats voor het chimere proteïne. GAL4 herkend een upstream enhancer UASG. Deze zal niet worden herkend door het chimere construct, daar het DNA bindend domein afkomstig is van LexA. Om de GAL1 promotor gevoelig te maken voor activatie, werd de laxA operator ingebouwd. De vraag is nu of het chimere construct de genexpressie kon activeren. Hierop is het antwoord ja, zoals in onderstaande figuur wordt geïllustreerd. Drie plasmiden met het β-galactosidase gen werden gebruikt. 1 ervan bevatte UASG, de tweede de lexA operator en de derde bevatte geen herkenningssequentie. De gebruikte activator was ofwel LexA-GAL4 of LexA (negatieve controle). Als het UAGS element aanwezig is, dan werd steeds een grote hoeveelheid transcriptie waargenomen, onafhankelijk van welke activator werd toegevegd. De verklaring hiervoor is dat gistcellen het gen in hun genoom aanwezig hebben om GAL4 aan te maken, en zo de transcriptie kan activeren via UASG. Als er geen herkenningsplaats aanwezig is, werd er geen β-galactosidase aangemaakt. Als de laxA operator aanwezig is, kon het chimere LexA-GAL4 de β-galactosidase productie activeren met een 500-voud. Hiermee is aangetoond dat het DNA bindend domein van GAL4 kan vervangen worden door een DNA bindend domein van een niet gerelateerd proteïne en toch nog steeds een functionele activator bekomen. Dit toont aan dat de DNA bindende en transcriptie activerende domeinen redelijk onafhankelijk van elkaar kunnen werken. 4 Function of activators In bacteriën is het core RNA polymerase niet in staat om transcriptie van enige betekenis te initiëren. Het RNA holoënzym echter kan wel een basale hoeveelheid transcriptie katalyseren. Basale hoeveelheden zijn vaak onvoldoende voor zwakke promotors. Om dit probleem op te lossen hebben cellen activators om de transcriptiegraad te verhogen. Het proces dat ervoor zorgt dat deze verhoging optreed is recrutering. 8 Eukaryote activators rekruteren ook het RNA polymerase naar de promotors. Dit gebeurd echter niet via een zo directe weg als bij de prokaryoten. De eukaryoten stimuleren de binding van algemene transcriptiefactoren en RNA polymerase op de promotor. Onderstaande figuur geeft de twee hypothesen weer die voor eukaryote rekrutering gelden. In de eerste hypothese (figuur a) zullende de algemene transcriptiefactoren één na een binden op het RNA polymerase om zo een pre-initiatiecomplex ter vormen. In de tweede hypothese (figuur b) zijn de algemene transcriptiefactoren en a de andere proteïnen al gebonden op het RNA polymerase in een complex dat het RNA polymerase II holoënzym genoemd wordt. De factoren en het polymerase worden als één complex naar de promotor gerekruteerd. 5 Interaction among activators 5.1 Dimerisation Dimerisatie is een groot voordeel voor een activator, daar het zorgt voor een verhoogde affiniteit tussen de activator en de DNA herkenningssequentie. Sommige activators zullen een homodimeren vormen, terwijl andere heterodimeren vormen. 5.2 Action at a distance Activators gebonden op enhancers interageren met de algemene transcriptie-factoren en het RNA polymerase dat gebonden is op de promotor. Deze interactie zal gepaard gaan met de vorming van een 9 lus in het tussengelegen DNA. Door de vorming van de lus komen transcriptie-activator en de promotor in elkaars buurt, zodat de transcriptie gestimuleerd kan worden. 5.3 Architectural trancription factors Voor de activatie van genen zijn soms meerde activators vereist. De binding van één activator aan een enhancer, zal de binding van andere transcripti-activators induceren. Na binding van de verschillende activators zullen zij samen zorgen voor de interactie met de opde promotor gebonden proteïnen, om zo de transcriptie te stimuleren. 5.4 Enhanceosomes Een enhanceosome is een nucleoproteïne complex, dat is opgebouwd uit verschillende transcriptie activators, gebonden aan de enhancer en dit op zo’n manier dat ze de transcriptie kunnen stimuleren. Het typevoorbeeld voor dit concept is het IFN-β enhanceosome. Deze structuur is opgebouwd uit acht verschillende proteïnen, die coöperatief worden gebonden aan een enhancer van 55 bp. 10 5.5 Transcription factories De aanwezigheid van DNA lussen is niet in tegenspraak met het concept van transcription factories. Dit zijn plaatsen in de kern waarde transcriptie van verschillende genen zal plaatsgrijpen. Als er twee of meer actieve genen op hetzelfde chromosoom zijn geclusterd in dezelfde transcriptie factory, zal dit lijden tot de vorming van lussen. Dus het bestaan van transcition factories impliceert het bestaan van DNA lussen. In de jaren 1990, leverde verschillende onderzoeksgroepen bewijs voor het bestaan van transcription factories. Hierbij rezen onmiddellijk de volgende vragen: (1) hoeveel transcription factories zijn er aanwezig in een kern en (2) hoeveel polymerasen komen er in een transcription factory voor. Om het aantal transcription factories te tellen voerde Cook et al in 1998 volgend experiment uit. De aangroeiende RNA keten in HeLa cellen werd gelabeld met bromouridine (BrU). De BrU labeling werd gedetecteerd door de cellen permeabel te maken en de ketens in vitro verder te labelen met biotine-CTP. Het gelabeld RNA werd gedetecteerd met primaire AL tegen BrU of biotine, en secundaire AL die gelabeld zijn met goud partikkels. Onderstaande figuur geeft hier de resultaten van weer. Hierop is te zien dat de transcriptie op specifieke plaatsen in de nucleus plaatsgrijpt en niet uniform verspreid over de gehele kern. In dit onderzoek werd ook aangetoonddat er gemiddeld 14 RNA polymerasen per fabriek voorkomen. De vraag die men zich ook stelt is of het RNA polymerase over het template beweegt, of dat het DNA zich voortbeweegt door het RNA polymerase. Rescente data tonen aan dat het waarschijnlijk is het RNA polymerase zich niet voortbeweegt. Deze aanwijzingen zijn tot stand gekomen door gebruik te maken van de techniek Chromosome capture conformation (3C). Het principe van deze techniek is weergegeven in onderstaande figuur: a. Neem chroamtine, waarvan wordt verwacht dat er inderacties in plaatsgrijpen tussen twee DNA bindende proteïnen. De Chromosoomsegmenten kunnen zowel gelegen zijn op hetzelfde als op twee verschillende chromosomen. De twe segmenten worden aan elkaar gecroslinked met behulp van formaldehyde. 11 b. c. d. e. Het chormatine wordt in een volgende stap ontdaan van zijn proteïnen. Het DNA wordt behandeld met een restrictie-enzym (pijlen geven de RE herkenningssite aan). Voer een ligatie uit onder zulke condities dat intramoleculaire ligatie wordt bevoordeeld. Voer een PCR reactie uit op het 3C template. Als er een significante hoeveelheid PCR product wordt aangemaakt, toont dit aan dat de chromosoom segmenten, die worden geamplificeerd door de primers waarschijnlijk dicht in elkaars buurt zitten in het chromatine. Onderstaande figuur geeft weer hoe deze techniek is toegepast voor het aantonen dat de RNA polymerasen niet bewegen: Uit deze resultaten werd volgend model voor de regulatie van de transcriptie voorgesteld: 12 6 Regulation of transcription factors Regulatie van de transcriptie activators kan op verschillende manieren gebeuren: Door interactie met een ligand (zoals bij de nucleaire receptoren): verschillende activatoren waaronder de nucelaire receptoren, worden pas geactiveerd van zodra er een ligand op bind. Door posttranslationele modificaties: o Fosforylatie van activators zorgt ervoor dat zij kunnen interageren met een coactivator (mediator/ CBP/P300), dat op zijn beurt de transcriptie zal stimuleren. o Ubiquinilatie zorgt ervoor dat de activators herkend wordt door proteolytische enzymen. Ubiquinilatie merkt de activators dus voor afbraak. o Sumoylatie van transcriptiefactoren zorgt ervoor dat deze worden getransporteerd naar compartimenten van de nucleus. o Methylatie en acetylatie regelt de activiteit. 13 6.1 Signal Transduction pathways 14