Samenvatting Moleculaire biologie: Introductie 1 Definitie van moleculaire biologie Moleculaire biologie is de stusie van de genstructuur en hun functie op moleculair niveau. 2 Chapter 2: The molecular structure of the genes 2.1 The molecular nature of the genes De onderzoeken die mogelijk de structuur van de genen kon blootleggen begon in 1869. Minchester isoleerde in dat jaar nucleï van witte bloedcellen. Hij ontdekte dat in de nucleï een niewe fosforbevattende verbinding aanwezig was. Hij noemde deze stof nucleïne. Nucleïne bestaat hoofdzakelijk uit chromatine, dat een complex is van DNA en chromosomale eiwitten. Tegen het einde van de negentiende eeuw, werden zowel DNA als RNA gescheiden van de proteïnen die hen bonden aan de cel, waardoor het mogelijk werd om verder chemische analyse te doen naar deze nucleïnezuren. Tgen 1930 was aangetoond dat RNA bestond uit een suiker (ribose), 4 basen en een fosfaatgroep en dat DNA een andere suiker (deoxyribose) bevatte. Voor de rest bestaat het ook uit 4 verschillende basen en een fosfaatgroep. 1 Griffith’s experiment Griffith legde de fundamenten voor de identificatie van DNA als het genetisch materiaal. Hiervoor transformeerde hij S.pneumoniae. Het wild type is een sferische cel die wordt omgeven door een slijmlaag, capsule genaamd. De cellen vormen gladde kolonies (S). Deze cellen zijn virulent, ze kunnen een dodelijke infectie veroorzaken als ze in muizen worden ingespoten. Van deze bacterie species bestaat een zekere mutant die niet virulent is. Als deze wordt opgekweekt, dan lijdt dit tot ruwe kolonies. De belangrijkste onrdekking van Griffith was, dat dode virulente stammen, de niet virulente stammen konden transformeren naar virulente stammen. Zowel de gedode virulente stammen als de avirulente stammen konden op zichzelf zorgen dat de muizen stierven. Samen waren ze echter dodelijk. Dit wil zeggen dat de avirulente stamen op een bepaalde manier het gen voor virulentie hebben opgenomen. Dit wil dus zeggen dat het transformerende agens in de gedode acteriën het gen zelf is, dat verantwoordelijk is voor virulentie. Het enigewat men niet wist was welk molecule het transformerende agens is. DNA: the transforming material Avery, MacLeod en McCarthy leverde het missende element, van wat het transformerende agens was. Zij voerde hiervoor eenzelfde transformatie test uit als Griffith. Om na te gaan welke moleculen verantwoordelijk was voor de transformatie deden zij volgende zaken. Zij verwijderden de proteïnen via een extractie. Het mengsel kon nog steeds zorgen voor transformatie. Dan voerden zij verschillende enzymatische reacties uit. In een eerste reactie voegde zij chemotrypsine en trypsine toe om de overgebleven proteïnen te vernietigen. Het mengsel was nog steeds in staat om te transformeren. Hierna voegde zij ribonuclease toe, een enzym dat RNA afbreekt. Het mengsel zorgde nog steeds voor transformatie, wat RNA en de proteïnen uitsloot als transformerend agens. In laatste fase voegde zij deoxyribonuclease toe, dat DNA afbreekt. Vanaf dan kon het mengsel geen transformatie meer geven. Uit deze resultaten trokken zij de conclusie dat DNA de gentische code moest bevatten. De directe fysisch/chemische analyse ondersteunde de hypothese dat het gezuiverde transformerend agens DNA is. Volgende methoden gebruikte zij: Ultracentrifugatie: Dit gebruikte zij om de molecuaire massa te bepalen van het transformerend agens. Het transformerend agens sedimenteerde zeer snel, wat een hoge moleculaire massa suggereert, die typisch is vor DNA. 2 Electroforese: Zij plaatse het transformerend agens in een elektrisch veld om na te gaan hoe snel het hierin beweegt. De mobiliteit van het agens was relatief hoog, wat ook karakteristiek is voor DNA (heeft een m/z ratio). UV spectrometrie: Het absorptie spectrum van het transformerend agens komt overeen met dat van DNA. Elementaire chemische analyse: Dit leverde een N/P ratio van 1,67 op. Dit is dezelfde N/P ratio als die van DNA, dat rijk is aan fosfor en stikstof. Voor proteïnen is deze veel te laag, aangezien dit enkel rijk is aan stikstof. Zelfs een kleine contaminatie met proteïnen zou de N/P ratio hebben doen stijgen. Wanneer Watson en Crick het dubbele helix model in 1953 publiceerde, waren de meeste genetici het erover eens dat de genen waren opgebouwd uit DNA. Volgende bewijzen hebben er onder andere voor gezorgd dat dit werd geloofd. In 1950 toonde Chargaff aan dat de basen in het DNA niet in gelijke proporties voorkwamen, zoals eerder bewijs suggereerden, en dat de basecompositie verschilde van soort tot soort. Dit is iets wat men zou verwachten van genetisch materiaal. In 1952 leverde Hersley en Chase nog extra bewijs dat DNA het genetisch materiaal was. Dit deden ze met behulp van volgend experiment: Zij gebruikte de bacteriofaag T2 die E.coli infecteert. Gedurende de infectie worden de genen van het virus in de gastheer gebracht zodat deze het metabolisme van de cel kunnen overnemen. Een bacteriofaag is opgebouwd uit DNA en uit proteïnen. De vraag die nu reist is welk van beide dringt de cel binnen. Uit het onderzoek blijkt dat hoofdzakelijk het DNA de cel binnendringt. Natuurlijk was het bewijs niet ondubbelzinnig. Het hersley en Chase experiment werd uitgevoerd door het DNA te labelen met 32P (niet aanwezig in proteïnen) en 35S (niet aanwezig in DNA). Ze lieten het genetisch materiaal de cel indringen en verwijderden dan de lege faag omhulsels. Omdat ze wisten dat de genen de cel moesten binnendringen, was hun vraag of 32P of 35S de cel was binnengedrongen. Als eerder is vermeld was het hoofdzakelijk 32P. The chemical Nature of polynucleotides DNA is opgebouwd uit stikstofbevattende basen, fosfaat en de suiker deoxyribose. RNA is opgebouwd uit stikstofstofbevattende basen, fosfaat en de suiker ribose. De basen aanwezig in DNA 3 zijn adenine (A), Cytosine (C), guanine (G) en thymine (T). RNA bevat dezelfde basen, op T na die vervangen is door Uracyl (U). A en G zijn gerateerd aan purine en worden daarom de purines genoemd. C, T en U zijn verwant aan pyrimidine en worden daarom de pyrimidines genoemd. Figuur 1: De chemische structuur van de DNA en RNA basen In onderstaande figuur zijn de structuren van de suikers van RNA en DNA weergegeven. Zij verschillen enkel op de 2’ positie van elkaar. Ribose heeft hier een OH groep, terwijl deze in deoxyribose is vervangen door een H-atoom. Figuur 2: De structuur van ribose en deoxyribose De Basen en de suikers zijn in RNA en DNA met elkaar verbonden in eenheden die nucleosiden worden genoemd. De namen van de nucleosiden zijn afgeleid van de corresponderende basen: Base Adenine Guanine Cytosine Uracil Thymine Ribonucleoside Adenosine Guanosine Cytidine Uridine - Deoxyribonucleoside Deoxyadenosine Deoxyguanosine Deoxycytidine Deoxythymidine De subeenheden van DNA en RNA worden nucleotiden genoemd. Dit zijn nucleosiden waar via een esterbinding een fosfaatgroep is gekoppeld aan de 5’ OH groep. De nucleotiden worden met elkaar verbonden via een fosfodiësterbinding. 4 Figuur 3: de structuur van nucleotiden Polynucleotides and polarity Figuur 4: polynucleotiden en polariteit 5 2.2 DNA structure Rosalind Franklin voerde X-stralen kristallografie uit op DNA. Haar data suggereerden dat de DNA keten een helix structuur heeft. Haar data gaven ook indicatie dat de structuur regelmatig en herhalend was. Dit iis echter paradoxaal, want als DNA het genetisch materiaal is, dan heeft het namelijk een onregelmatige sequentie. Watson en Crick zagen hoe deze paradox opgelost kon worden: DNA moest een dubbele helix zijn, waarvan de suiker-fosfaat backbone aan de buitenzijde ligt en de basen aan de binnenzijde van de helix. De basen moesten paren. Hierbij paart altijd een purine van één keten met een pyrimidine van een andere keten. Op deze manier is de helix uniform. Figuur 5: De DNA dubbele helix structuur Hierbij werd ook voldaan aan Chargaff’s regel dat de hoeveelheid A gelijk was aan de hoeveelheid T en dat de hoeveelheid C gelijk is aan de hoeveelheid G. Uit hun observaties blijkt dat de vorm van de A-T baseparen bijna gelijk is met die van G-C baseparen. Hieruit vormde zij het postulaat dat A altijd met T en G altijd met C een basepaar vormt. Dit zorgt ervoor dat het dubbelstrengig DNA uniform is. De plaats tussen de basenparen bedraagt 3,4 Å en de grote van een helixwinding bedraagt 34 Å, wat betekent dat er 10 bp per helixwinding aanwezig zijn. De ketens zijn antiparallel. 2.3 Physical chemistry of nucleïc acids De structuur van DNA die wordt voorgesteld door Watson en Crick vertegenwoordigde de structuur van het natriumzout van DNA in een vezel, die geproduceerd is bij een zeer hoge relatieve vochtigheid (92%). Deze wordt de B vorm van DNA genoemd. Alhoewel het dicht in de buurt komt van de werkelijke structuur van het meeste DNA in de cel, is het niet de enige mogelijke conformatie. Als de relatieve vochtigheid daalt tot 75%, dan gaat het Na-zout van DNA over naar de A-vorm. Deze 6 verschilt van de B vorm in verschillende aspecten. Het meest belangrijke verschil is dat de baseparen niet meet loodrecht staan op de as van de helix, maar 20° gedraaid is. In de A vorm zijn er 17 bp per helixwinding en elke winding heeft een grootte van 24,6 Å. Zowel de A als de B vorm zijn rechtsdraaiend. De derde structuur wordt Z-DNA genoemd. Deze heeft een zigzaggend patroon. Figuur 6: De verschillende DNA structuren 7 Separating the two strands of a DNA double helix Hoewel de verhouding G:C en A/T constant zijn in een bepaald organisme, varieert dit toch tussen verschillende organismen. De waarden variëren tussen 22 en 73% GC –gehalte. Deze verschillen worden waargenomen door verschillen in fysische eigenschappen. Als een DNA oplossing voldoende wordt verwarmd, dan zullen de waterstofbruggen tussen de twee ketens verzwakken en uiteindelijk verbroken worden. Dit proces wordt DNA denaturatie of smelten genoemd. De temperatuur waarbij de helft van de waterstofbruggen verbroken is wordt Tm of de smelttemperatuur genoemd. Onderstaande curve geeft een smeltcurve van DNA weer. De hoeveelheid denaturatie wordt gemeten door UV absorptie bij 260 nm. Nucleïnezuren absorberen bij deze golflengte licht door de elektronenstructuur van de basen. Als er baseparing optreedt, dan een deel van de absorptie gequenched. Als de twee strengen worden gescheiden, dan vervalt dit effect en zal de absorptie met 30-40% toenemen. Dit wordt een hyperchromische shift genoemd. Bij de temperatuur waarbij de helft van de hyperchromische shift wordt bereikt is Tm. Figuur 7: Smeltcurve van DNA Het GC gehalte heeft een belangrijke invloed op Tm. Hoe hoger dit gehalte, hoe hoger Tm. De reden hiervoor is dat er 3 H-bruggen gevormd worden tussen G en C en slechts 2 tussen A en T. Tijdens denaturatie worden deze H-bruggen verbroken. 8 Figuur 8: relatie tussen GC gehalte en Tm Verwarmen is niet de enige methode om DNA te smelten. Andere methoden zijn het toevoegen van organische solventen zoals DMSO (dimethyl sulfoxide) en formamide, de pH te verhogen, het toevoegen van chaotropen (bv ureum, zij vernietigen de waterstructuur) of de zoutconcentratie te verlagen (negatieve ladingen worden niet van elkaar afgeschermd → repulsie). Het GC gehalte heeft ook een invloed op de dichtheid van het DNA. Onderstaande figuur toont het recht evenredige verband tussen GC% en de dichtheid van DNA. De reden hiervoor is dat G en C een kleiner molair volume hebben dan A en T. 9 Reuniting the separated DNA strands Als de twee DNA ketens van elkaar gescheiden zijn, dan kunnen zij onder de juiste condities terug bij elkaar komen. Dit proces wordt renaturatie of annealing genoemd. Volgende factoren hebben een invloed op dit proces: Temperatuur: Voor renaturatie is de beste temperatuur 25°C onder Tm. Deze temperatuur is laag genoeg om geen promotie meer te hebben voor denaturatie, maar hoog genoeg om een snelle diffusie te bekomen en om de binding tussen mismatchete sequenties te verzwakken. Indien een mengsel zeer snel wordt afgekoeld, dan zal er geen renaturatie kunnen optreden. DNA concentratie: Binnen bepaalde grenzen zal bij een stijgende DNA concentratie de kans op renaturatie groter worden, daar de kans op het tegenkomen van de complementaire streng groter wordt. Renaturatie tijd: Hoe langer de renaturatieprocedure wordt aangehouden, des te meer het zal gebeuren. 10 Hybridization of two different polynucleotide chains Het is ook mogelijk om andere ketens, dan complementaire ketens te laten renatureren. Bijvoorbeeld DNA kan men laten renatureren me RNA. Deze techniek wordt hybridisatie genoemd. Dit is een techniek met vele toepassingen zoals northern blotting, S& mapping, Microarrays, FISH, … 11 DNAs of various sizes and shapes DNA grootte wordt weergegeven op drie verschillende manieren: moleculair gewicht (in Da), het aantal baseparen (bp, kb, Mb), en de lengte (Å). Al deze eenheden staan met elkaar in verband. 1 één helixwinding (33,2 Å) zijn er 10,4 bp aanwezig. Om het aantal bp om te zetten naar moleculair gewicht wordt het aantal bp vermenigvuldigd met 660. lDNA = # bp × 3, 32Å 10, 4 Hoe kunnen we de grootte en de vorm van DNA bepalen. Voor kleine DNA moleculen is dit vrij makkelijk. De vorm kan bepaald worden door het te bekijken met behulp van een elektronenmicroscoop. Om DNA hiermee te kunnen bekijken is het noodzakelijk dat het DNA elektronen stopt. Dit kan bewerkstelligd worden door shadowing toe te passen. Dit wordt gedaan door het DNA te behandelen met een zwaar metaal zoals Pt. Om dit te doen wordt het DNA staal gedurende 5 minuten gebombardeerd met metaal, dat zich zal opstapelen rond het DNA. De grootte van DNA kan geschat worden met behulp van gelelektroforese. The relationship between DNA size and genetic capacity E.coli Chromosoom: o 4.639.695 bp o ~ 4200 genen die coderen voor proteïnen Faag λ o 48502 bp o ~ 44 proteïne coderende genen Faag ϕx174 o 5375 bp o ~ 5 proteïne coderende genen 12 DNA content and the C-value paradox Je zou verwachten dat complexere organismen meer genen nodig heeft dan een minder complex organisme. Daardoor zouden zij een hogere C-waarde, of DNA hoeveelheid per haploïde cel moeten hebben. In het algemeen klopt dit wel, maar niet altijd. Zo heeft een kikker 7x meer DNA dan de mens. Dit wordt de C-waarde paradox genoemd. Een verklaring hiervoor is dat deze organismen veel DNA sequenties hebben die niet coderen voor proteïnen. 13