Een gemengd model voor de analyse van technische variatie in DNA microarrays Afstudeerproject van Willy Mackus aan het Genoomcentrum Maastricht Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica, vakgroep statistiek Augustus 2003 Voor mijn afstudeerproject ben ik betrokken geweest bij het DNA onderzoek dat aan het Genoom Centrum Maastricht wordt uitgevoerd met behulp van microarrays. Onze erfelijke eigenschappen zijn vastgeleged in DNA. DNA is een spiraalvormige draad die met een andere DNA-streng een dubbele helix vormt. De verbindingen tussen de strengen worden gevormd door basen-paren. Adenine bindt met thymine, en cytosine met guanine (zie figuur 1). Wanneer de volgorde van de ene streng bekend is, kun je dus afleiden wat de volgorde van de andere streng zal zijn; de strengen zijn complementair. Deze eigenschap vormt de basis van de microarray technologie. Een gen is een stukje van het DNA dat de code bevat om een eiwit te vormen. Genexpressie is de mate waarin een gen zich manifesteert onder bepaalde omstandigheden (bijv. gezond of ziek weefsel). Genetici zijn geïnteresseerd in verschillen tussen genexpressie patronen onder verschillende omstandigheden. Met behulp van microarrays kan genexpressie gekwantificeerd worden Figuur 2: Gedeelte van een microarray Figuur 1: Stukje DNA-molecuul voor duizenden genen tegelijk. Dit werkt als volgt: op een speciaal microscoopglaasje (de microarray) worden een groot aantal genen aangebracht (gespot). Twee te onderzoeken weefsels worden van verschillende kleuren voorzien (rood en groen) en in gelijke hoeveelheden op de microarray aangebracht. Het enkelstrengige weefsel krijgt de kans om te binden met een complementaire DNA-streng op de array (hybridisatie). Na hybridisatie wordt de array gescand. Het resultaat is een gekleurd plaatje waarop verschillen in expressie voor de genen in de weefsels zichtbaar zijn door de verschillende kleurintensiteiten voor de spots. Wanneer echter 2 keer hetzelfde gen gespot wordt op een array meet je zelden 2 keer dezelfde intensiteit! Niet alleen het gen en het weefsel, maar ook verandering van biologische of experimentele aard zijn van invloed op de gemeten intensiteit, zoals bijvoorbeeld: het gebruikte glas, de pen waarmee het gen gespot is of de plaats van het spotje op de array. Om hiermee rekening te houden moeten we nagaan welke factoren de resultaten beïnvloeden. Tijdens mijn afstudeerproject ben ik bezig geweest met het onderzoeken van de technische factoren. Hiervoor is een experiment ontworpen, uitgevoerd en geanalyseerd. Het “Genoom Centrum Maastricht” heeft dit experiment uitgevoerd. Om te bekijken welke factoren echt van belang zijn maak je een wiskundig model en kijk je of dat past bij je gegevens. In mijn model is de intensiteit van de spotjes beschreven als een lineaire functie van een aantal factoren (intensiteit = a0 + a1factor 1 + a2factor 2 + .... anfactor n). In het model zijn zogenaamde vaste factoren (bijvoorbeeld kleur, met een beperkt aantal niveaus: rood en groen) gemengd met zogenaamde random factoren (bijvoorbeeld het glaasje, je kiest willekeurig een aantal glaasjes uit de (bijna) oneindige voorraad glaasjes). Met met behulp van het computerprogramma SAS heb ik gekeken welke factoren van belang zijn voor de microarray data; alle factoren in mijn model hadden een grote invloed op de intensiteit. Er valt dus nog heel wat te verbeteren in het productieproces van microarrays.