FORENSISCH DNA-BEWIJS: EEN MATCH MET WISKUNDE Geachte decaan, Geacht curatorium, Zeer gewaardeerde aanwezigen, Inleiding In 1968 stonden in Californië Malcolm en Janet Collins terecht voor een beroving in Los Angeles. Het bewijs dat tegen hen werd ingebracht, bestond in essentie eruit dat ze goed beantwoordden aan getuigenbeschrijvingen. Voor de straatroof werd gezocht naar een duo bestaande uit een negroïde man met een snor en een baard, vergezeld van een blanke vrouw met blond haar in een staart, die een gele of althans deels gele auto bestuurden. De verdachten beantwoordden aan deze beschrijving, maar verder was er geen direct bewijs voorhanden. Om de zaak enig gewicht te geven, schakelde de aanklager een wiskundeleraar in die verklaarde dat een dergelijk duo dusdanig zeldzaam was, dat het bewijs overweldigend was dat een duo dat aan de beschrijving voldoet, ook de beroving gepleegd had. Hij berekende de kansen op een dergelijk tweetal als volgt, en het is al erg aardig om te zien hoe die de tijdgeest reflecteren. Het aantal gele of deels gele auto’s schatte hij in als 1 op de 10, 1 op de 4 mannen heeft een snor, 1 op de 10 vrouwen heeft een paardenstaart, 1 op de 3 vrouwen is blond, 1 op de 10 negroïde mannen heeft een baard, en de kans om in een auto een interraciaal koppel aan te treffen werd door hem als 1 op duizend ingeschat. Het aantal duo’s dat aan al deze kenmerken voldoet, is dan, nog steeds volgens de behulpzame docent, gelijk aan 1 op 10 keer 1 op 4 keer 1 op 10 keer 1 op 3 keer 1 op 10 keer 1 op 1000. Aldus zal 1 op de 12 miljoen stellen aan de beschrijving voldoen. De rechters hadden genoeg gehoord. De conclusie werd getrokken dat de kans 1 op 12 miljoen was dat ze met het verkeerde stel van doen hadden. Met deze foutmarge kon de rechtbank kennelijk wel leven en ze veroordeelde de Collins voor de beroving. Dit was echter niet het slot van het liedje. De veroordeelden waren niet te spreken over deze uitspraak en beroep bij het Supreme Court volgde. Deze rechtbank zag in dat een kans van 1 op 12 miljoen dat een onschuldig koppel voldoet aan de beschrijving van het roversduo, niet hetzelfde is als een kans van 1 op 12 miljoen dat een koppel dat voldoet aan de beschrijving, onschuldig is. De rechtbank vroeg zich af, hoeveel van dergelijke stellen er nog meer te vinden zouden zijn in Los Angeles. Immers, redeneerde de rechtbank, als er geen ander stel zou zijn dat voldoet aan de beschrijving, dan moeten de Collins wel de rovers zijn. Als er nog een ander stel is, dan zou je kunnen zeggen dat de kans 50% is dat de Collins de boeven zijn, bij twee andere stellen is dat 33% (1 op 3, om precies te zijn), en zo verder. De rechtbank ging aan het rekenen en ging uit van (wellicht voor het gemak) een totale populatie van 12 miljoen stellen in deze stad. Binnen deze groep kunnen er eventueel nog meer zijn die aan de beschrijving voldoen en de kans werd berekend als ongeveer 40% dat er nog zo’n stel te vinden zou zijn, ergens in Los Angeles. Het Supreme Court stelde vast dat de kans aanmerkelijk was dat het gearresteerde duo niet het enige in de omgeving was dat aan de beschrijving zou voldoen, en vernietigde de veroordeling. Aan deze redeneringen zitten allerlei haken en ogen. Zo is het bijvoorbeeld niet moeilijk om bedenkingen te opperen tegen de berekening van de kans van 1 op 12 miljoen op een duo dat aan de beschrijving beantwoordt. Wanneer een bepaald kenmerk bij 1 op de 10 mensen voorkomt, en een ander kenmerk bij 1 op de 5, is het niet altijd zo dat ze samen bij 1 op 50 mensen voorkomen. Zo kan een man die een snor heeft, misschien wel vaker een baard hebben dan iemand met een kale bovenlip. En wie weet is het zo dat iemand die van gele auto’s houdt, misschien ook liever samen met een blondine gezien wordt dan met een dame met een andere haarkleur. Hoewel er in deze zaak allerlei kromme, overbodige of zelfs foutieve redeneringen zijn opgehangen, zou je kunnen zeggen dat de forensische statistiek toen, met vallen en opstaan, werd geboren. In de forensische statistiek is de kernvraag: wat bewijst een bepaalde overeenkomst? Hoe kom je erachter hoe zeldzaam een kenmerk is? Als je niet zeker weet hoe vaak een kenmerk voorkomt, wordt de bewijswaarde dan onzeker, of wordt die minder? In hoeverre bewijst een overeenkomst bijvoorbeeld dat een spoor van een bepaalde bron komt? Kan dat wel bewezen worden, is het mogelijk om tot een onomstotelijke identificatie te komen? Als we bewijs van een bepaalde sterkte hebben gevonden, maakt het dan uit of die sterkte enigszins is wat we van dergelijk bewijs kunnen verwachten, of dat het ongebruikelijk sterk of zwak is? Maakt het uit of we de overeenkomst hebben gevonden in een databank, dus door grote aantallen vergelijkingen uit te voeren, en mag je overeenkomsten die zijn gevonden in de opsporingsfase nog een keer gebruiken in de bewijsvoering voor een rechtbank? Forensisch DNA-onderzoek Al deze vragen komen terug bij een groot aantal forensische disciplines en met de meeste heb ik mij de afgelopen jaren beziggehouden. Wat dat betreft had ik met deze oratie verschillende kanten opgekund. Vandaag heb ik er voor gekozen te proberen u in vogelvlucht meer specifiek een indruk te geven van wat forensisch DNA-onderzoek inhoudt, wat er wel en wat er niet mee mogelijk is, en wat er voor wiskunde, meer specifiek kansrekening en statistiek, nodig is bij de interpretatie van DNA-resultaten. Immers, als een DNA-profiel uniek is zoals u wellicht denkt te hebben geleerd, zult u misschien denken dat het koppelen van personen aan DNA-profielen net zo uitdagend is als het opzoeken van een persoon bij een telefoonnummer. Ik zal u hopelijk ervan overtuigen dat de werkelijkheid ingewikkelder is, en dat het raamwerk waarbinnen de interpretatie van DNA-bewijs plaatsvindt, op een prachtige manier laat zien waar de moeilijkheden zitten voor wat betreft het kunnen bereiken van conclusies. Maar laten we niet op de zaken vooruitlopen. Zoals beloofd, begin ik met het DNA-onderzoek zelf. Het DNA is voor een bioloog een groot molecuul, verdeeld in een aantal chromosomen, en op deze chromosomen bevindt zich erfelijke informatie. Wij mensen hebben 23 paren van chromosomen, en van elk paar hebben we een exemplaar van onze moeder en een ander exemplaar van onze vader gekregen. Wanneer wij een kind krijgen, schudden we eerst elk paar door elkaar door stukjes ervan met de andere kopie uit te wisselen, en vervolgens geven we een van deze exemplaren door aan onze kinderen. Hoewel we vaak hoog opgeven van onze kinderen, is het niet zo dat ons ‘beste’ exemplaar van elk chromosoom wordt doorgegeven: dat gaat puur willekeurig, als ware het door de worp van een munt, met vijftig procent kans voor elk chromosoom. Vandaar dat broers en zussen soms heel erg, maar soms ook heel weinig op elkaar lijken: bij een tweede kind begint het kansspel opnieuw en geven we soms hetzelfde, en soms wat anders door dan aan het eerste kind. Een wiskundige zal hier wat anders naar kijken. Dit ziet eerder 23 paren van woorden, geschreven in een alfabet van vier letters, samen met regels hoe je uit twee setjes van 23 woordparen een nieuw setje van 23 woordparen kan maken. Deze regels worden beschreven door de kansrekening, en de combinaties die je kan krijgen passen binnen de wiskunde in het gebied van de combinatoriek. De combinatoriek bestudeert en classificeert objecten waarvan er eindig, of in elk geval niet al te oneindig veel, van bestaan en zouden we de kunst van het tellen kunnen noemen. Hierin ligt een kleine verbinding naar mijn wiskundige verleden: zoals u wellicht weet ben ik gepromoveerd op algebraïsche combinatoriek. Nu is het niet zo dat het DNA van mensen onderling erg verschilt. Sterker nog, het is voor meer dan 99% bij iedereen op de wereld precies hetzelfde. Forensisch DNA-onderzoek is er dan ook op gericht, te bepalen wat voor DNA iemand heeft op de plekken waar het DNA juist wel variabel is. Immers, forensisch DNA-onderzoek heeft als toepassing het achterhalen van wie een bepaald spoor heeft achtergelaten, of op welke manieren mensen mogelijk verwanten van elkaar kunnen zijn. De standaard manier om DNA-onderzoek te doen voor een forensisch lab is dan ook te kijken naar plekjes op het DNA die wel van persoon tot persoon variëren, maar die geen informatie opleveren omtrent biologische eigenschappen van die persoon. Nu is het zo dat een aanzienlijk deel van het DNA niet codeert voor biologische eigenschappen, en in die gedeeltes is veel variatie te vinden. Een forensisch laboratorium onderzoekt meestal tussen de 10 en de 30 van zulke plekken, die in het jargon loci worden genoemd. Elk van die loci kent door de bank genomen een of twee dozijn varianten per stuk, soms nog veel meer, waardoor er in totaal zeer veel varianten mogelijk zijn over alle bekeken loci samen. Elke variant kan je zien als de uitkomst van de worp van een dobbelsteen met een groot aantal kanten (en die ook niet met gelijke kans op elke kant valt). Omdat we onze chromosomen allemaal in tweevoud hebben, en elk van beide chromosomen een eigen variant draagt (een van vaderskant en een van moederskant) krijg je per locus twee varianten te zien. In feite kan je over elk locus op dezelfde manier nadenken als over een bloedgroep, waar u waarschijnlijk meer vertrouwd mee bent. Een forensisch DNA-profiel kan je op die manier zien als ware het de bepaling van een hele rij bloedgroepen tegelijk, met dien verstande dat DNA niet alleen in het bloed voorkomt maar zo’n beetje in elke cel te vinden is. De gevonden DNA-varianten worden uitgedrukt door getallen, die aangeven hoe lang de gevonden varianten zijn. Het aantrekkelijke van zo’n weergave is dat een DNA-profiel heel compact weer te geven is als een rijtje getallen, en het is daarmee ook ideaal voor opslag in databanken en snelle onderlinge vergelijkingen. Elke variant op een locus kan je dus zien als de uitkomst van een dobbelsteenworp, maar er zijn natuurlijk meerdere loci. Als twee loci heel dicht bij elkaar liggen, fuseren de dobbelstenen tot dominostenen. Iedereen heeft dan op elk chromosoom een dominosteen liggen waarbij elke kant van de steen een DNA-variant van een locus voorstelt. Bij het maken van de geslachtscellen blijven de dominostenen doorgaans intact en eentje ervan wordt telkens doorgegeven aan de kinderen. Het fijne aan die structuur is dat je op die manier meer inzicht kan krijgen in familierelaties dan wanneer alle loci helemaal los van elkaar staan. Toepassingen van forensisch DNA-onderzoek Het onderzoeken van familierelaties is een van de meer aansprekende toepassingen van DNA-onderzoek wat mij betreft. Immers, een tijdverdrijf dat de mensheid al heel lang bezighoudt, is het uitzoeken van wie er nu eigenlijk de werkelijke vader is van wie. Voor de ontdekking van genetica was dit een behoorlijk speculatieve bezigheid, waarschijnlijk tot frustratie van sommigen en tot opluchting van anderen. Met de ontdekking van bloedgroepen ontstonden er wetenschappelijk onderbouwde mogelijkheden, omdat men zich realiseerde dat bloedgroepen erfelijk zijn. De onderlinge variatie is echter niet groot genoeg om een beslissende hoeveelheid informatie op te leveren, behalve in het geval van uitsluiting van vaderschap, maar ook dit wordt daarmee lang niet in alle mogelijke gevallen bereikt. Hiervoor heeft DNA-onderzoek grote meerwaarde. Namelijk, omdat het DNA erfelijk is, vertelt het DNAprofiel van iemand niet alleen iets over die persoon zelf, maar ook iets over diens verwanten. De eenvoudigste verwanten zijn ouders of kinderen. Met die personen zal op elk chromosoom een kenmerk door overerving gelijk zijn. Maar omgekeerd is het niet zo dat als twee personen op elk onderzocht locus een kenmerk delen, ze ouder en kind moeten zijn, want ook per toeval delen mensen gemeenschappelijke DNA-kenmerken. Het feit dat het mogelijk is, is bijzonder, en levert een aanwijzing op voor ouderschap maar geen absoluut bewijs. Dit is hetzelfde verschijnsel als bij bloedgroepen: als ouderschap qua bloedgroepen mogelijk is, betekent dat nog niet dat het aangetoond is, want dezelfde kenmerken kan je ook van iemand anders hebben gekregen. Deze kenmerken kunnen al dan niet via verre overerving verkregen zijn. Laten we een gedachtenexperiment uitvoeren om dit laatste te illustreren. In deze zaal heeft iedereen twee ouders, vier grootouders, acht overgrootouders, en zo verder. Bij elke generatie die we teruggaan, krijgen we twee keer zoveel voorouders in onze stamboom. Als we vijf generaties teruggaan, zijn er voor iedereen 32 voorouders, en als we tien generaties teruggaan, en laten we zeggen daarmee in het midden van de 18e eeuw zijn aanbeland als we een jaar of 25 per generatie rekenen, hebben we voor iedereen 1024 voorouders. Alle 17 miljoen Nederlanders samen hadden dus tweehonderdvijftig jaar geleden pakweg 17 miljard voorouders rondlopen! Het moet toen op het eerste gezicht wel heel erg druk zijn geweest. En als we bedenken dat Nederland 100 jaar geleden maar zo’n zes miljoen inwoners had, komen we een hoop mensen tekort. Hoe zit dat? Het antwoord is eenvoudig: die 17 miljard mensen zijn natuurlijk niet 17 miljard verschillende mensen: wanneer u en ik beiden onze stamboom gaan opstellen, zullen we op een bepaald moment die bij elkaar kunnen voegen omdat we dezelfde personen tegenkomen. Die 17 miljard mensen zijn samen hooguit een paar miljoen verschillende mensen. Dit betekent dat we allemaal een heel klein beetje (of meer) familie van elkaar zijn. Maar dat betekent weer dat wanneer ik een DNA-kenmerk van u te weten ben gekomen, bijvoorbeeld omdat u heeft meegewerkt aan een bevolkingsonderzoek of omdat u bent opgenomen in de DNA-databank voor strafzaken, er een klein kansje is dat ik over hetzelfde DNA-kenmerk beschik omdat onze gemeenschappelijke voorouders dat aan ons beiden hebben doorgegeven. Bewijswaarde Laten we nu terugkeren naar de vraag wat we kunnen concluderen uit de resultaten van DNA-onderzoek. Het correct verbinden van conclusies is lastiger dan het op eerste gezicht lijkt. Stel dat wordt aangetoond dat een verdachte matcht met een DNA-spoor (hiermee wordt bedoeld dat de profielen niet van elkaar te onderscheiden zijn), en dat het betreffende profiel bij 1 op de 1 miljoen mensen voorkomt. Wat is nu de kans dat de verdachte niet degene is die het spoor heeft achtergelaten? Veel mensen zijn intuïtief geneigd te antwoorden dat die kans 1 op 1 miljoen is. Dit is echter helemaal niet zo! Niet alleen is de gegeven kans verkeerd, het is nog erger: op basis van deze match kunnen we de kans dat de verdachte het spoor heeft achtergelaten, niet eens berekenen. We missen hierbij namelijk essentiële informatie, die we de context kunnen noemen. Bekijk de volgende twee extreme situaties. Aan de ene kant kan deze match gevonden zijn bij een verdachte die al door diverse getuigenverklaringen is aangewezen, tegen wie nog veel meer bewijs is gevonden en die een gedetailleerde bekentenis heeft afgelegd. In dat geval is de match niet verrassend, in feite wisten we al zo goed als zeker dat we die zouden vinden en heeft de DNA-typering vooral aangetoond dat het lab geen fouten heeft gemaakt. Aan de andere kant van het spectrum kan het ook zo zijn dat er tegen de verdachte geen ander bewijs is gevonden, bijvoorbeeld omdat de match is gevonden bij de doorzoeking van een DNA-databank. In zulke databanken zitten de profielen van honderdduizenden tot miljoenen mensen opgeslagen. In dit geval moet men zich realiseren dat zonder het DNA-bewijs de kans astronomisch klein kan zijn dat we de juiste persoon gevonden hadden: waarom zou juist deze persoon uit de databank, en niet een van al die anderen, nou net de dader zijn? In het geval van de verdachte die al op andere gronden was aangewezen, zouden we met de DNA-match ook nog eens op zak gevoeglijk kunnen concluderen dat we de dader hebben gevonden, in het tweede geval van de databankmatch zouden we ons op basis van meer onderzoek daar verder van willen overtuigen. Dit voorbeeld illustreert dat het forensische DNA-bewijs op zichzelf onze overtuiging niet zozeer vormt, als wel bijstelt. Op basis van wat we eerder al wisten, kunnen we het bewijs inpassen en daarmee tot een nieuwe inschatting komen. Dit inzicht lijkt simpel, maar is het niet. Om een voorbeeld te geven: in 1999 stond in Engeland Sally Clark terecht, omdat twee van haar kinderen waren overleden en zij ervan werd beschuldigd ze om het leven te hebben gebracht. Er werd in de rechtszaal betoogd dat de kans op een dubbele wiegendood ongeveer 1 op 73 miljoen was. Dit werd door velen geïnterpreteerd als de kans dat ze de kinderen niet vermoord had. Clark werd veroordeeld. Het genoemde getal is zeer discutabel, maar dit terzijde. Het enkele feit dat er weinig gevallen zijn van wiegendood, is op zichzelf helemaal niet interessant. Natuurlijk is er hier iets bijzonders aan de hand: twee overleden zuigelingen is gelukkig een extreem onwaarschijnlijk scenario. De vraag is wat er voor bijzonders is gebeurd. Een voorspellende kans als dat in 1 op de 73 miljoen gevallen iets zal gebeuren, kan alleen wat zeggen in vergelijking met andere verklaringen. Dat de baby’s zijn overleden staat helaas vast, en de relevante vraag is hoe dat komt. Wiskundig werkt het verwerken van bewijs in principe zeer simpel en elegant, volgens een simpele formule die bekend staat als de regel van Bayes. Deze regel zegt dat als we twee mogelijke hypothetische verklaringen hebben voor het bewijs (de eerste is bijvoorbeeld dat de verdachte degene is die het spoor heeft achtergelaten, en de tweede dat niet de verdachte maar een onbekende niet aan de verdachte verwante persoon dat heeft gedaan), we moeten kijken hoeveel beter de ene hypothese is in het opleveren van het bewijs dan de andere, door de kansen waarmee het bewijs optreedt onder elk scenario met elkaar te vergelijken. In dit voorbeeld zouden we dus moeten kijken naar de kans op het vinden van de DNA-match wanneer de verdachte het spoor heeft achtergelaten, en naar de kans op het vinden van de match wanneer het spoor door een ander is achtergelaten. Wanneer de verdachte het spoor heeft achtergelaten, krijgen we uiteraard de match: het is immers zijn DNA in het spoor. Met andere woorden, de kans op het bewijs is dan 100%, hetgeen wiskundigen liever uitspreken als 1. Wanneer de verdachte niets met het spoor te maken heeft gehad, moet het door een ander zijn achtergelaten, want het spoor is er nu eenmaal. Maar dan wel door een bijzonder iemand: namelijk iemand die ook met het spoor matcht. Slechts 1 op de 1 miljoen mensen komen hiervoor in aanmerking. Dat betekent dat de kans op de match onder het schuld-scenario 1 miljoen keer groter is dan onder het onschuld-scenario. Deze kansverhouding wordt de Likelihood Ratio (LR) genoemd. De regel van Bayes zegt nu dat, omdat de LR een miljoen bedraagt, de kans op schuld relatief ten opzichte van de kans op onschuld een miljoen keer groter is geworden dan ze was toen we het bewijs nog niet kenden, of was gebleven als we het bewijs over het hoofd hadden gezien of verprutst hadden. Met andere woorden, de regel zegt ons hoe we de kansen op de twee scenario’s, relatief ten opzichte van elkaar, kunnen bepalen. Het is dan namelijk zo dat de kansverhouding tussen de twee scenario’s met inachtneming van het bewijs, gelijk is aan het product van de oorspronkelijke kansverhouding zonder bewijs, vermenigvuldigd met de likelihood ratio. De oorspronkelijke kansverhouding wordt wel de prior odds (prior, voor het bewijs) genoemd en de nieuwe kansverhouding met inachtneming van het bewijs de posterior odds. Een LR van meer dan 1 heeft dus als effect dat de kans op het eerste scenario wordt vergroot ten opzichte van de kans op het tweede scenario, omdat het bewijs daardoor beter te verklaren is dan door het tweede scenario, bij een LR van minder dan 1 is dat andersom, terwijl een LR van precies 1 betekent dat het bewijs volstrekt niet behulpzaam is voor het onderscheiden tussen de scenario’s omdat het in beide gevallen precies even vaak voorkomt. Een is geen, als het ware. Laat ik een voorbeeld verder uitwerken: stel dat de likelihood ratio een miljoen is, en we gaan even terug naar de voorbeelden van zojuist. Wanneer de verdachte al is aangewezen op grond van ander bewijs zoals getuigenverklaringen, zouden we de kans bijvoorbeeld als 90% kunnen stellen dat hij het spoor heeft achtergelaten. Er is dus ook een kans van 10% dat een ander het was, en de kansverhouding is 90%/10%=9, voordat het DNA-bewijs ter tafel komt. Dit bewijs verhoogt de kansverhouding van 9 naar 9 keer 1 miljoen, 9 miljoen dus. Het is nu 9 miljoen keer waarschijnlijker dat de verdachte het spoor heeft achtergelaten dan dat een ander dat deed, en deze zaak lijkt hiermee wel rond. Echter, in de tweede situatie, waarin de verdachte via de databank in beeld kwam, zien we nu dat dat anders ligt. Stel dat we in 50% van de zaken de dader in de databank aantreffen, en de databank uit een half miljoen mensen bestaat. Dan verdelen deze half miljoen mensen samen 50% kans en is het niet onredelijk om ze elk een kans van 1 op 1 miljoen toe te dichten op het zijn van de dader in onze onderhavige zaak. Als we nu de match met de verdachte in aanmerking nemen, wordt de kansverhouding ongeveer 1, dat wil zeggen dat de kans dat deze persoon echt het spoor achterliet bijna precies 50% is. Als we daarna ook nog meenemen dat alle andere mensen in de databank het niet geweest kunnen zijn, zal deze kans nog wat toenemen maar absoluut niet zo groot worden dat een beslissing gerechtvaardigd lijkt. De regel van Bayes heeft een aantal aantrekkelijke kanten, maar is ook geen wondermiddel. Een van de aantrekkelijke kanten eraan is, dat men automatisch meerdere mogelijkheden gaat bekijken en niet focust op het schuldscenario. Het is duidelijk aan de regel dat het bewijs, dat immers is gevonden, linksom of rechtsom verklaard moet worden en men gaat vanzelf de kwaliteiten van de mogelijke verklaringen vergelijken. De regel van Bayes maakt ook duidelijk dat het in het algemeen niet voldoende is om alleen naar het bewijs te kijken, maar dat dit in de context van de prior odds moet worden geplaatst. Idealiter kijk je onbevooroordeeld naar alle relevante gegevens en kom je tot een uiteindelijke bepaling van de kansen op de mogelijke scenario’s in het licht van al het bewijs, hetgeen we kunnen samenvatten als “zonder bias door Bayes al of niet naar de bajes”. Maar natuurlijk zijn niet alle moeilijkheden ineens echt van de baan. Om maar wat te noemen, het formuleren van een alternatieve hypothese door de verdachte of diens verdediging is niet eenvoudig te combineren met het zwijgrecht. Tevens is het lang niet altijd duidelijk wat de alternatieve hypothese precies zou moeten zijn, en ook voor de eerste hypothese, dat is doorgaans degene die nadelig is voor de verdachte, is er helemaal niet altijd een meest logische manier om die te kiezen. Bij een match in de DNA-databank met Piet kan je bijvoorbeeld als eerste hypothese nemen “de dader is Piet” of “de dader zit in de DNA-databank”, want als Piet de enige is die de dader kan zijn van alle mensen in de databank, zijn deze hypotheses equivalent aan elkaar. Uitgaande van de verdachte of van de databank krijg je een andere LR en andere prior odds, maar dezelfde posterior odds: dat wil zeggen, de kans dat Piet schuldig is kan je berekenen, maar er zijn meerdere routes naar die uitkomst. Het is dus niet altijd zo dat het helder is wat er wordt bedoeld met “de” bewijswaarde. Die hangt er van af wat je wilt bewijzen en hoe je dat wilt doen. Ook het inschatten van de prior odds, dus wat je gedacht zou hebben als het bewijs er niet was geweest, is bijzonder lastig. Is een positieve kans op schuld, voorafgaand aan bewijs, eigenlijk wel compatibel met de presumptie van onschuld? Daarnaast is het ook niet duidelijk hoe je alle benodigde kansen zou moeten inschatten in het algemeen, en over wat voor kansbegrip we het dan eigenlijk nog hebben. En wat voor interpretatie moet je eigenlijk geven aan een uitspraak als dat het 99% waarschijnlijk is dat een verdachte schuldig is? Moet je je dan een voorstelling maken van een lange serie identieke rechtszaken, waarin in 99 van de 100 gevallen de verdachte schuldig is? Je komt dan terecht in het gebied van de single event probabilities, die lastig te definiëren, begrijpen en communiceren zijn. De enige zinvolle manier om over een dergelijke kans na te denken is als een zogenaamde subjectieve kans. Het voert te ver om uit te leggen wat dat precies is, maar het komt erop neer dat als rationeel denkende individuen objectief alle informatie meenemen, ze tot een mate van overtuiging komen die zich houdt aan de wetten van de kansrekening en daardoor als kans kan worden geïnterpreteerd. Een laatste, praktische probleem is dat, hoewel in formulevorm de regel helemaal duidelijk is, het in spraakgebruik niet moeilijk is een verkeerde formulering te gebruiken. Een uitspraak als “de kans dat iemand per toeval matcht is 1 op 1 miljoen” ligt gevaarlijk dichtbij “de kans dat dit een toevalsmatch is, is 1 op 1 miljoen”, terwijl de eerste juist is maar de tweede niet. Informatietheorie Vaak wordt de bewijskracht, berekend door de likelihood ratio, voorgesteld als een gewicht dat in een schaal wordt gelegd. Je kan je hiervoor de schalen van vrouwe Justitia voorstellen, waarin de schalen de twee beschouwde hypotheses voorstellen, en de forensisch statisticus in een van de schalen een gewicht legt. De positie van de schalen zal dan bijgesteld worden door het gewicht, maar de uiteindelijke positie hangt zowel van het gelegde gewicht af als van de positie van de schalen voorafgaand daaraan. Hiermee wordt de regel van Bayes perfect geïllustreerd. Maar wat gebeurt er nu als we twee stukken bewijs als gewicht in de schaal willen neerleggen? Als deze twee stukken onafhankelijk zijn, dan wordt de likelihood ratio verkregen als het product van de twee afzonderlijke LR’s. Immers, stel dat bewijsmiddel 1 een LR van 10 heeft, dan maakt die de kansverhouding op schuld 10 keer groter, en als bewijsmiddel 2 een LR van 100 heeft, maakt die de kansverhouding nog eens 100 keer groter. Samen doen ze dat dus 1000 keer. Maar hoe moeten we dit nog rijmen met de beeldspraak van gewichten? We kunnen er dan geen eenheid meer aan verbinden, want 10 kilo keer 100 kilo is 1000 kilo-kwadraat, en geen 1000 kilo. Hetzelfde probleem ontstaat natuurlijk als we verschillende bewijswaardes met elkaar gaan vergelijken. Als we door aanvullend onderzoek de LR vergroten van 1000 naar 10.000, zijn we snel geneigd om te zeggen dat het bewijs tien keer zo sterk is geworden. Immers, we hebben er een factor tien bijgekregen. Maar is dat wel zo? Als we de LR vergroten van 1 naar 10, hebben we het bewijs dan ook tien keer zo sterk gemaakt? Zeker niet! Een LR van 1 correspondeert immers met helemaal geen bewijs. En tien keer geen bewijs is nog steeds geen bewijs. Likelihood ratios, zo leert de ervaring, zijn zeer lastig te interpreteren voor een niet-expert. In de praktijk blijkt wel eens dat wie nog nooit met de regel van Bayes te maken heeft gehad, niet zo snel weet wat hij of zij met een dergelijk getal aan moet. Mijn vermoeden is dat de zojuist genoemde eigenschappen hier mogelijk mede debet aan zijn. Echter, als we in plaats van naar de LR zelf, naar de logaritme van de LR kijken, valt alles precies op zijn plaats. Voor degenen die nu wazig beginnen te kijken, zal ik even uitleggen wat een logaritme is; wie het wel al weet kan dus nu zelf even wazig voor zich uit kijken. Elk positief getal kan je schrijven als een macht van tien; de macht die je nodig hebt is de logaritme van dat getal. De logaritme (met basis 10) van een miljoen is dus zes, de logaritme van 100 is twee, de logaritme van 1/1000 is -3, en die van 1 is nul. Als je getallen vermenigvuldigt, is de logaritme van dat product gelijk aan de som van de logaritmes van de vermenigvuldigde getallen: zo is bijvoorbeeld 10 keer 1000 gelijk aan 10.000, en op logaritmische schaal correspondeert dat met de optelsom 1+3=4. Waar de LR zelf multiplicatief is, wordt de logaritme ervan dus additief. Als we, zoals zonet gedaan, de logaritme met basis tien nemen, heeft een bewijsmiddel met een LR van 10 dus een logaritme van 1 op log-schaal, en een tweede bewijsmiddel met een LR van 100 correspondeert met 2, terwijl de twee gezamenlijk op een LR van 1000 komen, hetgeen als logaritme 3 heeft: de som van de 1 en 2. Hier zou je dus wel degelijk een eenheid aan kunnen verbinden! De eenheid die je dan krijgt is velen van u bekend: het is de bit, die op log-10 schaal de ban wordt genoemd en afkomstig is uit de informatietheorie. Informatie, in de abstracte zin, ontstaat als iets gebeurt waarvan het vooraf onzeker was of het zou gebeuren en aldus een afname van onzekerheid bewerkstelligt. Bijvoorbeeld, als men een DNA-kenmerk van een persoon vaststelt, dan levert dit informatie op, tenzij iedereen dit kenmerk heeft, want dan wist je van te voren al dat je dit kenmerk aan zou treffen. Stel nu dat je een DNA-kenmerk bepaalt waarvan twee varianten bestaan, laten we zeggen variant A en variant B. Als variant A heel zeldzaam is, zal je meestal kenmerk B vaststellen en dus niet erg verrast worden. De gemiddelde hoeveelheid informatie die je krijgt is beperkt, omdat je vaak de algemene DNA-variant tegenkomt. Daar heb je weinig aan. Liever heb je een kenmerk waarvan de varianten A en B even vaak voorkomen. Dit levert intuïtief gemiddeld de meeste informatie op, en inderdaad, volgens de informatietheorie is dat ook zo. De hoeveelheid informatie die bij een kenmerk hoort is dusdanig dat hoe zeldzamer het kenmerk, hoe meer informatie het oplevert; en ook hier lijkt het een logische vereiste dat het qua verkregen informatie niet uitmaakt of je twee verschillende kenmerken waarneemt, of eentje waarvan de zeldzaamheid de gezamenlijke zeldzaamheid van de twee kenmerken is. Dat betekent dat de informatie die besloten ligt in een kenmerk met een bepaalde frequentie door de logaritme van die frequentie bepaald moet zijn. Wanneer een DNA-kenmerk een aantal varianten heeft, zullen die in verschillende proporties voorkomen in de populatie. De meeste informatie zal je dan gemiddeld krijgen wanneer alle varianten even vaak voorkomen. Met andere woorden, als er twee nieuwe loci zijn met elk tien varianten, dan kan je gemiddeld genomen het beste kijken naar degene waar je het meest door de uitkomst wordt verrast, omdat de kenmerken het slechtst voorspelbaar zijn. Op deze manier wordt het ook natuurlijk om de logaritme van de LR te zien als een hoeveelheid verkregen informatie. Bijvoorbeeld, als je een DNA-match wilt verklaren, kan je twee hypotheses opstellen. Laten we de frequentie van het spoor p noemen. Of het spoor is door de verdachte achtergelaten, van wie we weten dat die hetzelfde profiel heeft, of het is door een onbekende achtergelaten. Als het spoor door de verdachte is achtergelaten, weet je zeker dat de match zal plaatsvinden, en een gebeurtenis die kans 1 heeft correspondeert met nul informatie zoals we al zagen. Als het spoor door een onbekende is achtergelaten, moet er een gebeurtenis van kans p hebben plaatsgevonden. Dit komt overeen met –log(p) bans aan informatie; je zou kunnen zeggen dat je nog –log(p) bans aan informatie aan de tweede hypothese moet toevoegen om het bewijs te kunnen beschrijven. Dit op zichzelf zegt niets over de hypothese, maar als je het vergelijkt met wat er nodig was bij de eerste zie je dat je netto dus –log(p) bans meer informatie moet toevoegen aan de tweede dan aan de eerste hypothese, hetgeen je zou kunnen zien als –log(p) bans informatie in het voordeel van de eerste hypothese ten opzichte van de tweede. Wanneer je dit combineert met wat je nog meer hebt aan informatie, kan je besluiten of je vindt dat je genoeg weet om tot een beslissing te komen. Het interessante is dat wanneer je dit gezichtspunt verder uitwerkt, eigenschappen van de likelihood ratio beter op hun plaats vallen. Zo heb ik bijvoorbeeld samen met Thore Egeland, hoogleraar forensische statistiek in Oslo, gekeken naar de gemiddelde bewijskracht van DNA-onderzoek naar verwantschap. Het merkwaardige is, dat deze – wanneer je naar de LR zelf kijkt - helemaal niet af bleek te hangen van de frequenties van de onderzochte kenmerken. Als je bijvoorbeeld wilt kijken hoeveel bewijs er gemiddeld te vinden is voor een ouder-kindrelatie, dan is de gemiddelde LR die je daarvoor krijgt alleen maar afhankelijk van hoeveel kenmerken er op het onderzochte stuk DNA mogelijk zijn, en maakt het totaal niet uit hoe vaak al die kenmerken voorkomen. Dat maakt eigenlijk dat je in een echte populatie helemaal niet kan berekenen wat DNA-onderzoek gemiddeld oplevert, omdat je niet zeker weet of je alle voorkomende DNA-varianten wel kent. En dit geldt niet alleen voor ouder-kindrelaties, maar voor alle relaties tussen twee personen. Echter, wanneer je in plaats daarvan naar de logaritme van de LR kijkt en berekent hoeveel je dan gemiddeld verkrijgt, gedraagt alles zich ineens weer keurig! De gemiddelde Log(LR) hangt wel degelijk af van de frequenties, en wordt in wezen gegeven door soortgelijke uitdrukkingen als degene die de gemiddelde hoeveelheid informatie uitdrukken die de DNA-kenmerken hebben. De aldus verkregen brug naar informatietheorie vind ik zelf erg mooi. Wat ik hier ook bevredigend aan vind, is dat vrijwel onmogelijk is om deze zuiver wiskundige eigenschappen door middel van computersimulaties op het spoor te komen. Hoewel dit onderzoek bij aanvang een stevige recreatieve component kende, bleek kennis van deze eigenschappen nog nuttig ook. Bijvoorbeeld bij validaties van computersystemen die likelihood ratios moeten berekenen, zijn de verkregen formules al van pas gekomen. Familial Searching Tot zover het meer inhoudelijke deel van deze oratie. Natuurlijk draait het werk in een forensisch laboratorium in de eerste plaats om het werken aan concrete zaken. Laat ik u daarom ook nog iets vertellen over een toepassing in de forensische praktijk. Een van de meer aansprekende toepassingen van verwantschapsonderzoek van de laatste jaren is wat mij betreft het zogenaamde familial searching. Wanneer in de DNA-databank geen match met een spoor is gevonden, zit de dader kennelijk niet in de databank en blijft diens identiteit vooralsnog onbekend. Maar wel kan geprobeerd worden om te zoeken naar bijvoorbeeld een broer van de dader op basis van het DNA-profiel van de onbekende dader. Met de profielen in de DNA-databank kan met redelijke kans van slagen worden gezocht naar nabije verwanten, zoals ouders, kinderen, broers en zussen; verdere verwantschap is minder kansrijk. Met deze techniek komen veel forensische, juridische en statistische aspecten samen. Er worden nu verdachten van misdrijven opgespoord, via hun bloedverwanten die zelf met justitie in aanraking zijn gekomen. Daarmee heeft een crimineel met veroordeelde familieleden een grotere kans om gepakt te worden, dan eentje zonder. In de VS riep dit een discussie op, omdat het oververtegenwoordiging van etnische groepen in de opsporing potentieel zou kunnen versterken. In Nederland staat de wet sinds 2012 onder voorwaarden de toepassing van deze techniek toe. Het opzoeken van familieleden in de DNA-databank is echter veel minder eenvoudig dan het opsporen van de dader zelf: we zoeken nu niet meer naar een directe match, maar naar een gelijkend profiel. Het is als het zoeken naar een speld in een hooiberg, terwijl we niet zeker weten of er wel een speld in zit, en er altijd wel hooi tussen zit dat op het eerste gezicht veel op een speld lijkt. Het is technisch niet mogelijk om de hele hooiberg grondig te onderzoeken, dit zou betekenen dat alle DNA-profielen in de databank aan aanvullend onderzoek worden onderworpen. De uitdaging is om een strategie te maken, die over alle hooibergen gemiddeld de meeste spelden vindt, met andere woorden, die zoveel mogelijk daadwerkelijke verwanten vindt. Tegelijk is het minstens zo belangrijk te voorkomen dat een persoon in beeld van de opsporing komt, op basis van louter toevallige genetische overeenkomsten, terwijl deze persoon noch diens familie enige connectie met het onderzochte misdrijf heeft. Ronald Meester, onze (inmiddels gepromoveerde) promovendus Maarten Kruijver en ik hebben de afgelopen jaren uitgebreid onderzoek gedaan naar hoe je dit het beste kunt doen, rekening houdend met de diversiteit aan bevolkingsgroepen in de DNA-databank voor strafzaken en met het feit dat je soms andere familierelaties kan vinden dan degene waar je naar op zoek was. Hiermee konden we bepalen hoe de balans is tussen de hoeveelheid werk die je verricht aan aanvullend DNA-onderzoek, de kans op succes die je hiermee realiseert, en de kans op het ten onrechte doorgeven van persoonsgegevens van een mogelijke verwant die dat niet zal blijken te zijn. Ik denk dat we hierin een goede balans gevonden hebben, maar ik ben geneticus, ik ben geen ethicus. Nou ja, eigenlijk ben ik geen van beiden, maar het klinkt wel leuk. Inmiddels is deze techniek al in verschillende zaken met succes toegepast. De meest bekende zaak is wellicht de Vaatstra-zaak in Friesland, waar een groot bevolkingsonderzoek werd gehouden op zoek naar de moordenaar van Marianne Vaatstra, die inderdaad werd aangehouden. Hoewel dit zeer behulpzaam van hem was, was het in zekere zin jammer dat de dader zelf meedeed aan het daar gehouden bevolkingsonderzoek, en aldus de DNA-vergelijking beperkte tot het vaststellen van een eenvoudige directe match. De zoekacties in de databank zijn wat dat betreft aansprekender. In een van deze zaken lukte het zelfs om te voorspellen dat een vrouw in de DNAdatabank mogelijk de dochter van de zus van de dader was; en inderdaad bleek deze informatie te leiden tot een met het spoor matchende verdachte met deze familierelatie. Dat je uit een kaartenbak met meer dan 200.000 kaarten precies zo’n familielid weet te selecteren, zonder daarnaast ook vals-positieven te krijgen, vind ik een indrukwekkende illustratie van de titel van deze oratie, doelend op de gecombineerde kracht van DNA-bewijs met wiskunde. Toekomst DNA-onderzoek is eigenlijk een relatief jonge discipline, opgekomen in de jaren tachtig. In de loop der jaren is de techniek steeds verder verfijnd, door naar meer posities op het DNA te kijken, maar ook door de techniek steeds gevoeliger te maken. Waar in eerste instantie grote hoeveelheden celmateriaal nodig waren zoals in een flinke bloedvlek, kan tegenwoordig van met het blote oog onzichtbare sporen die maar een paar cellen bevatten nog een profiel verkregen worden. De consequenties zijn dat in veel meer zaken DNA-onderzoek resultaten oplevert, maar ook dat de delictgerelateerdheid van het spoor soms minder duidelijk is. Daarnaast kan de bepaling van het profiel zelf een toevalsproces worden: een DNAkenmerk van iemand die in geringe mate aanwezig is in het spoor, kan de ene keer wel en de andere keer niet worden gedetecteerd in het DNA-profiel. Het rekenen aan zulke profielen is een statistische en computationele uitdaging van formaat, omdat er met meerdere complicaties rekening moet worden gehouden: het aantal personen dat DNA heeft bijgedragen is onbekend, of al hun kenmerken zijn gedetecteerd is eveneens onbekend, en welke combinaties van kenmerken afkomstig kunnen zijn van dezelfde celdonor is eveneens niet duidelijk. Wereldwijd worden er op verschillende plaatsen statistische modellen en bijbehorende software ontwikkeld die berekeningen aan zulke profielen mogelijk maken. Deze modellen kunnen verschillende antwoorden geven wanneer ze hetzelfde spoor met dezelfde verdachte vergelijken. Voor een deel is dit verklaarbaar vanuit het feit dat ze niet met precies dezelfde gegevens werken, maar dat is niet altijd de hele verklaring. Vaak moeten de modellen antwoorden berekenen die met extreme waarden binnen het model zijn verkregen, waardoor je je kan afvragen of de modellen nog van toepassing zijn. Het mooie van likelihood ratios is echter dat ze bepaald gedrag moeten vertonen, vergelijkbaar met de eigenschappen van likelihood ratios voor verwantschapsonderzoek waar ik u eerder in deze rede over heb verteld. Wanneer de antwoorden van de ontwikkelde systemen niet aan deze eisen voldoen, kan je concluderen dat wat ze uitrekenen, niet meteen als bewijskracht te interpreteren is. Het ontwikkelen van toetsen die kunnen helpen om verifiëren of een model betrouwbare antwoorden oplevert is een van de onderwerpen waar ik me nu en in de toekomst mee bezig wil houden. De gevoeligheid van de DNA-typering is niet de enige verbetering. Sinds de introductie van de forensische DNA-techniek neemt het aantal loci dat wordt onderzocht steeds verder toe: waren het er oorspronkelijk een stuk of vier, tot een paar jaar terug 10, nu zijn het er standaard 15, op de korte termijn meer dan 20 en op de iets langere termijn kunnen er standaard tientallen loci tegelijk bepaald worden. Dit heeft op allerlei gebieden gevolgen. Voor familial searching bijvoorbeeld zal dit betekenen dat het opzoeken van een ouder, kind, broer of zus van een onbekende dader net zo makkelijk kan worden als het opzoeken van de dader zelf tegenwoordig is, en dat de grens van opspoorbare verwantschap verder komt te liggen, bijvoorbeeld naar ooms, tantes, en halfbroers. Ook worden de berekeningen complexer, met name op het gebied van verwantschapsonderzoek. Met andere woorden, de discipline heeft en houdt tal van biologische, juridische, ethische, computationele en abstract wiskundige aspecten. Het is een voorrecht hier getuige van te zijn, en er een bijdrage aan te kunnen leveren. Dankwoord Zo naderen we het einde van deze oratie. Ik wil afsluiten met een dankwoord richting degenen die deze bijeenkomst mede mogelijk hebben gemaakt. In de eerste plaats komt mijn dank natuurlijk professor Ronald Meester toe. Toen ik hem (rond 2009 zal dat geweest zijn) voor het eerst sprak, had hij een door mij geschreven stukje gelezen dat ik – niet gehinderd door veel voorkennis van kansrekening – op een laten we zeggen onorthodoxe manier had opgeschreven. Dit verhaal had alles te maken met de zaak die ik in het begin van deze oratie besprak, de Collins die werden beschuldigd van beroving, en zo is deze oratie bijna rond. Ondanks de notationele belemmeringen die ik had opgeworpen heeft Ronald zich er doorheen geploeterd, en hebben we er samen een soort van leesbaar verhaal van gemaakt dat we hebben gepubliceerd. Het was het begin van een vruchtbare, intensieve samenwerking en vriendschap die inmiddels tot verschillende publicaties, inzichten, colleges, plannen voor verder onderzoek en een promotietraject heeft geleid. Mijn talrijke collega’s van het NFI wil ik uiteraard ook graag bedanken. Natuurlijk de directeur, Reinout Woittiez, en mijn afdelingshoofd, Harald Tepper, voor het vertrouwen waarvan zij blijk hebben gegeven door hun steun voor deze leerstoel uit te spreken. Maar in de eerste plaats ben ik mijn directe collega’s, die werken aan verwantschapsonderzoek en DNA-mengsels, en ook buiten de afdeling de forensische statistici, en verder mijn diverse co-auteurs, dankbaar voor hun samenwerking, inspiratie en hun collegialiteit. Het voert veel te ver om iedereen bij naam te noemen, maar voor twee personen wil ik een uitzondering maken. De eerste is Ate Kloosterman, die net als ik bijzonder hoogleraar is, maar dan aan een andere Amsterdamse universiteit. Zijn kennis, scherpte en relativeringsvermogen, zijn mij elke dag van grote waarde. En dan heb ik het nog niet over de waarde van onze fietstochten tussen Den Haag en Leiden, waarbij wij ons terug bij aankomst in Leiden vaak nog even belonen voor onze inspanningen met een drankje bij café Cronesteijn. De tweede is Carla van Dongen, al sinds mensenheugenis mijn kamergenote op het NFI, die mij op het spoor van verwantschapsonderzoek heeft gezet, voor haar onwankelbare en aanstekelijke loyaliteit aan de waarden waar een forensisch instituut voor zou moeten staan. Ik wil overigens geenszins de suggestie wekken dat de genoemde deugden bij de een, niet gelden voor de ander! Mijn ouders en mijn broer wil ik evenzeer bedanken, voor hun belangstelling en voor het vanzelfsprekend maken van de interesse voor wetenschap. Maar het belangrijkste is natuurlijk mijn eigen gezin, Isabelle, Katrien en Lievijne. Ik hoor wel eens mensen zeggen dat het niet makkelijk moet zijn voor een gezin om samen te leven met iemand die het zo druk heeft met de wetenschap. Het is echter eerder andersom: het is niet altijd makkelijk om toe te komen aan de wetenschap in een gezin waarin het zo gezellig is. Het is me het meer dan waard! Als eerbetoon aan mijn kinderen, en om mij als atheïst toch enigszins in de traditie van de VU te plaatsen, zal ik deze oratie besluiten met het voorlezen en duiden van een boekfragment. Ik heb gekozen voor het verhaal “Twee grote stenen” uit de bundel “Muizensoep” van Arnold Lobel dat ik al vele malen in de avonduren heb voorgelezen, en me nu ook zeer geschikt lijkt, hoewel het ditmaal niet mijn bedoeling is het publiek in slaap te sussen. Twee grote stenen stonden tegen een heuvel. Er groeide daar gras en er groeiden bloemen. “Het is mooi aan deze kant van de heuvel,” zei de eerste steen. “Maar ik wil graag weten wat er te zien is aan de andere kant van de heuvel”. “Dat weten we niet. En dat zullen we ook nooit weten”, zei de tweede steen. Op een dag kwam een vogel bij hen zitten. “Vogel, kun jij ons vertellen wat er te zien is aan de andere kant van de heuvel?” vroegen de twee stenen. De vogel vloog weg. Hij vloog hoog over de heuvel heen. Hij kwam terug en zei: “Ik kan steden en kastelen zien. Ik kan bergen en dalen zien. Het is een prachtig gezicht”. De eerste steen zei: “En al die dingen zijn aan de andere kant van de heuvel”. “Wat jammer toch”, zei de tweede steen. “We kunnen ze niet zien en we zullen ze ook nooit zien”. De twee stenen stonden tegen de heuvel. Ze waren bedroefd. Wel honderd jaar lang. Op een dag kwam er een muis voorbij. “Muis, kun jij ons vertellen wat er te zien is aan de andere kant van de heuvel?” vroegen de twee stenen. De muis klom tegen de heuvel op. Hij gluurde over de top en keek naar beneden. Toen kwam hij terug en zei : “Ik kan aarde en stenen zien. Ik kan gras en bloemen zien. Het is een prachtig gezicht.” De eerste steen zei: “De vogel heeft ons een leugen verteld. De andere kant van de heuvel ziet er net zo uit als deze kant”. “Fijn”, zei de tweede steen. “Nu zijn we gelukkig. En dat zullen we altijd blijven”. Op het risico af dit verhaal een tikkel te over-interpreteren, zal ik toelichten waarom het mij trof. Natuurlijk heeft de vogel niet gelogen; hij zag alleen van grotere hoogte dan de muis. Dit werd echter niet begrepen door de stenen, en ook de vogel lichtte dit niet toe. Het motto van deze universiteit is “VU is verder kijken”. Ik denk inderdaad dat de wetenschapper moet proberen de vogel te zijn, maar ook moet trachten om misverstanden als met de stenen te voorkomen. Ik heb gezegd.