FORENSISCH DNA-BEWIJS: EEN MATCH MET WISKUNDE

advertisement
FORENSISCH DNA-BEWIJS: EEN MATCH MET WISKUNDE
Geachte decaan,
Geacht curatorium,
Zeer gewaardeerde aanwezigen,
Inleiding
In 1968 stonden in Californië Malcolm en Janet Collins terecht voor een beroving in Los Angeles. Het
bewijs dat tegen hen werd ingebracht, bestond in essentie eruit dat ze goed beantwoordden aan
getuigenbeschrijvingen. Voor de straatroof werd gezocht naar een duo bestaande uit een negroïde man
met een snor en een baard, vergezeld van een blanke vrouw met blond haar in een staart, die een gele
of althans deels gele auto bestuurden. De verdachten beantwoordden aan deze beschrijving, maar
verder was er geen direct bewijs voorhanden. Om de zaak enig gewicht te geven, schakelde de aanklager
een wiskundeleraar in die verklaarde dat een dergelijk duo dusdanig zeldzaam was, dat het bewijs
overweldigend was dat een duo dat aan de beschrijving voldoet, ook de beroving gepleegd had.
Hij berekende de kansen op een dergelijk tweetal als volgt, en het is al erg aardig om te zien hoe die de
tijdgeest reflecteren. Het aantal gele of deels gele auto’s schatte hij in als 1 op de 10, 1 op de 4 mannen
heeft een snor, 1 op de 10 vrouwen heeft een paardenstaart, 1 op de 3 vrouwen is blond, 1 op de 10
negroïde mannen heeft een baard, en de kans om in een auto een interraciaal koppel aan te treffen
werd door hem als 1 op duizend ingeschat. Het aantal duo’s dat aan al deze kenmerken voldoet, is dan,
nog steeds volgens de behulpzame docent, gelijk aan 1 op 10 keer 1 op 4 keer 1 op 10 keer 1 op 3 keer 1
op 10 keer 1 op 1000. Aldus zal 1 op de 12 miljoen stellen aan de beschrijving voldoen. De rechters
hadden genoeg gehoord. De conclusie werd getrokken dat de kans 1 op 12 miljoen was dat ze met het
verkeerde stel van doen hadden. Met deze foutmarge kon de rechtbank kennelijk wel leven en ze
veroordeelde de Collins voor de beroving.
Dit was echter niet het slot van het liedje. De veroordeelden waren niet te spreken over deze uitspraak
en beroep bij het Supreme Court volgde. Deze rechtbank zag in dat een kans van 1 op 12 miljoen dat een
onschuldig koppel voldoet aan de beschrijving van het roversduo, niet hetzelfde is als een kans van 1 op
12 miljoen dat een koppel dat voldoet aan de beschrijving, onschuldig is. De rechtbank vroeg zich af,
hoeveel van dergelijke stellen er nog meer te vinden zouden zijn in Los Angeles. Immers, redeneerde de
rechtbank, als er geen ander stel zou zijn dat voldoet aan de beschrijving, dan moeten de Collins wel de
rovers zijn. Als er nog een ander stel is, dan zou je kunnen zeggen dat de kans 50% is dat de Collins de
boeven zijn, bij twee andere stellen is dat 33% (1 op 3, om precies te zijn), en zo verder. De rechtbank
ging aan het rekenen en ging uit van (wellicht voor het gemak) een totale populatie van 12 miljoen
stellen in deze stad. Binnen deze groep kunnen er eventueel nog meer zijn die aan de beschrijving
voldoen en de kans werd berekend als ongeveer 40% dat er nog zo’n stel te vinden zou zijn, ergens in Los
Angeles. Het Supreme Court stelde vast dat de kans aanmerkelijk was dat het gearresteerde duo niet het
enige in de omgeving was dat aan de beschrijving zou voldoen, en vernietigde de veroordeling.
Aan deze redeneringen zitten allerlei haken en ogen. Zo is het bijvoorbeeld niet moeilijk om
bedenkingen te opperen tegen de berekening van de kans van 1 op 12 miljoen op een duo dat aan de
beschrijving beantwoordt. Wanneer een bepaald kenmerk bij 1 op de 10 mensen voorkomt, en een
ander kenmerk bij 1 op de 5, is het niet altijd zo dat ze samen bij 1 op 50 mensen voorkomen. Zo kan een
man die een snor heeft, misschien wel vaker een baard hebben dan iemand met een kale bovenlip. En
wie weet is het zo dat iemand die van gele auto’s houdt, misschien ook liever samen met een blondine
gezien wordt dan met een dame met een andere haarkleur.
Hoewel er in deze zaak allerlei kromme, overbodige of zelfs foutieve redeneringen zijn opgehangen, zou
je kunnen zeggen dat de forensische statistiek toen, met vallen en opstaan, werd geboren. In de
forensische statistiek is de kernvraag: wat bewijst een bepaalde overeenkomst? Hoe kom je erachter hoe
zeldzaam een kenmerk is? Als je niet zeker weet hoe vaak een kenmerk voorkomt, wordt de
bewijswaarde dan onzeker, of wordt die minder? In hoeverre bewijst een overeenkomst bijvoorbeeld dat
een spoor van een bepaalde bron komt? Kan dat wel bewezen worden, is het mogelijk om tot een
onomstotelijke identificatie te komen? Als we bewijs van een bepaalde sterkte hebben gevonden, maakt
het dan uit of die sterkte enigszins is wat we van dergelijk bewijs kunnen verwachten, of dat het
ongebruikelijk sterk of zwak is? Maakt het uit of we de overeenkomst hebben gevonden in een
databank, dus door grote aantallen vergelijkingen uit te voeren, en mag je overeenkomsten die zijn
gevonden in de opsporingsfase nog een keer gebruiken in de bewijsvoering voor een rechtbank?
Forensisch DNA-onderzoek
Al deze vragen komen terug bij een groot aantal forensische disciplines en met de meeste heb ik mij de
afgelopen jaren beziggehouden. Wat dat betreft had ik met deze oratie verschillende kanten opgekund.
Vandaag heb ik er voor gekozen te proberen u in vogelvlucht meer specifiek een indruk te geven van wat
forensisch DNA-onderzoek inhoudt, wat er wel en wat er niet mee mogelijk is, en wat er voor wiskunde,
meer specifiek kansrekening en statistiek, nodig is bij de interpretatie van DNA-resultaten. Immers, als
een DNA-profiel uniek is zoals u wellicht denkt te hebben geleerd, zult u misschien denken dat het
koppelen van personen aan DNA-profielen net zo uitdagend is als het opzoeken van een persoon bij een
telefoonnummer. Ik zal u hopelijk ervan overtuigen dat de werkelijkheid ingewikkelder is, en dat het
raamwerk waarbinnen de interpretatie van DNA-bewijs plaatsvindt, op een prachtige manier laat zien
waar de moeilijkheden zitten voor wat betreft het kunnen bereiken van conclusies.
Maar laten we niet op de zaken vooruitlopen. Zoals beloofd, begin ik met het DNA-onderzoek zelf. Het
DNA is voor een bioloog een groot molecuul, verdeeld in een aantal chromosomen, en op deze
chromosomen bevindt zich erfelijke informatie. Wij mensen hebben 23 paren van chromosomen, en van
elk paar hebben we een exemplaar van onze moeder en een ander exemplaar van onze vader gekregen.
Wanneer wij een kind krijgen, schudden we eerst elk paar door elkaar door stukjes ervan met de andere
kopie uit te wisselen, en vervolgens geven we een van deze exemplaren door aan onze kinderen. Hoewel
we vaak hoog opgeven van onze kinderen, is het niet zo dat ons ‘beste’ exemplaar van elk chromosoom
wordt doorgegeven: dat gaat puur willekeurig, als ware het door de worp van een munt, met vijftig
procent kans voor elk chromosoom. Vandaar dat broers en zussen soms heel erg, maar soms ook heel
weinig op elkaar lijken: bij een tweede kind begint het kansspel opnieuw en geven we soms hetzelfde, en
soms wat anders door dan aan het eerste kind.
Een wiskundige zal hier wat anders naar kijken. Dit ziet eerder 23 paren van woorden, geschreven in een
alfabet van vier letters, samen met regels hoe je uit twee setjes van 23 woordparen een nieuw setje van
23 woordparen kan maken. Deze regels worden beschreven door de kansrekening, en de combinaties die
je kan krijgen passen binnen de wiskunde in het gebied van de combinatoriek. De combinatoriek
bestudeert en classificeert objecten waarvan er eindig, of in elk geval niet al te oneindig veel, van
bestaan en zouden we de kunst van het tellen kunnen noemen. Hierin ligt een kleine verbinding naar
mijn wiskundige verleden: zoals u wellicht weet ben ik gepromoveerd op algebraïsche combinatoriek.
Nu is het niet zo dat het DNA van mensen onderling erg verschilt. Sterker nog, het is voor meer dan 99%
bij iedereen op de wereld precies hetzelfde. Forensisch DNA-onderzoek is er dan ook op gericht, te
bepalen wat voor DNA iemand heeft op de plekken waar het DNA juist wel variabel is. Immers,
forensisch DNA-onderzoek heeft als toepassing het achterhalen van wie een bepaald spoor heeft
achtergelaten, of op welke manieren mensen mogelijk verwanten van elkaar kunnen zijn.
De standaard manier om DNA-onderzoek te doen voor een forensisch lab is dan ook te kijken naar
plekjes op het DNA die wel van persoon tot persoon variëren, maar die geen informatie opleveren
omtrent biologische eigenschappen van die persoon. Nu is het zo dat een aanzienlijk deel van het DNA
niet codeert voor biologische eigenschappen, en in die gedeeltes is veel variatie te vinden. Een
forensisch laboratorium onderzoekt meestal tussen de 10 en de 30 van zulke plekken, die in het jargon
loci worden genoemd. Elk van die loci kent door de bank genomen een of twee dozijn varianten per stuk,
soms nog veel meer, waardoor er in totaal zeer veel varianten mogelijk zijn over alle bekeken loci samen.
Elke variant kan je zien als de uitkomst van de worp van een dobbelsteen met een groot aantal kanten
(en die ook niet met gelijke kans op elke kant valt). Omdat we onze chromosomen allemaal in tweevoud
hebben, en elk van beide chromosomen een eigen variant draagt (een van vaderskant en een van
moederskant) krijg je per locus twee varianten te zien. In feite kan je over elk locus op dezelfde manier
nadenken als over een bloedgroep, waar u waarschijnlijk meer vertrouwd mee bent. Een forensisch
DNA-profiel kan je op die manier zien als ware het de bepaling van een hele rij bloedgroepen tegelijk,
met dien verstande dat DNA niet alleen in het bloed voorkomt maar zo’n beetje in elke cel te vinden is.
De gevonden DNA-varianten worden uitgedrukt door getallen, die aangeven hoe lang de gevonden
varianten zijn. Het aantrekkelijke van zo’n weergave is dat een DNA-profiel heel compact weer te geven
is als een rijtje getallen, en het is daarmee ook ideaal voor opslag in databanken en snelle onderlinge
vergelijkingen.
Elke variant op een locus kan je dus zien als de uitkomst van een dobbelsteenworp, maar er zijn
natuurlijk meerdere loci. Als twee loci heel dicht bij elkaar liggen, fuseren de dobbelstenen tot
dominostenen. Iedereen heeft dan op elk chromosoom een dominosteen liggen waarbij elke kant van de
steen een DNA-variant van een locus voorstelt. Bij het maken van de geslachtscellen blijven de
dominostenen doorgaans intact en eentje ervan wordt telkens doorgegeven aan de kinderen. Het fijne
aan die structuur is dat je op die manier meer inzicht kan krijgen in familierelaties dan wanneer alle loci
helemaal los van elkaar staan.
Toepassingen van forensisch DNA-onderzoek
Het onderzoeken van familierelaties is een van de meer aansprekende toepassingen van DNA-onderzoek
wat mij betreft. Immers, een tijdverdrijf dat de mensheid al heel lang bezighoudt, is het uitzoeken van
wie er nu eigenlijk de werkelijke vader is van wie. Voor de ontdekking van genetica was dit een
behoorlijk speculatieve bezigheid, waarschijnlijk tot frustratie van sommigen en tot opluchting van
anderen. Met de ontdekking van bloedgroepen ontstonden er wetenschappelijk onderbouwde
mogelijkheden, omdat men zich realiseerde dat bloedgroepen erfelijk zijn. De onderlinge variatie is
echter niet groot genoeg om een beslissende hoeveelheid informatie op te leveren, behalve in het geval
van uitsluiting van vaderschap, maar ook dit wordt daarmee lang niet in alle mogelijke gevallen bereikt.
Hiervoor heeft DNA-onderzoek grote meerwaarde. Namelijk, omdat het DNA erfelijk is, vertelt het DNAprofiel van iemand niet alleen iets over die persoon zelf, maar ook iets over diens verwanten. De
eenvoudigste verwanten zijn ouders of kinderen. Met die personen zal op elk chromosoom een kenmerk
door overerving gelijk zijn. Maar omgekeerd is het niet zo dat als twee personen op elk onderzocht locus
een kenmerk delen, ze ouder en kind moeten zijn, want ook per toeval delen mensen
gemeenschappelijke DNA-kenmerken. Het feit dat het mogelijk is, is bijzonder, en levert een aanwijzing
op voor ouderschap maar geen absoluut bewijs. Dit is hetzelfde verschijnsel als bij bloedgroepen: als
ouderschap qua bloedgroepen mogelijk is, betekent dat nog niet dat het aangetoond is, want dezelfde
kenmerken kan je ook van iemand anders hebben gekregen. Deze kenmerken kunnen al dan niet via
verre overerving verkregen zijn.
Laten we een gedachtenexperiment uitvoeren om dit laatste te illustreren. In deze zaal heeft iedereen
twee ouders, vier grootouders, acht overgrootouders, en zo verder. Bij elke generatie die we teruggaan,
krijgen we twee keer zoveel voorouders in onze stamboom. Als we vijf generaties teruggaan, zijn er voor
iedereen 32 voorouders, en als we tien generaties teruggaan, en laten we zeggen daarmee in het
midden van de 18e eeuw zijn aanbeland als we een jaar of 25 per generatie rekenen, hebben we voor
iedereen 1024 voorouders. Alle 17 miljoen Nederlanders samen hadden dus tweehonderdvijftig jaar
geleden pakweg 17 miljard voorouders rondlopen! Het moet toen op het eerste gezicht wel heel erg
druk zijn geweest. En als we bedenken dat Nederland 100 jaar geleden maar zo’n zes miljoen inwoners
had, komen we een hoop mensen tekort. Hoe zit dat? Het antwoord is eenvoudig: die 17 miljard mensen
zijn natuurlijk niet 17 miljard verschillende mensen: wanneer u en ik beiden onze stamboom gaan
opstellen, zullen we op een bepaald moment die bij elkaar kunnen voegen omdat we dezelfde personen
tegenkomen. Die 17 miljard mensen zijn samen hooguit een paar miljoen verschillende mensen.
Dit betekent dat we allemaal een heel klein beetje (of meer) familie van elkaar zijn. Maar dat betekent
weer dat wanneer ik een DNA-kenmerk van u te weten ben gekomen, bijvoorbeeld omdat u heeft
meegewerkt aan een bevolkingsonderzoek of omdat u bent opgenomen in de DNA-databank voor
strafzaken, er een klein kansje is dat ik over hetzelfde DNA-kenmerk beschik omdat onze
gemeenschappelijke voorouders dat aan ons beiden hebben doorgegeven.
Bewijswaarde
Laten we nu terugkeren naar de vraag wat we kunnen concluderen uit de resultaten van DNA-onderzoek.
Het correct verbinden van conclusies is lastiger dan het op eerste gezicht lijkt. Stel dat wordt aangetoond
dat een verdachte matcht met een DNA-spoor (hiermee wordt bedoeld dat de profielen niet van elkaar
te onderscheiden zijn), en dat het betreffende profiel bij 1 op de 1 miljoen mensen voorkomt. Wat is nu
de kans dat de verdachte niet degene is die het spoor heeft achtergelaten? Veel mensen zijn intuïtief
geneigd te antwoorden dat die kans 1 op 1 miljoen is. Dit is echter helemaal niet zo! Niet alleen is de
gegeven kans verkeerd, het is nog erger: op basis van deze match kunnen we de kans dat de verdachte
het spoor heeft achtergelaten, niet eens berekenen. We missen hierbij namelijk essentiële informatie,
die we de context kunnen noemen. Bekijk de volgende twee extreme situaties. Aan de ene kant kan deze
match gevonden zijn bij een verdachte die al door diverse getuigenverklaringen is aangewezen, tegen
wie nog veel meer bewijs is gevonden en die een gedetailleerde bekentenis heeft afgelegd. In dat geval is
de match niet verrassend, in feite wisten we al zo goed als zeker dat we die zouden vinden en heeft de
DNA-typering vooral aangetoond dat het lab geen fouten heeft gemaakt. Aan de andere kant van het
spectrum kan het ook zo zijn dat er tegen de verdachte geen ander bewijs is gevonden, bijvoorbeeld
omdat de match is gevonden bij de doorzoeking van een DNA-databank. In zulke databanken zitten de
profielen van honderdduizenden tot miljoenen mensen opgeslagen. In dit geval moet men zich
realiseren dat zonder het DNA-bewijs de kans astronomisch klein kan zijn dat we de juiste persoon
gevonden hadden: waarom zou juist deze persoon uit de databank, en niet een van al die anderen, nou
net de dader zijn? In het geval van de verdachte die al op andere gronden was aangewezen, zouden we
met de DNA-match ook nog eens op zak gevoeglijk kunnen concluderen dat we de dader hebben
gevonden, in het tweede geval van de databankmatch zouden we ons op basis van meer onderzoek daar
verder van willen overtuigen.
Dit voorbeeld illustreert dat het forensische DNA-bewijs op zichzelf onze overtuiging niet zozeer vormt,
als wel bijstelt. Op basis van wat we eerder al wisten, kunnen we het bewijs inpassen en daarmee tot
een nieuwe inschatting komen.
Dit inzicht lijkt simpel, maar is het niet. Om een voorbeeld te geven: in 1999 stond in Engeland Sally Clark
terecht, omdat twee van haar kinderen waren overleden en zij ervan werd beschuldigd ze om het leven
te hebben gebracht. Er werd in de rechtszaal betoogd dat de kans op een dubbele wiegendood ongeveer
1 op 73 miljoen was. Dit werd door velen geïnterpreteerd als de kans dat ze de kinderen niet vermoord
had. Clark werd veroordeeld. Het genoemde getal is zeer discutabel, maar dit terzijde. Het enkele feit dat
er weinig gevallen zijn van wiegendood, is op zichzelf helemaal niet interessant. Natuurlijk is er hier iets
bijzonders aan de hand: twee overleden zuigelingen is gelukkig een extreem onwaarschijnlijk scenario.
De vraag is wat er voor bijzonders is gebeurd. Een voorspellende kans als dat in 1 op de 73 miljoen
gevallen iets zal gebeuren, kan alleen wat zeggen in vergelijking met andere verklaringen. Dat de baby’s
zijn overleden staat helaas vast, en de relevante vraag is hoe dat komt.
Wiskundig werkt het verwerken van bewijs in principe zeer simpel en elegant, volgens een simpele
formule die bekend staat als de regel van Bayes. Deze regel zegt dat als we twee mogelijke hypothetische
verklaringen hebben voor het bewijs (de eerste is bijvoorbeeld dat de verdachte degene is die het spoor
heeft achtergelaten, en de tweede dat niet de verdachte maar een onbekende niet aan de verdachte
verwante persoon dat heeft gedaan), we moeten kijken hoeveel beter de ene hypothese is in het
opleveren van het bewijs dan de andere, door de kansen waarmee het bewijs optreedt onder elk
scenario met elkaar te vergelijken. In dit voorbeeld zouden we dus moeten kijken naar de kans op het
vinden van de DNA-match wanneer de verdachte het spoor heeft achtergelaten, en naar de kans op het
vinden van de match wanneer het spoor door een ander is achtergelaten. Wanneer de verdachte het
spoor heeft achtergelaten, krijgen we uiteraard de match: het is immers zijn DNA in het spoor. Met
andere woorden, de kans op het bewijs is dan 100%, hetgeen wiskundigen liever uitspreken als 1.
Wanneer de verdachte niets met het spoor te maken heeft gehad, moet het door een ander zijn
achtergelaten, want het spoor is er nu eenmaal. Maar dan wel door een bijzonder iemand: namelijk
iemand die ook met het spoor matcht. Slechts 1 op de 1 miljoen mensen komen hiervoor in aanmerking.
Dat betekent dat de kans op de match onder het schuld-scenario 1 miljoen keer groter is dan onder het
onschuld-scenario. Deze kansverhouding wordt de Likelihood Ratio (LR) genoemd.
De regel van Bayes zegt nu dat, omdat de LR een miljoen bedraagt, de kans op schuld relatief ten
opzichte van de kans op onschuld een miljoen keer groter is geworden dan ze was toen we het bewijs
nog niet kenden, of was gebleven als we het bewijs over het hoofd hadden gezien of verprutst hadden.
Met andere woorden, de regel zegt ons hoe we de kansen op de twee scenario’s, relatief ten opzichte
van elkaar, kunnen bepalen. Het is dan namelijk zo dat de kansverhouding tussen de twee scenario’s met
inachtneming van het bewijs, gelijk is aan het product van de oorspronkelijke kansverhouding zonder
bewijs, vermenigvuldigd met de likelihood ratio. De oorspronkelijke kansverhouding wordt wel de prior
odds (prior, voor het bewijs) genoemd en de nieuwe kansverhouding met inachtneming van het bewijs
de posterior odds. Een LR van meer dan 1 heeft dus als effect dat de kans op het eerste scenario wordt
vergroot ten opzichte van de kans op het tweede scenario, omdat het bewijs daardoor beter te verklaren
is dan door het tweede scenario, bij een LR van minder dan 1 is dat andersom, terwijl een LR van precies
1 betekent dat het bewijs volstrekt niet behulpzaam is voor het onderscheiden tussen de scenario’s
omdat het in beide gevallen precies even vaak voorkomt. Een is geen, als het ware.
Laat ik een voorbeeld verder uitwerken: stel dat de likelihood ratio een miljoen is, en we gaan even terug
naar de voorbeelden van zojuist. Wanneer de verdachte al is aangewezen op grond van ander bewijs
zoals getuigenverklaringen, zouden we de kans bijvoorbeeld als 90% kunnen stellen dat hij het spoor
heeft achtergelaten. Er is dus ook een kans van 10% dat een ander het was, en de kansverhouding is
90%/10%=9, voordat het DNA-bewijs ter tafel komt. Dit bewijs verhoogt de kansverhouding van 9 naar 9
keer 1 miljoen, 9 miljoen dus. Het is nu 9 miljoen keer waarschijnlijker dat de verdachte het spoor heeft
achtergelaten dan dat een ander dat deed, en deze zaak lijkt hiermee wel rond. Echter, in de tweede
situatie, waarin de verdachte via de databank in beeld kwam, zien we nu dat dat anders ligt. Stel dat we
in 50% van de zaken de dader in de databank aantreffen, en de databank uit een half miljoen mensen
bestaat. Dan verdelen deze half miljoen mensen samen 50% kans en is het niet onredelijk om ze elk een
kans van 1 op 1 miljoen toe te dichten op het zijn van de dader in onze onderhavige zaak. Als we nu de
match met de verdachte in aanmerking nemen, wordt de kansverhouding ongeveer 1, dat wil zeggen dat
de kans dat deze persoon echt het spoor achterliet bijna precies 50% is. Als we daarna ook nog
meenemen dat alle andere mensen in de databank het niet geweest kunnen zijn, zal deze kans nog wat
toenemen maar absoluut niet zo groot worden dat een beslissing gerechtvaardigd lijkt.
De regel van Bayes heeft een aantal aantrekkelijke kanten, maar is ook geen wondermiddel. Een van de
aantrekkelijke kanten eraan is, dat men automatisch meerdere mogelijkheden gaat bekijken en niet
focust op het schuldscenario. Het is duidelijk aan de regel dat het bewijs, dat immers is gevonden,
linksom of rechtsom verklaard moet worden en men gaat vanzelf de kwaliteiten van de mogelijke
verklaringen vergelijken.
De regel van Bayes maakt ook duidelijk dat het in het algemeen niet voldoende is om alleen naar het
bewijs te kijken, maar dat dit in de context van de prior odds moet worden geplaatst. Idealiter kijk je
onbevooroordeeld naar alle relevante gegevens en kom je tot een uiteindelijke bepaling van de kansen
op de mogelijke scenario’s in het licht van al het bewijs, hetgeen we kunnen samenvatten als “zonder
bias door Bayes al of niet naar de bajes”.
Maar natuurlijk zijn niet alle moeilijkheden ineens echt van de baan. Om maar wat te noemen, het
formuleren van een alternatieve hypothese door de verdachte of diens verdediging is niet eenvoudig te
combineren met het zwijgrecht. Tevens is het lang niet altijd duidelijk wat de alternatieve hypothese
precies zou moeten zijn, en ook voor de eerste hypothese, dat is doorgaans degene die nadelig is voor de
verdachte, is er helemaal niet altijd een meest logische manier om die te kiezen. Bij een match in de
DNA-databank met Piet kan je bijvoorbeeld als eerste hypothese nemen “de dader is Piet” of “de dader
zit in de DNA-databank”, want als Piet de enige is die de dader kan zijn van alle mensen in de databank,
zijn deze hypotheses equivalent aan elkaar. Uitgaande van de verdachte of van de databank krijg je een
andere LR en andere prior odds, maar dezelfde posterior odds: dat wil zeggen, de kans dat Piet schuldig
is kan je berekenen, maar er zijn meerdere routes naar die uitkomst. Het is dus niet altijd zo dat het
helder is wat er wordt bedoeld met “de” bewijswaarde. Die hangt er van af wat je wilt bewijzen en hoe
je dat wilt doen.
Ook het inschatten van de prior odds, dus wat je gedacht zou hebben als het bewijs er niet was geweest,
is bijzonder lastig. Is een positieve kans op schuld, voorafgaand aan bewijs, eigenlijk wel compatibel met
de presumptie van onschuld? Daarnaast is het ook niet duidelijk hoe je alle benodigde kansen zou
moeten inschatten in het algemeen, en over wat voor kansbegrip we het dan eigenlijk nog hebben. En
wat voor interpretatie moet je eigenlijk geven aan een uitspraak als dat het 99% waarschijnlijk is dat een
verdachte schuldig is? Moet je je dan een voorstelling maken van een lange serie identieke rechtszaken,
waarin in 99 van de 100 gevallen de verdachte schuldig is?
Je komt dan terecht in het gebied van de single event probabilities, die lastig te definiëren, begrijpen en
communiceren zijn. De enige zinvolle manier om over een dergelijke kans na te denken is als een
zogenaamde subjectieve kans. Het voert te ver om uit te leggen wat dat precies is, maar het komt erop
neer dat als rationeel denkende individuen objectief alle informatie meenemen, ze tot een mate van
overtuiging komen die zich houdt aan de wetten van de kansrekening en daardoor als kans kan worden
geïnterpreteerd.
Een laatste, praktische probleem is dat, hoewel in formulevorm de regel helemaal duidelijk is, het in
spraakgebruik niet moeilijk is een verkeerde formulering te gebruiken. Een uitspraak als “de kans dat
iemand per toeval matcht is 1 op 1 miljoen” ligt gevaarlijk dichtbij “de kans dat dit een toevalsmatch is, is
1 op 1 miljoen”, terwijl de eerste juist is maar de tweede niet.
Informatietheorie
Vaak wordt de bewijskracht, berekend door de likelihood ratio, voorgesteld als een gewicht dat in een
schaal wordt gelegd. Je kan je hiervoor de schalen van vrouwe Justitia voorstellen, waarin de schalen de
twee beschouwde hypotheses voorstellen, en de forensisch statisticus in een van de schalen een gewicht
legt. De positie van de schalen zal dan bijgesteld worden door het gewicht, maar de uiteindelijke positie
hangt zowel van het gelegde gewicht af als van de positie van de schalen voorafgaand daaraan. Hiermee
wordt de regel van Bayes perfect geïllustreerd.
Maar wat gebeurt er nu als we twee stukken bewijs als gewicht in de schaal willen neerleggen? Als deze
twee stukken onafhankelijk zijn, dan wordt de likelihood ratio verkregen als het product van de twee
afzonderlijke LR’s. Immers, stel dat bewijsmiddel 1 een LR van 10 heeft, dan maakt die de
kansverhouding op schuld 10 keer groter, en als bewijsmiddel 2 een LR van 100 heeft, maakt die de
kansverhouding nog eens 100 keer groter. Samen doen ze dat dus 1000 keer. Maar hoe moeten we dit
nog rijmen met de beeldspraak van gewichten? We kunnen er dan geen eenheid meer aan verbinden,
want 10 kilo keer 100 kilo is 1000 kilo-kwadraat, en geen 1000 kilo.
Hetzelfde probleem ontstaat natuurlijk als we verschillende bewijswaardes met elkaar gaan vergelijken.
Als we door aanvullend onderzoek de LR vergroten van 1000 naar 10.000, zijn we snel geneigd om te
zeggen dat het bewijs tien keer zo sterk is geworden. Immers, we hebben er een factor tien bijgekregen.
Maar is dat wel zo? Als we de LR vergroten van 1 naar 10, hebben we het bewijs dan ook tien keer zo
sterk gemaakt? Zeker niet! Een LR van 1 correspondeert immers met helemaal geen bewijs. En tien keer
geen bewijs is nog steeds geen bewijs.
Likelihood ratios, zo leert de ervaring, zijn zeer lastig te interpreteren voor een niet-expert. In de praktijk
blijkt wel eens dat wie nog nooit met de regel van Bayes te maken heeft gehad, niet zo snel weet wat hij
of zij met een dergelijk getal aan moet. Mijn vermoeden is dat de zojuist genoemde eigenschappen hier
mogelijk mede debet aan zijn.
Echter, als we in plaats van naar de LR zelf, naar de logaritme van de LR kijken, valt alles precies op zijn
plaats. Voor degenen die nu wazig beginnen te kijken, zal ik even uitleggen wat een logaritme is; wie het
wel al weet kan dus nu zelf even wazig voor zich uit kijken. Elk positief getal kan je schrijven als een
macht van tien; de macht die je nodig hebt is de logaritme van dat getal. De logaritme (met basis 10) van
een miljoen is dus zes, de logaritme van 100 is twee, de logaritme van 1/1000 is -3, en die van 1 is nul.
Als je getallen vermenigvuldigt, is de logaritme van dat product gelijk aan de som van de logaritmes van
de vermenigvuldigde getallen: zo is bijvoorbeeld 10 keer 1000 gelijk aan 10.000, en op logaritmische
schaal correspondeert dat met de optelsom 1+3=4.
Waar de LR zelf multiplicatief is, wordt de logaritme ervan dus additief. Als we, zoals zonet gedaan, de
logaritme met basis tien nemen, heeft een bewijsmiddel met een LR van 10 dus een logaritme van 1 op
log-schaal, en een tweede bewijsmiddel met een LR van 100 correspondeert met 2, terwijl de twee
gezamenlijk op een LR van 1000 komen, hetgeen als logaritme 3 heeft: de som van de 1 en 2. Hier zou je
dus wel degelijk een eenheid aan kunnen verbinden! De eenheid die je dan krijgt is velen van u bekend:
het is de bit, die op log-10 schaal de ban wordt genoemd en afkomstig is uit de informatietheorie.
Informatie, in de abstracte zin, ontstaat als iets gebeurt waarvan het vooraf onzeker was of het zou
gebeuren en aldus een afname van onzekerheid bewerkstelligt. Bijvoorbeeld, als men een DNA-kenmerk
van een persoon vaststelt, dan levert dit informatie op, tenzij iedereen dit kenmerk heeft, want dan wist
je van te voren al dat je dit kenmerk aan zou treffen. Stel nu dat je een DNA-kenmerk bepaalt waarvan
twee varianten bestaan, laten we zeggen variant A en variant B. Als variant A heel zeldzaam is, zal je
meestal kenmerk B vaststellen en dus niet erg verrast worden. De gemiddelde hoeveelheid informatie
die je krijgt is beperkt, omdat je vaak de algemene DNA-variant tegenkomt. Daar heb je weinig aan.
Liever heb je een kenmerk waarvan de varianten A en B even vaak voorkomen. Dit levert intuïtief
gemiddeld de meeste informatie op, en inderdaad, volgens de informatietheorie is dat ook zo. De
hoeveelheid informatie die bij een kenmerk hoort is dusdanig dat hoe zeldzamer het kenmerk, hoe meer
informatie het oplevert; en ook hier lijkt het een logische vereiste dat het qua verkregen informatie niet
uitmaakt of je twee verschillende kenmerken waarneemt, of eentje waarvan de zeldzaamheid de
gezamenlijke zeldzaamheid van de twee kenmerken is. Dat betekent dat de informatie die besloten ligt in
een kenmerk met een bepaalde frequentie door de logaritme van die frequentie bepaald moet zijn.
Wanneer een DNA-kenmerk een aantal varianten heeft, zullen die in verschillende proporties voorkomen
in de populatie. De meeste informatie zal je dan gemiddeld krijgen wanneer alle varianten even vaak
voorkomen. Met andere woorden, als er twee nieuwe loci zijn met elk tien varianten, dan kan je
gemiddeld genomen het beste kijken naar degene waar je het meest door de uitkomst wordt verrast,
omdat de kenmerken het slechtst voorspelbaar zijn.
Op deze manier wordt het ook natuurlijk om de logaritme van de LR te zien als een hoeveelheid
verkregen informatie.
Bijvoorbeeld, als je een DNA-match wilt verklaren, kan je twee hypotheses opstellen. Laten we de
frequentie van het spoor p noemen. Of het spoor is door de verdachte achtergelaten, van wie we weten
dat die hetzelfde profiel heeft, of het is door een onbekende achtergelaten. Als het spoor door de
verdachte is achtergelaten, weet je zeker dat de match zal plaatsvinden, en een gebeurtenis die kans 1
heeft correspondeert met nul informatie zoals we al zagen. Als het spoor door een onbekende is
achtergelaten, moet er een gebeurtenis van kans p hebben plaatsgevonden. Dit komt overeen met
–log(p) bans aan informatie; je zou kunnen zeggen dat je nog –log(p) bans aan informatie aan de tweede
hypothese moet toevoegen om het bewijs te kunnen beschrijven. Dit op zichzelf zegt niets over de
hypothese, maar als je het vergelijkt met wat er nodig was bij de eerste zie je dat je netto dus –log(p)
bans meer informatie moet toevoegen aan de tweede dan aan de eerste hypothese, hetgeen je zou
kunnen zien als –log(p) bans informatie in het voordeel van de eerste hypothese ten opzichte van de
tweede. Wanneer je dit combineert met wat je nog meer hebt aan informatie, kan je besluiten of je
vindt dat je genoeg weet om tot een beslissing te komen.
Het interessante is dat wanneer je dit gezichtspunt verder uitwerkt, eigenschappen van de likelihood
ratio beter op hun plaats vallen. Zo heb ik bijvoorbeeld samen met Thore Egeland, hoogleraar
forensische statistiek in Oslo, gekeken naar de gemiddelde bewijskracht van DNA-onderzoek naar
verwantschap. Het merkwaardige is, dat deze – wanneer je naar de LR zelf kijkt - helemaal niet af bleek
te hangen van de frequenties van de onderzochte kenmerken. Als je bijvoorbeeld wilt kijken hoeveel
bewijs er gemiddeld te vinden is voor een ouder-kindrelatie, dan is de gemiddelde LR die je daarvoor
krijgt alleen maar afhankelijk van hoeveel kenmerken er op het onderzochte stuk DNA mogelijk zijn, en
maakt het totaal niet uit hoe vaak al die kenmerken voorkomen. Dat maakt eigenlijk dat je in een echte
populatie helemaal niet kan berekenen wat DNA-onderzoek gemiddeld oplevert, omdat je niet zeker
weet of je alle voorkomende DNA-varianten wel kent. En dit geldt niet alleen voor ouder-kindrelaties,
maar voor alle relaties tussen twee personen.
Echter, wanneer je in plaats daarvan naar de logaritme van de LR kijkt en berekent hoeveel je dan
gemiddeld verkrijgt, gedraagt alles zich ineens weer keurig! De gemiddelde Log(LR) hangt wel degelijk af
van de frequenties, en wordt in wezen gegeven door soortgelijke uitdrukkingen als degene die de
gemiddelde hoeveelheid informatie uitdrukken die de DNA-kenmerken hebben. De aldus verkregen brug
naar informatietheorie vind ik zelf erg mooi.
Wat ik hier ook bevredigend aan vind, is dat vrijwel onmogelijk is om deze zuiver wiskundige
eigenschappen door middel van computersimulaties op het spoor te komen. Hoewel dit onderzoek bij
aanvang een stevige recreatieve component kende, bleek kennis van deze eigenschappen nog nuttig ook.
Bijvoorbeeld bij validaties van computersystemen die likelihood ratios moeten berekenen, zijn de
verkregen formules al van pas gekomen.
Familial Searching
Tot zover het meer inhoudelijke deel van deze oratie. Natuurlijk draait het werk in een forensisch
laboratorium in de eerste plaats om het werken aan concrete zaken. Laat ik u daarom ook nog iets
vertellen over een toepassing in de forensische praktijk. Een van de meer aansprekende toepassingen
van verwantschapsonderzoek van de laatste jaren is wat mij betreft het zogenaamde familial searching.
Wanneer in de DNA-databank geen match met een spoor is gevonden, zit de dader kennelijk niet in de
databank en blijft diens identiteit vooralsnog onbekend. Maar wel kan geprobeerd worden om te zoeken
naar bijvoorbeeld een broer van de dader op basis van het DNA-profiel van de onbekende dader. Met de
profielen in de DNA-databank kan met redelijke kans van slagen worden gezocht naar nabije verwanten,
zoals ouders, kinderen, broers en zussen; verdere verwantschap is minder kansrijk. Met deze techniek
komen veel forensische, juridische en statistische aspecten samen. Er worden nu verdachten van
misdrijven opgespoord, via hun bloedverwanten die zelf met justitie in aanraking zijn gekomen. Daarmee
heeft een crimineel met veroordeelde familieleden een grotere kans om gepakt te worden, dan eentje
zonder. In de VS riep dit een discussie op, omdat het oververtegenwoordiging van etnische groepen in de
opsporing potentieel zou kunnen versterken. In Nederland staat de wet sinds 2012 onder voorwaarden
de toepassing van deze techniek toe. Het opzoeken van familieleden in de DNA-databank is echter veel
minder eenvoudig dan het opsporen van de dader zelf: we zoeken nu niet meer naar een directe match,
maar naar een gelijkend profiel. Het is als het zoeken naar een speld in een hooiberg, terwijl we niet
zeker weten of er wel een speld in zit, en er altijd wel hooi tussen zit dat op het eerste gezicht veel op
een speld lijkt. Het is technisch niet mogelijk om de hele hooiberg grondig te onderzoeken, dit zou
betekenen dat alle DNA-profielen in de databank aan aanvullend onderzoek worden onderworpen. De
uitdaging is om een strategie te maken, die over alle hooibergen gemiddeld de meeste spelden vindt,
met andere woorden, die zoveel mogelijk daadwerkelijke verwanten vindt. Tegelijk is het minstens zo
belangrijk te voorkomen dat een persoon in beeld van de opsporing komt, op basis van louter toevallige
genetische overeenkomsten, terwijl deze persoon noch diens familie enige connectie met het
onderzochte misdrijf heeft. Ronald Meester, onze (inmiddels gepromoveerde) promovendus Maarten
Kruijver en ik hebben de afgelopen jaren uitgebreid onderzoek gedaan naar hoe je dit het beste kunt
doen, rekening houdend met de diversiteit aan bevolkingsgroepen in de DNA-databank voor strafzaken
en met het feit dat je soms andere familierelaties kan vinden dan degene waar je naar op zoek was.
Hiermee konden we bepalen hoe de balans is tussen de hoeveelheid werk die je verricht aan aanvullend
DNA-onderzoek, de kans op succes die je hiermee realiseert, en de kans op het ten onrechte doorgeven
van persoonsgegevens van een mogelijke verwant die dat niet zal blijken te zijn. Ik denk dat we hierin
een goede balans gevonden hebben, maar ik ben geneticus, ik ben geen ethicus. Nou ja, eigenlijk ben ik
geen van beiden, maar het klinkt wel leuk. Inmiddels is deze techniek al in verschillende zaken met
succes toegepast. De meest bekende zaak is wellicht de Vaatstra-zaak in Friesland, waar een groot
bevolkingsonderzoek werd gehouden op zoek naar de moordenaar van Marianne Vaatstra, die
inderdaad werd aangehouden. Hoewel dit zeer behulpzaam van hem was, was het in zekere zin jammer
dat de dader zelf meedeed aan het daar gehouden bevolkingsonderzoek, en aldus de DNA-vergelijking
beperkte tot het vaststellen van een eenvoudige directe match. De zoekacties in de databank zijn wat dat
betreft aansprekender. In een van deze zaken lukte het zelfs om te voorspellen dat een vrouw in de DNAdatabank mogelijk de dochter van de zus van de dader was; en inderdaad bleek deze informatie te leiden
tot een met het spoor matchende verdachte met deze familierelatie. Dat je uit een kaartenbak met meer
dan 200.000 kaarten precies zo’n familielid weet te selecteren, zonder daarnaast ook vals-positieven te
krijgen, vind ik een indrukwekkende illustratie van de titel van deze oratie, doelend op de
gecombineerde kracht van DNA-bewijs met wiskunde.
Toekomst
DNA-onderzoek is eigenlijk een relatief jonge discipline, opgekomen in de jaren tachtig. In de loop der
jaren is de techniek steeds verder verfijnd, door naar meer posities op het DNA te kijken, maar ook door
de techniek steeds gevoeliger te maken. Waar in eerste instantie grote hoeveelheden celmateriaal nodig
waren zoals in een flinke bloedvlek, kan tegenwoordig van met het blote oog onzichtbare sporen die
maar een paar cellen bevatten nog een profiel verkregen worden. De consequenties zijn dat in veel meer
zaken DNA-onderzoek resultaten oplevert, maar ook dat de delictgerelateerdheid van het spoor soms
minder duidelijk is. Daarnaast kan de bepaling van het profiel zelf een toevalsproces worden: een DNAkenmerk van iemand die in geringe mate aanwezig is in het spoor, kan de ene keer wel en de andere keer
niet worden gedetecteerd in het DNA-profiel. Het rekenen aan zulke profielen is een statistische en
computationele uitdaging van formaat, omdat er met meerdere complicaties rekening moet worden
gehouden: het aantal personen dat DNA heeft bijgedragen is onbekend, of al hun kenmerken zijn
gedetecteerd is eveneens onbekend, en welke combinaties van kenmerken afkomstig kunnen zijn van
dezelfde celdonor is eveneens niet duidelijk. Wereldwijd worden er op verschillende plaatsen statistische
modellen en bijbehorende software ontwikkeld die berekeningen aan zulke profielen mogelijk maken.
Deze modellen kunnen verschillende antwoorden geven wanneer ze hetzelfde spoor met dezelfde
verdachte vergelijken. Voor een deel is dit verklaarbaar vanuit het feit dat ze niet met precies dezelfde
gegevens werken, maar dat is niet altijd de hele verklaring. Vaak moeten de modellen antwoorden
berekenen die met extreme waarden binnen het model zijn verkregen, waardoor je je kan afvragen of de
modellen nog van toepassing zijn. Het mooie van likelihood ratios is echter dat ze bepaald gedrag
moeten vertonen, vergelijkbaar met de eigenschappen van likelihood ratios voor
verwantschapsonderzoek waar ik u eerder in deze rede over heb verteld. Wanneer de antwoorden van
de ontwikkelde systemen niet aan deze eisen voldoen, kan je concluderen dat wat ze uitrekenen, niet
meteen als bewijskracht te interpreteren is. Het ontwikkelen van toetsen die kunnen helpen om
verifiëren of een model betrouwbare antwoorden oplevert is een van de onderwerpen waar ik me nu en
in de toekomst mee bezig wil houden.
De gevoeligheid van de DNA-typering is niet de enige verbetering. Sinds de introductie van de
forensische DNA-techniek neemt het aantal loci dat wordt onderzocht steeds verder toe: waren het er
oorspronkelijk een stuk of vier, tot een paar jaar terug 10, nu zijn het er standaard 15, op de korte
termijn meer dan 20 en op de iets langere termijn kunnen er standaard tientallen loci tegelijk bepaald
worden. Dit heeft op allerlei gebieden gevolgen. Voor familial searching bijvoorbeeld zal dit betekenen
dat het opzoeken van een ouder, kind, broer of zus van een onbekende dader net zo makkelijk kan
worden als het opzoeken van de dader zelf tegenwoordig is, en dat de grens van opspoorbare
verwantschap verder komt te liggen, bijvoorbeeld naar ooms, tantes, en halfbroers. Ook worden de
berekeningen complexer, met name op het gebied van verwantschapsonderzoek. Met andere woorden,
de discipline heeft en houdt tal van biologische, juridische, ethische, computationele en abstract
wiskundige aspecten. Het is een voorrecht hier getuige van te zijn, en er een bijdrage aan te kunnen
leveren.
Dankwoord
Zo naderen we het einde van deze oratie. Ik wil afsluiten met een dankwoord richting degenen die deze
bijeenkomst mede mogelijk hebben gemaakt. In de eerste plaats komt mijn dank natuurlijk professor
Ronald Meester toe. Toen ik hem (rond 2009 zal dat geweest zijn) voor het eerst sprak, had hij een door
mij geschreven stukje gelezen dat ik – niet gehinderd door veel voorkennis van kansrekening – op een
laten we zeggen onorthodoxe manier had opgeschreven. Dit verhaal had alles te maken met de zaak die
ik in het begin van deze oratie besprak, de Collins die werden beschuldigd van beroving, en zo is deze
oratie bijna rond. Ondanks de notationele belemmeringen die ik had opgeworpen heeft Ronald zich er
doorheen geploeterd, en hebben we er samen een soort van leesbaar verhaal van gemaakt dat we
hebben gepubliceerd. Het was het begin van een vruchtbare, intensieve samenwerking en vriendschap
die inmiddels tot verschillende publicaties, inzichten, colleges, plannen voor verder onderzoek en een
promotietraject heeft geleid.
Mijn talrijke collega’s van het NFI wil ik uiteraard ook graag bedanken. Natuurlijk de directeur, Reinout
Woittiez, en mijn afdelingshoofd, Harald Tepper, voor het vertrouwen waarvan zij blijk hebben gegeven
door hun steun voor deze leerstoel uit te spreken. Maar in de eerste plaats ben ik mijn directe collega’s,
die werken aan verwantschapsonderzoek en DNA-mengsels, en ook buiten de afdeling de forensische
statistici, en verder mijn diverse co-auteurs, dankbaar voor hun samenwerking, inspiratie en hun
collegialiteit. Het voert veel te ver om iedereen bij naam te noemen, maar voor twee personen wil ik een
uitzondering maken. De eerste is Ate Kloosterman, die net als ik bijzonder hoogleraar is, maar dan aan
een andere Amsterdamse universiteit. Zijn kennis, scherpte en relativeringsvermogen, zijn mij elke dag
van grote waarde. En dan heb ik het nog niet over de waarde van onze fietstochten tussen Den Haag en
Leiden, waarbij wij ons terug bij aankomst in Leiden vaak nog even belonen voor onze inspanningen met
een drankje bij café Cronesteijn. De tweede is Carla van Dongen, al sinds mensenheugenis mijn
kamergenote op het NFI, die mij op het spoor van verwantschapsonderzoek heeft gezet, voor haar
onwankelbare en aanstekelijke loyaliteit aan de waarden waar een forensisch instituut voor zou moeten
staan. Ik wil overigens geenszins de suggestie wekken dat de genoemde deugden bij de een, niet gelden
voor de ander!
Mijn ouders en mijn broer wil ik evenzeer bedanken, voor hun belangstelling en voor het
vanzelfsprekend maken van de interesse voor wetenschap.
Maar het belangrijkste is natuurlijk mijn eigen gezin, Isabelle, Katrien en Lievijne. Ik hoor wel eens
mensen zeggen dat het niet makkelijk moet zijn voor een gezin om samen te leven met iemand die het
zo druk heeft met de wetenschap. Het is echter eerder andersom: het is niet altijd makkelijk om toe te
komen aan de wetenschap in een gezin waarin het zo gezellig is. Het is me het meer dan waard!
Als eerbetoon aan mijn kinderen, en om mij als atheïst toch enigszins in de traditie van de VU te
plaatsen, zal ik deze oratie besluiten met het voorlezen en duiden van een boekfragment. Ik heb gekozen
voor het verhaal “Twee grote stenen” uit de bundel “Muizensoep” van Arnold Lobel dat ik al vele malen
in de avonduren heb voorgelezen, en me nu ook zeer geschikt lijkt, hoewel het ditmaal niet mijn
bedoeling is het publiek in slaap te sussen.
Twee grote stenen stonden tegen een heuvel. Er groeide daar gras en er groeiden bloemen. “Het is mooi
aan deze kant van de heuvel,” zei de eerste steen. “Maar ik wil graag weten wat er te zien is aan de
andere kant van de heuvel”. “Dat weten we niet. En dat zullen we ook nooit weten”, zei de tweede steen.
Op een dag kwam een vogel bij hen zitten. “Vogel, kun jij ons vertellen wat er te zien is aan de andere
kant van de heuvel?” vroegen de twee stenen. De vogel vloog weg. Hij vloog hoog over de heuvel heen.
Hij kwam terug en zei: “Ik kan steden en kastelen zien. Ik kan bergen en dalen zien. Het is een prachtig
gezicht”. De eerste steen zei: “En al die dingen zijn aan de andere kant van de heuvel”. “Wat jammer
toch”, zei de tweede steen. “We kunnen ze niet zien en we zullen ze ook nooit zien”. De twee stenen
stonden tegen de heuvel. Ze waren bedroefd. Wel honderd jaar lang. Op een dag kwam er een muis
voorbij. “Muis, kun jij ons vertellen wat er te zien is aan de andere kant van de heuvel?” vroegen de twee
stenen. De muis klom tegen de heuvel op. Hij gluurde over de top en keek naar beneden. Toen kwam hij
terug en zei : “Ik kan aarde en stenen zien. Ik kan gras en bloemen zien. Het is een prachtig gezicht.” De
eerste steen zei: “De vogel heeft ons een leugen verteld. De andere kant van de heuvel ziet er net zo uit
als deze kant”. “Fijn”, zei de tweede steen. “Nu zijn we gelukkig. En dat zullen we altijd blijven”.
Op het risico af dit verhaal een tikkel te over-interpreteren, zal ik toelichten waarom het mij trof.
Natuurlijk heeft de vogel niet gelogen; hij zag alleen van grotere hoogte dan de muis. Dit werd echter
niet begrepen door de stenen, en ook de vogel lichtte dit niet toe. Het motto van deze universiteit is “VU
is verder kijken”. Ik denk inderdaad dat de wetenschapper moet proberen de vogel te zijn, maar ook
moet trachten om misverstanden als met de stenen te voorkomen.
Ik heb gezegd.
Download