Literatuur Forensisch bewijs 1 Forensisch bewijs pag. Inhoudsopgave 1 Inleiding Forensisch bewijs 2 Verplichte literatuur ‐ F. Alkemade en H.G.W. Stikkelbroeck, ‘Een praktische uitleg van een Bayesiaans aanpak in het strafrecht. In onderling verband en in samenhang bezien, Deel 1: Het vaststellen van de bewijskracht van bevindingen en de regel van Bayes’, Trema november 2015, p. 285‐297, Boom Juridische Uitgevers, ISSN 01675478. ‐ F. Alkemade en H.G.W. Stikkelbroeck, ‘In onderling verband en in samenhang bezien: een praktische uitleg van een Bayesiaans aanpak in het strafrecht deel 2: Het bepalen van de Bayesiaanse Prior Odds in strafzaken’, Trema november 2015, p. 340‐354, Boom Juridische Uitgevers, ISSN 01675478. ‐ A.J. Meulenbroek, ‘Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA‐onderzoek’, Expertise en Recht, p. 73‐90, Zutphen: Uitgeverij Paris, 2011, 3, ISSN 1877‐4121. ‐ Forensisch DNA‐verwantschapsonderzoek, Nederlands Forensisch Instituut, p. 1‐7. Aanbevolen Literatuur ‐ D.J.C. Aben & C.E.H. Berger, ‘Bewijs en overtuiging: Rationeel redeneren sinds Aristoteles’, Expertise en Recht, p. 52‐56, Zutphen: Uitgeverij Paris, 2010, 2, ISSN 1877‐4121. ‐ D.J.C. Aben & C.E.H. Berger, ‘Bewijs en overtuiging: Redeneren in de rechtszaal’, Expertise en Recht, p. 86‐90, Zutphen: Uitgeverij Paris, 2010, 3, ISSN 1877‐4121. ‐ D.J.C. Aben, C.E.H. Berger, ‘Bewijs en overtuiging: Een helder zicht op valkuilen’, Expertise en Recht, p. 159‐165, Zutphen: Uitgeverij Paris, 2010, 5/6, ISSN 1877‐4121. ‐ M. Sjerps, ‘Bewijskracht 10, volle vaart recht vooruit’, Inaugurele rede. 6 20 34 53 2 Inleiding Forensisch bewijs Menu 3 REFLECTIE OVER FORENSISCH BEWIJS Het straf(proces)recht kent verschillende regels van technisch procedureel karakter met betrekking tot forensisch bewijs. Hoe onvermijdelijk dat ook moge zijn, het is minstens zo belangrijk dat u weet en begrijpt waarom en hoe (ook deze) procedureregels passen in het (vaak ingewikkelde) proces van waarheidsvinding in het strafrecht. Die waarheidsvinding is en blijft immers de kern van de (straf)zaak. Die bepaalt hoe je (feitelijk) bewijs kunt en moet verzamelen, interpreteren en waarderen. Waarheidsvinding in het strafrecht heeft zowel empirische als procedureel/ rechtstatelijke kanten. Empirische kanten want het gaat allereerst om het vaststellen van de feiten die ter beoordeling zijn. Die feiten hebben zich altijd in het verleden voorgedaan, buiten onze directe waarneming ("Wij zijn er niet bij geweest"). Dat betekent dat we bij het vaststellen, reconstrueren van feiten in het verleden altijd moeten terugredeneren. Van gevolg (sporen) naar oorzaak (bloeddruppel achtergelaten) terugredeneren, blijkt ook wetenschappelijk niet eenvoudig. Integendeel, maar het is mogelijk, en op logisch correcte wijze. Strafrechtelijke waarheidsvinding heeft ook procedurele en rechtstatelijke kanten omdat de manier waarop de (strafrechtelijke) waarheid gevonden en vastgesteld wordt door de met het geweldsmonopolie uitgeruste overheid, zich moet verdragen met mensenrechten en daarop geënte procedures. Procedureregels uit (onder meer) het wetboek van strafvordering (Sv) worden zo vaak en stelselmatig door professionals in de strafrechtspraktijk toegepast dat ze deel zijn gaan uit maken van het Systeem 1 denken (Kahneman: associatief, intuïtief, snel) van die professionals. Het is de bril geworden waardoor ze strafrechtelijk de werkelijkheid bezien. Die bril moet af om plaats te maken voor het Systeem 2 denken: logisch correct, checkend en falsificerend, langzaam en grondig. We, magistraten en advocaten, schakelen in het strafrecht (al dan niet technische) deskundigen in als wij, achteraf, feiten willen (laten) reconstrueren die zich in het verleden hebben voorgedaan en dat aan de hand van bevindingen in het heden. Die bevindingen kunnen aanwijzingen zijn en genoemd worden, of (al dan niet sterke) bewijsmiddelen. Het begrip bewijs is hier gebruikt in de betekenis van evidence (aanwijzing) niet van proof, dat sluitend bewijs oplevert. Dat laatste doet zich immers zelden voor. Voor dat inschakelen van deskundigen zijn met de wet deskundige in strafzaken, in 2010, enkele regels ingevoerd in Sv. In de MvT op deze wet worden niet alleen deze regels nader toegelicht, ook wordt daarin het kader geschetst waarin magistraten en deskundigen met elkaar (moeten) werken. Zo meldt de MvT dat de magistraat bij het geven van een opdracht tot onderzoek/rapportage aan een deskundige zich er van moet vergewissen dat in de opdracht goed is opgenomen wat de magistraat uitgevoerd wil zien. De opdrachtgever moet dus (de) juiste vragen stellen. Dat is als niet vakinhoudelijk deskundig persoon niet makkelijk. De deskundige mag en moet de precies te stellen vraag niet formuleren omdat hij daartoe, als het goed is, niet in staat is: hij kent niet alle ins en outs van de strafzaak. Zou hij die wel kennen dan dreigt het reële gevaar van context bias. Art. 51l Sv zegt dat de deskundige in zijn rapport moet aangeven welke methode van onderzoek is gebruikt, hoe betrouwbaar die methode is, en hoe bekwaam hij als deskundige daarin is. Het is de opdrachtgever die dat vervolgens moet beoordelen! Daar wreekt zich in de praktijk vaak de kenniskloof! Menu 4 De deskundige die wordt ingeschakeld in strafrechtelijke waarheidsvinding moet iets gaan zeggen over bevindingen die in die zaak in het heden zijn gedaan en die zouden moeten dienen ter reconstructie van feiten in het verleden. Over de juiste reconstructie van die feiten kan de deskundige weinig of niets zeggen. Wel kan hij iets zeggen over de kans deze bevindingen nu aan te treffen gegeven, enerzijds, de hypothese (het scenario) dat de verdachte de dader is, en over de kans deze bevindingen nu aan te treffen gegeven, anderzijds, de hypothese (het - alternatieve - scenario) dat de verdachte onschuldig is. Hij kan en mag dus niets zeggen over de kans dat de verdachte wel of niet de dader is. Dat is aan de magistraat om uit te maken. Een voorbeeld. Stel er is een bloedspoor gevonden op een glasscherf afkomstig van een vitrine in een juwelierszaak waarop een overval is gepleegd. Uit dat bloed is een volledig DNA-profiel te maken. Dat profiel blijkt te matchen met het, in de DNA databank gevonden, profiel van de verdachte. De deskundige zal dan (tegenwoordig) kunnen rapporteren dat de kans op het aantreffen van dit DNA in het bloedspoor op de glasscherf, uitgaande van de hypothese dat deze verdachte de dader is en het bloed heeft achtergelaten, bijna 1 is (of bijna 100%). De kans op het aantreffen van dit DNA in het bloedspoor als het is achtergelaten door een willekeurig ander persoon zal om en nabij 1 op 1 miljard zijn, gezien de zeldzaamheid van een bepaald DNA (random match probability (toetsterm nr. 19-20). De deskundige zal niet (kunnen) zeggen wat de kans is dat deze verdachte de dader is. Als uit andere bevindingen uit het dossier blijkt dat de verdachte een sluitend alibi heeft wordt het een moeilijke beslissing voor de magistraat. De deskundige kent als het goed is dat ontlastende dossiergegeven niet. Deze logisch correcte wijze van rapporteren, die tegenwoordig door onder meer door NFI wordt gebruikt is voor de gemiddelde jurist niet makkelijk te begrijpen en toe te passen. Ze is gebaseerd op het theorema van Bayes (een Angelsaksische dominee die wiskunde als hobby had). Dat theorema (keiharde wiskunde) geeft, kort gezegd, de mogelijkheid in situaties waarin teruggeredeneerd moet worden de bewijskracht van een bevinding te bepalen door de kans om deze bevinding aan te treffen als verdachte de dader is, te delen door de kans deze bevinding aan te treffen als de verdachte niet de dader is. Bewijskracht kan vervangen worden door het synonieme diagnostische waarde (toetsterm nr. 17). Vanuit deze optiek moeten de rapportages van het NFI (en andere forensische deskundigen) gelezen en begrepen worden. Het aantreffen van DNA-materiaal levert in het algemeen een grote bewijskracht, een hoge diagnostische waarde op. Die bewijskracht kan slechts aangetast worden door nog sterker bewijs ten gunste van een alternatief, ontlastend, scenario. Het totaal aan bewijs in een zaak kan gevonden worden door de bewijskracht van verscheidene bevindingen met elkaar te vermenigvuldigen (gegeven onafhankelijke kansen). Met DNA-materiaal zitten we in de hoek van 'technisch bewijs'. Niet zelden worden in strafzaken ook deskundigen ingeschakeld om iets wetenschappelijk gefundeerd te zeggen over de persoon van de verdachte (of getuige). Deze gedragswetenschappers baseren hun oordeel (noodzakelijkerwijs) vaak op base rate gegevens, dus op algemene statistische gegevens over verschijningsvormen van menselijk gedrag en dus over de kans op een bepaalde persoonlijkheidsproblematiek. Ook dan en daar moet de slag gemaakt worden naar de verdachte in deze zaak. Menu 5 Of het nu gaat over bevindingen van technische aard, of om 'zachter' materiaal, gesteld kan en moet worden dat alle relevante bevindingen in een strafzaak op dezelfde wijze (als hierboven erg kort aangeduid) moeten worden bezien, geïnterpreteerd en gewaardeerd. Bevindingen kunnen op sterkere of zwakkere wijze bijdragen of afdoen aan een bepaald scenario, maar het blijven strafrechtelijk relevante bevindingen. Er is kortom geen sprake van 'hoofdbewijs' en 'steunbewijs'. Er is sprake van bewijs(middelen) dat/die op zichzelf sterker of zwakker kan/kunnen zijn, maar in onderlinge samenhang moeten worden bezien, door de bewijskracht van diverse bevindingen met elkaar te vermenigvuldigen. Forensisch bewijs is dus voor de oordeelsvorming in strafzaken in wezen niet anders dan ander bewijs, maar de achterliggende specialistische wetenschap kan wel wat afschrikkend werken door ingewikkeldheid. De magistraat en advocaat moeten dus het hoofd koel houden bij bewijskwesties. De strafvorderlijke bril moet af als het om (reconstructie van) feiten gaat. Systeem 2 denken moet systeem 1 denken vervangen. Het gaat immers om het correct vaststellen van feiten die in het verleden hebben plaatsgevonden. Het gaat om een reconstructie binnen de strafrechtelijke wettelijke kaders. Het vaststellen van de relevante feiten is daarom van groot belang. In dit verband speelt ook nog het volgende. Bij het beoordelen van een strafzaak op basis van de betreffende tenlastelegging geldt de grondslagleer. Niet de werkelijkheid maar het tenlastegelegde is de basis van het oordelen. De tenlastelegging, waarin feiten strafrechtelijk worden gekwalificeerd tot misdrijven of overtredingen, zet de rechter als het ware oogkleppen op bij het bezien of er voldoende bewijs is voor het bewezen verklaren van hetgeen is tenlastegelegd. De rechter wordt, anders gezegd, door de tenlastelegging geframed. Dus, nogmaals: het vaststellen van de werkelijk relevante feiten is van groot belang. Dat vaststellen gebeurt uiteindelijk voor en door de rechter. Daar liggen de mogelijkheden en kansen voor de verdediging. Het OM heeft het frame aangeleverd in de vorm van de tenlastelegging. De verdediging kan het frame duiden en tonen wat men ziet als de oogkleppen (van de grondslagleer) afgezet worden: de (andere) werkelijkheid. Die, alternatieve, werkelijkheid kan de basis vormen voor allerlei rechtsvragen die aan de rechter, in eerste aanleg, in hoger beroep en tenslotte in cassatie, kunnen worden voorgelegd. Maar de volgorde is: eerst de feiten, dan strafvordering. Vanuit dit uitgangspunt kan, en moet, ook een strategie ontwikkeld worden over proceshouding verdachte en verweren in eerste aanleg, hoger beroep en cassatie. Ook hier geldt dus dat het Systeem 1 denken (intuïtief, associatief) vervangen moet worden door Systeem 2 denken (logisch correct, grondig). Terzijde past daarbij de opmerking dat daarbij minder het strijdmodel past (zitting is oorlog) maar juist meer de uitnodigende attitude anders te denken en te kijken dan waartoe het frame uitnodigt (intellectuele verleiding). In dit keuzevak zult u materiaal vinden over eerder genoemde technisch-procedurele aspecten maar ook casus en huiswerkopdrachten die het doel hebben u van deze regels te brengen tot wat wij beschouwen als de kern van het strafproces: de waarheidsvinding. Harry Stikkelbroeck Menu 6 F. Alkemade en H.G.W. Stikkelbroeck, ‘Een praktische uitleg van een Bayesiaans aanpak in het strafrecht. In onderling verband en in samenhang bezien, Deel 1: Het vaststellen van de bewijskracht van bevindingen en de regel van Bayes’, Trema november 2015, p. 285‐297 Menu 7 285 Frans Alkemade en Harry Stikkelbroeck Dr. F. Alkemade werkt als cursusdocent voor de SSR en treedt af en toe op als Bayesiaans deskundige in strafzaken. Ook is hij fysicus en als atmosfeeronderzoeker verbonden geweest aan onder andere RIVM, KNMI, Universiteit Utrecht en SRON. Mr. H.G.W. Stikkelbroeck werkt als senior raadsheer bij het hof Arnhem-Leeuwarden. Een praktische uitleg van een Bayesiaanse aanpak in het strafrecht In onderling verband en in samenhang bezien Deel 1: Het vaststellen van de bewijskracht van bevindingen en de regel van Bayes Al geruime tijd wordt geschreven over de toepasbaarheid van het Bayesiaans denken in het strafrecht. Desondanks wordt de methodiek van Bayes in de Nederlandse rechtspraak slechts zelden gebruikt. Het systematisch berekenen of inschatten en vervolgens correct combineren van de afzonderlijke bewijskrachten van verschillende bewijsmiddelen is niet iets waar onze magistraten warm voor lopen. Met mogelijk gerechtelijke dwalingen tot gevolg. Dit tweeluik is vooral een pleidooi voor meer educatie op het gebied van de Bayesiaanse methodiek en voor toepassing daarvan in het strafrecht. In dit eerste deel wordt de essentie van de methodiek uitgelegd. Het tweede deel, dat zal verschijnen in Trema 2015, nr. 10, gaat over de praktische toepasbaarheid en hoe met de methode kan worden gekomen tot een zo goed mogelijke strafrechtelijke waarheidsvinding. November 2015 Menu 8 286 Het komt voor veel juristen als een verrassing dat een eeuwenoud logisch-wiskundig inzicht een zeer toepasselijk redeneerkader biedt voor de waarheidsvinding in het strafrecht. Wie de gerechtelijke dwalingen van de laatste decennia analyseert (en daarmee bedoelen we zowel het veroordelen van onschuldigen als het onterecht vrijspreken van daders), kan volgens ons vaak twee soorten oorzaken zien waarom het mis ging. Er waren vaak cognitieve instincten die het denken belemmerden, maar minstens zo belangrijk was dat aanklagers en rechters niet altijd goed in staat bleken om de diverse bevindingen in een strafzaak op hun juiste (bewijs)waarde te schatten. Sterke aanwijzingen werden als zwak gezien en vice versa. Het combineren van meerdere zwakke en/of tegenstrijdige aanwijzingen ging soms fout. Vaak werden veelzeggende coïncidenties in de feiten en omstandigheden niet als zodanig herkend of werd er – omgekeerd – ten onrechte gedacht: ‘Dat kan geen toeval zijn!’ Dat het inschatten en combineren van bewijskrachten zo moeilijk kan zijn, heeft onder andere te maken met het feit dat er moet worden teruggeredeneerd van gevolg (bijvoorbeeld de aangetroffen ‘plaats delict’ en/of andere bevindingen) naar de mogelijke oorzaak (een hypothese over de ‘ware toedracht’). Dit terugredeneren is notoir lastig en zit vol met logische valkuilen.1 Erger nog: de correcte uitkomst blijkt soms bijzonder contra-intuïtief. Het komt voor veel juristen als een verrassing dat een eeuwenoud logisch-wiskundig inzicht een zeer toepasselijk redeneerkader biedt voor de waarheidsvinding in het strafrecht. Deze aanpak, de Bayesiaanse methodiek, is volgens ons niet alleen het ideale mentale gereedschap voor bewijswaardering en criminologisch denken, maar blijkt ook een prima medicijn tegen verkeerde cognitieve instincten. Toch worden de Bayesiaanse principes, die volgens ons op zich goed te begrijpen en algemeen bruikbaar zijn, in de rechtspraak (nog) nauwelijks onderwezen of toegepast. Wij willen in dit tweeluik betogen dat dat onterecht is. We vragen de lezer wel in gedachten te houden dat de beperkte ruimte ons niet toestaat om een complete vergelijkende studie te maken tussen diverse methodieken voor bewijswaardering, noch om al te gedetailleerd in te gaan op de twijfels die sommige andere auteurs hebben over de toepasbaarheid van Bayes. We zullen daar kort naar verwijzen, maar we willen vooral laten zien wat ‘Bayes’ inhoudt en hoe dit in de praktijk zou kunnen werken. In dit eerste deel willen we de essentie van de methodiek uitleggen op een manier die voor juristen ook zonder voorafgaande kennis goed te begrijpen is. In het tweede deel, dat in het volgende nummer van Trema zal verschijnen, willen we allereerst een einde maken aan de inmiddels wijdverbreide 2 3 4 6 Ch. Berger, ‘Criminalistiek is terugredeneren’, NJB 2010, p. 784-789. 1. Het Bayesiaans denken Thomas Bayes stierf in 1761. In de eeuwen daarna is over de toepassing van de Bayesiaanse methodiek op het strafrecht al veel geschreven. Ook in Nederland doen een aantal wetenschappers en auteurs al jarenlang veel moeite om de rechtspraak te doordringen van het belang van deze manier van denken.3 Toch is een Bayesiaanse aanpak in de rechtszaal nog erg zeldzaam. Een van de oorzaken daarvan zou kunnen zijn dat de doorsnee Nederlandse strafrechter, voor zover wij dat kunnen zien, nog vooral een confirmerende aanpak hanteert. Bij een veroordeling is het cumuleren van bewijsmiddelen tot boven het wettelijk minimumbewijs immers vereist om juridisch tot een bewezenverklaring te kunnen komen. Daarmee is natuurlijk niet gezegd dat de gemiddelde rechter meent dat dit ook de ideale manier is om de bewezenverklaring te bereiken, maar een feit blijft dat het wel de meest voorkomende vorm van bewijsvoering is. Het Bayesiaans denken werkt wezenlijk anders. Het legt een intrinsieke symmetrie op tussen dader- en onschuldhypothese4 en vergt een statistische blik op de werkelijkheid.5 Dat is voor veel juristen onwennig. Toch zijn er bruikbare aanknopingspunten: menige bewijsoverweging bevat wel enige ‘intuïtieve statistiek’, van het kaliber ‘dat kan geen toeval zijn’ of ‘dat acht de rechtbank onaannemelijk’. Daaruit zou het inzicht kunnen groeien dat veel bewijsconstructies eigenlijk statistische overwegingen impliceren. In onze ervaring6 hebben magistraten echter maar zelden de neiging om ten behoeve van de waarheidsvinding de waarschijnlijkheid van de verschillende bewijsmiddelen ook daadwerkelijk te berekenen of numeriek in te schatten. Eerder lijken zij daarvan een afkeer te hebben. 5 1 verwarring over de zogenoemde prior probability,2 en demonstreren dat de Bayesiaanse aanpak niet alleen theoretisch van belang is, maar vaak ook praktisch goed toepasbaar en soms zelfs onmisbaar om tot een goede uitspraak te komen. We zullen complete, zij het schetsmatige en versimpelde, Bayesiaanse analyses geven van twee bekende straf­zaken en betogen dat het daarbij zinnig kan zijn om met getalsmatige kansinschattingen te werken, óók als daar grote onzekerheden en subjectieve elementen aan vast zitten. Zie bijv. J. de Groot, ‘Bayes een brug te ver?’, NJB 2015, p. 372-377. We noemen slechts Marjan Sjerps, Richard Gill, Charles Berger, Ronald Meester, Barbara van den Berg, Ton Derksen en Aart de Vos. Ook Diederik Aben, advocaatgeneraal bij de Hoge Raad, maakt zich regelmatig sterk voor de Bayesiaanse zaak. Het kan natuurlijk ook andere soorten hypotheses over de toedracht betreffen dan alleen dader- of onschuldhypotheses. Met een statistische blik bedoelen we niet slechts ‘gebaseerd op statistieken’, maar meer algemeen het denken in waarschijnlijkheden. Beide auteurs hebben ruime ervaring als cursusdocent bij de SSR en behandelen daarbij ook de Bayesiaanse methodiek. November 2015 Menu 9 In het zogenoemde Bayesiaanse ‘ketenmodel’ zoals wij dat zullen presenteren, worden die impliciete waarschijnlijkheidsoverwegingen juist wél zo veel mogelijk expliciet gemaakt. Dat werkt, heel in het kort, als volgt: van elke relevante bevinding moeten op grond van twee nauwkeuThomas Bayes. Bron: Wikipedia rig gedefinieerde vragen twee kans­ inschattingen worden bepaald (steeds uitgaande van respectievelijk de dader- en de onschuldhypothese), de zogenoemde likelihood ratio (of LR, ook wel ‘diagnostische waarde’ genoemd). De likelihood ratio is een getal. Het is de numerieke uitdrukking van de bewijskracht van de betreffende bevinding als bewijsmiddel. Dat de bewijskracht een zogenoemde dimensieloze grootheid is (er is geen ‘eenheid’ aan verbonden) komt omdat de waarde van de likelihood ratio in feite uitdrukt dat de betreffende bevinding ‘zoveel keer beter’ bij het ene scenario past dan bij het andere. De getalsmatige aanpak biedt in onze optiek grote voordelen. In de traditionele, cumulerende oordeelsvorming is het erg moeilijk om intuïtief aan te voelen wat de gecombineerde kracht is van een verzameling sterke en zwakke en wellicht deels tegenstrijdige bevindingen. Nog moeilijker is het de eigen (professionele) intuïtie vervolgens te expliciteren in een gezamenlijke, consensuele oordeelsvorming. In de Bayesiaanse methodiek leert de wiskunde ons wat de gecombineerde bewijskracht van de verzamelde bewijsmiddelen is: deze is (onder bepaalde voorwaarden die later nog ter sprake komen) gelijk aan het product (de vermenigvuldiging) van de afzonderlijke likelihood ratio’s. Samen met de zogenoemde prior – het conceptuele ‘startpunt’ voor de analyse – vormt dit een rationele en volgens ons optimale basis voor de waarheidsvinding. Een dergelijke aanpak komt niet alleen de transparantie van de bewijsmotivering ten goede, maar kan ook gerechtelijke dwalingen voorkomen. Een expliciete statistische evaluatie van bewijsmiddelen leidt namelijk soms tot een verrassend andere conclusie dan de gebruikelijke meer ‘intuïtieve’ aanpak. Deze kan weliswaar als ‘gezond verstand’ aanvoelen, maar loopt fout zodra de waarheid zelf contra-intuïtief is. Hoewel veel mensen en instituten (met name het NFI) hun best doen om praktische en begrijpelijke introducties in de Bayesiaanse methodiek te geven,7 dreigt er toch onder de beoefenaren van de rechtspraktijk soms het idee te ontstaan dat Bayes eigenlijk te moeilijk is om in de praktijk te kunnen toepassen.8 Wij hopen het tegendeel te bewijzen. In dit eerste deel van ons tweeluik zullen we de likelihood ratio (LR) en de rekenregel van Bayes introduceren. Ook zullen we 7 8 Een erg goede introductie is bijv. vervat in de inaugurele rede die Marjan Sjerps in 2011 hield, Bewijskracht 10: volle vaart recht vooruit. Deze rede is op internet makkelijk te vinden en in pdf-vorm beschikbaar. Zie bijv. B. Robertson & G.A. Vignaux, ‘Don’t teach statistics to lawyers!’ (sic), International Conference On Teaching Statistics 1998, p. 542-548 of zeer recent De Groot a.w., p. 372. 287 uitleggen waarom deze concepten volgens ons een centrale rol moeten spelen in de strafrechtelijke waarheidsvinding en waarom zonder kennis van deze rekenregel het groeiende aantal deskundigenrapporten waarin een likelihood ratio wordt gerapporteerd (dit betreft onder andere veel NFIrapporten) erg moeilijk kan worden geïnterpreteerd.9 In een Bayesiaanse en getalsmatige aanpak is de likelihood ratio daarentegen juist een direct bruikbare bouwsteen in de bewijsvoering. In het tweede deel willen we toewerken naar complete Bayesiaanse analyses zoals die volgens ons in de praktijk van het strafrecht een rol zouden kunnen gaan spelen. Allereerst moeten we daartoe enkele misverstanden over de zogenoemde prior ophelderen en daartegenover een bruikbaar recept stellen om deze te bepalen. We zullen dit recept vervolgens toepassen op echte strafzaken en laten zien dat de Bayesiaanse aanpak in principe praktisch uitvoerbaar kan zijn en gerechtelijke dwalingen kan voorkomen. We willen daarmee op geen enkele manier suggereren dat een rechtszaak gereduceerd kan worden tot een rekensommetje of dat het analyseren van een ingewikkelde rechtszaak iets simpels zou zijn. Het binnen het ketenmodel vermenigvuldigen van likelihood ratio’s die per bewijsmiddel worden bepaald mag alleen onder de voorwaarden dat alle likelihood ratio’s dezelfde hypothesen beschouwen en dat ze, gegeven elk van de hypothesen, onafhankelijk van elkaar zijn (daarover later meer). Die eisen zijn niet triviaal. Over onafhankelijkheid van bevindingen moet goed en inhoudelijk worden nagedacht. Evenzo moet goed in de gaten worden gehouden wat precies de vragen zijn die we met een bepaald bewijsmiddel wel of niet kunnen beantwoorden. Er is voor forensisch bewijs een zekere ‘hiërarchie van hypothesen’ bedacht, die bijvoorbeeld ook door het NFI strikt wordt gehanteerd: 1. (sub)bronniveau: hypothesen gaan over de bron van het spoor (monster); 2. activiteitniveau: hypothesen gaan over de activiteit al dan niet leidend tot sporen; 3. misdrijfniveau: hypothesen gaan over of de verdachte al dan niet de dader is. Heel veel forensisch bewijs beschouwt hypothesen op bron­ niveau, de stap naar activiteit- en misdrijfniveau kan daarbij soms heel groot zijn. In onze voorbeelden zullen we hieraan voorbijgaan door bijvoorbeeld simpelweg te stellen dat een bepaald spoor een daderspoor is. De voorbeeld­analyses zijn schematisch en slechts bedoeld ter illustratie van de Bayesiaanse methode. Als zodanig vormen ze natuurlijk een simplificatie van de complexiteit van rechtszaken. Toch zijn ze niet betekenisloos: als logische fouten worden vermeden, kan ook een simpele analyse soms een veelzeggende onder- of bovengrens opleveren. 9 Dit is een wezenlijk probleem. Zie bijv. J.W. de Keijser et al., Bijkans begrepen? Feitelijk en vermeend begrip van forensische deskundigen­rapportages onder rechters, advocaten en deskundigen, Den Haag: Boom Juridische uitgevers 2009. November 2015 Menu 10 288 Hoe minder ‘toevalligheid’ er nodig is om vanuit een bepaalde hypothese de waargenomen feiten te kunnen verklaren, hoe meer steun die feiten aan die hypothese bieden. Als we de hiervoor genoemde beperkingen van het Bayesiaanse ketenmodel willen opheffen, zullen we met een zogenoemd Bayesiaans netwerk moeten gaan werken. Er zijn op dit moment in Nederland veel groepen die zich met forensische statistiek en Bayesiaanse netwerken bezighouden (onder andere NFI met Marjan Sjerps en Charles Berger, de Groningse groep van Bart Verheij, de Leidse groep van Richard Gill enzovoort). Een Bayesiaans netwerk is in zekere zin de ‘gouden standaard’ van de forensische bewijswaardering. Afhankelijkheden kunnen bijvoorbeeld correct in rekening worden gebracht. Maar het is wel een veel complexere techniek dan het ketenmodel en dat heeft nadelen. Vanuit de rechtspraak zal het moeilijk zijn om te begrijpen wat het netwerk precies behelst en waarom de uitkomst overtuigend zou zijn. Maar ook vanuit de wetenschap is het naar onze mening tot nu toe niet echt gelukt om complexe strafzaken bevredigend te modelleren in een Bayesiaans netwerk. Hoe het ook zij, we moeten constateren dat er in de praktijk van het strafrecht nog zeer weinig met Bayesiaanse principes wordt gewerkt. Dit vinden wij jammer, omdat er in de dagelijkse rechtspraktijk naar onze mening wel degelijk veel winst te halen is door een beter begrip van de Bayesiaanse concepten en manier van denken. In die zin zijn wij dus ‘optimistisch’ over Bayes. Het moge de lezers van Trema duidelijk zijn dat anderen minder optimistisch zijn. Zie bijvoorbeeld auteurs als Henry Prakken, Jaap de Groot enzovoort. Zij zien meer heil in ‘verhalen’ en/of ‘argumentatie’. Wij delen die mening niet, maar daar gaan onze artikelen nu niet over. Wij hebben twee artikelen willen schrijven die aan de lezers van Trema niet alleen een begrijpelijke kennismaking met het Bayesiaanse denken bieden, maar ook een illustratie van hoe die Bayesiaanse inzichten in echte strafzaken een rol zouden kunnen spelen. Dat – en niets anders – is het doel van deze stukken. We willen deze inleiding afsluiten met drie waarschuwingen. 1. De methode is wetenschappelijk, het inschatten van de getallen is dat vaak niet. Heuristiek en intuïtie zullen hier een rol moeten blijven spelen. Het Bayesiaans werken kan dan ook nooit de volledige oplossing zijn voor het moeilijke vraagstuk van de strafrechtelijke waarheidsvinding. Het is echter volgens ons wel een belangrijk hulpmiddel. 2. Niet alleen zal het, zoals gezegd, voor veel lezers erg onwennig en ongemakkelijk overkomen dat we in deze aanpak zo veel mogelijk getalsmatig gaan werken, er schuilt ook een gevaar in. Een getal kan namelijk een onterechte illusie van exactheid oproepen. De voordelen van het getalsmatig werken wegen daar volgens ons echter tegen op: door expliciet na te denken over wat je eigenlijk bedoelt als je denkt in termen als ‘soms’, ‘zo goed als uitgesloten’, ‘veel waarschijnlijker’ enzovoort, ondervraag je als het ware je eigen intuïtie en breng je expliciet in kaart wat je wel en niet weet of denkt te weten. Het getalsmatig werken moet dus niet worden gezien als een poging om ‘valse zekerheid’ te creëren, maar juist als een voorzet tot gericht nadenken en (innerlijke dan wel externe) discussie: ben ik het met dit getal eens? Waarom? Waarom niet? En als het op geen enkele zinnige manier lukt om een getal (of een getalsmatige marge van onzekerheid) toe te kennen aan een bewijskracht, wees dan gewaarschuwd: waarom lukt dat niet? Als we niets kwantitatiefs over deze bevinding kunnen zeggen, mogen we hem dan wel betrekken in ons oordeel? Bedenk ook – meer in het algemeen – dat zonder een getal het voor twee mensen erg moeilijk wordt om te weten of ze het al dan niet met elkaar eens zijn: de een kan bijvoorbeeld met het woordje ‘soms’ echt een totaal andere orde van grootte bedoelen dan de ander. 3. Dit is geen cursus. Niemand mag verwachten de Bayesiaanse methodiek al geheel zelfstandig en volledig te kunnen toepassen na het lezen van twee artikelen. Wat we hopen te bereiken is dat de lezer de principes van deze manier van waarheidsvinding gaat begrijpen en daarmee ook de noodzaak en de beloftes van een Bayesiaanse aanpak zal inzien. Ook kan men alvast wat symmetrischer naar bewijs gaan kijken, de juiste vragen gaan stellen en leren herkennen in welke zaken een expliciet Bayesiaanse analyse nuttig zou kunnen zijn. Als een externe deskundige dan een dergelijke analyse maakt, zal de lezer deze in principe kunnen begrijpen. 2. Het wezen van het Bayesiaanse denken Het achterliggende principe van de Bayesiaanse methodiek kan intuïtief het best worden begrepen door het volgende inzicht: hoe minder ‘toevalligheid’ er nodig is om vanuit een bepaalde hypothese de waargenomen feiten te kunnen verklaren, hoe meer steun die feiten aan die hypothese bieden. We zullen twee voorbeelden geven. Voorbeeld 1 Wie op vakantie in Catalonië iemand ziet die op zijn buurman lijkt, zal niet direct zeker zijn. De hoeveelheid toeval10 die nodig is om daadwerkelijk zijn buurman in Catalonië tegen te komen wordt intuïtief groter ingeschat dan de hoeveelheid toeval die nodig is om iemand aan te treffen die slechts op hem lijkt. Als echter naast de op de buurman gelijkende man opeens ook een op de buurvrouw lijkende vrouw opduikt, kan 10 Met het ietwat losse begrip ‘hoeveelheid toeval’ bedoelen we hier – en in het vervolg – simpelweg 1 gedeeld door de kans dat iets zou optreden. Hoe kleiner die kans, hoe groter dus de hoeveelheid toeval. (Voor de liefhebbers: dit is verwant aan het fysische begrip ‘entropie’, maar dan zonder logaritme.) November 2015 Menu 11 289 de zaak weer kantelen: ze zijn het echt! De hoeveelheid toeval die nodig is om naast elkaar twee onbekenden aan te treffen die tegelijk op buurman en buurvrouw lijken wordt intuïtief weer veel groter ingeschat dan de hoeveelheid toeval die nodig is om je buren daadwerkelijk in Catalonië tegen te komen. Voorbeeld 2 Stel je bent ergens in de Brabantse grensstreek verdwaald en fietst op een stille landweg. De afgelopen vijf minuten heb je slechts een handvol auto’s gezien, allemaal met een Belgisch nummerbord. Vanuit de hypothese dat je nog in Nederland bent vergt deze bevinding ‘meer toeval’ dan vanuit de hypothese dat je per ongeluk in België beland bent. (Met ‘meer toeval’ bedoelen we dat in Nederland de kans op het tegenkomen van een Belgisch nummerbord kleiner is dan in België.) Daarom biedt het waarnemen van Belgische nummerborden dus steun aan de laatste hypothese. Let wel: ‘steun bieden’ betekent slechts dat door de betreffende waarneming de hypothese waarschijnlijker is geworden dan hij vóór de waarneming was. Het zegt nog niet hoe waarschijnlijk hij nu is. Als je bijvoorbeeld vóór het waarnemen van de kentekens, dus a priori, vrijwel zeker meende dat je nog in Nederland was, dan zijn vijf Belgische kentekens wellicht niet voldoende om al tot een andere conclusie te komen. We zien in deze voorbeelden duidelijk de essentiële elementen van het Bayesiaans denken: er zijn meerdere hypotheses, die op enig moment een zekere a priori waarschijnlijkheid hebben, en er zijn bevindingen die het nodig maken om die waarschijnlijkheid bij te stellen. We zeggen dan dat de buurvrouwgelijkenis bewijskracht richting de buurmanhypothese heeft, waarmee we bedoelen dat de waarschijnlijkheid van de buurmanhypothese wordt vergroot. Zo heeft ieder Belgisch kenteken een bewijskracht richting de België-hypothese, terwijl ieder Nederlands kenteken de Holland-hypothese versterkt. Door Thomas Bayes zijn dit soort noties wiskundig geanalyseerd en in een aantal rekenregels uitgewerkt. Het gaat dus niet zomaar om een vuistregeltje of een ervaringsfeit. Zoals de schuine zijde van een rechthoekige driehoek geen andere waarde kan hebben dan wat Pythagoras aangeeft, zo kan de numerieke waarde van een bewijskracht alleen worden gebaseerd op de door Bayes voorgeschreven kansinschattingen.11 Het unieke van een likelihood ratio is dus dat het een kwantitatieve maat voor de bewijskracht is. We zijn ons niet bewust van andere bruikbare methodes om de bewijskracht van een bevinding in een getal uit te drukken. Hoewel de Bayesiaanse denkwijze universeel toepasbaar is, zal de hier gegeven uitleg uitgaan van de situatie in het strafrecht. Ons doel is om relatief eenvoudig en grotendeels in woorden de essentie duidelijk te maken, niet om alle wiskunde gedetail- 11 ‘Wiskundig’ wil hier niet zeggen dat de uitkomst exact is, alleen dat de redenering klopt. Analogie: ook als de zijden van een rechthoek niet precies bekend zijn, blijft de oppervlakte gelijk aan het product, niet de som van lengte en breedte. Afbeelding: Shutterstock leerd weer te geven. Voor een eveneens op het strafrecht toegesneden, maar wat formelere uitleg verwijzen we naar een serie van drie artikelen van C. Berger en D. Aben12 onder de gezamenlijke titel ‘Bewijs en overtuiging’ en naar de recente NJB-publicatie ‘Een overbrugbare kloof’ van Barbara van den Berg13 en de referenties daarin. Ook in Het onzekere bewijs onder redactie van M.J. Sjerps en J.A. Coster van Voorhout14 wordt in hoofdstuk 1 (‘De diagnostische waarde van bewijsmiddelen’, door W.A. Wagenaar) een prima introductie gegeven. Voor de complete wiskundige achtergrond verwijzen we naar bijvoorbeeld Wikipedia en de daar gegeven referenties.15 Deze pagina biedt een uitstekend startpunt voor wie snel de formules wil bekijken en bevat tevens verwijzingen naar zowel de meer diepgravende handboeken als naar een meer intuïtieve uitleg. Verder zijn er nog veel buitenlandse auteurs die de toepassing van de Bayesiaanse methodiek in het strafrecht uitleggen en verdedigen. We noemen slechts mensen als Fenton, O’Neill, Gigerenzer, Evett en Aitken. 3. Begripsbepalingen: bevinding, bewijs, conditional, kans, odds, scenario Voordat we de rekenregel introduceren zijn eerst een paar begripsbepalingen nodig. Scenario Met ‘scenario’ wordt bedoeld een hypothese over de toedracht.16 Wij zullen scenario en hypothese door elkaar gebruiken, als waren het synoniemen. Anderen zien wel een betekenisverschil: een scenario is dan echt een gedetailleerd ingevuld verhaal, een hypothese alleen maar een korte stelling. 12 13 14 15 16 C. Berger & D. Aben, ‘Bewijs en overtuiging’, Expertise en Recht 2010, afl. 2, 3 en 5/6. B. van den Berg, ‘Een overbrugbare kloof. Een vergelijking van de strafrechtelijke en de forensische zienswijze bij de waardering van feiten’, NJB 2014, p. 1420-1426. M.J. Sjerps & J.A. Coster van Voorhout (red.), Het onzekere bewijs, Deventer: Kluwer 2005. http://en.wikipedia.org/wiki/Bayes’_theorem. Hoewel de Bayesiaanse methode kan omgaan met een willekeurig aantal hypotheses, beschouwen we hier uitsluitend situaties met slechts twee hypotheses: daderschap versus onschuld. November 2015 Menu 12 290 We zullen in deze artikelen vaak simpelweg over dader- versus onschuldscenario spreken. In de praktijk is het vaak zinnig om de hypotheses nader te detailleren en te begrenzen. Dat kan alleen op inhoudelijke, zaakspecifieke gronden. We zullen zien dat bewijs alleen kan worden gewogen ten opzichte van goed gedefinieerde scenario’s. Het opstellen daarvan is dus onderdeel van de analyse en gaat daar niet aan vooraf. Bevinding Het is belangrijk om te beseffen dat het enkele feit dat een bepaalde bevinding onder het daderscenario ‘zeer te verwachten’ was, niet automatisch steun biedt aan dat scenario. Met ‘bevinding’ bedoelen we hier elk mogelijke vorm van bewijs: het kan een herkenning zijn, een bekentenis, een match van een vingerafdruk, een coïncidentie tussen twee feiten of bijvoorbeeld het aantreffen van cocaïne in een koffer. Het kan dus zowel gaan om feiten verkregen door onderzoek, als om ‘feiten en omstandigheden’ in algemenere zin. Bewijs Met ‘bewijs’ bedoelen we, ietwat losjes geformuleerd, eerder het Engelse begrip ‘evidence’ dan het Engelse ‘proof’. We hebben het dus over aanwijzingen in het algemeen, niet over de ‘doorslaggevende bewijzen’ of over een onweerlegbare conclusie zoals een wiskundig bewijs. Evenmin is het beperkt tot technisch bewijs. Kans Het woord ‘kans’ dekt twee verwante maar verschillende begrippen. In de eerste plaats kan het de frequentie aanduiden van uitkomsten van in principe herhaalbare toevalsprocessen, bijvoorbeeld de kans om driemaal zes te gooien of om een hartentien te trekken. Of ook bijvoorbeeld de kans dat de volgende auto die (in een bepaald jaar en in een bepaalde plaats) de hoek om komt geel is. Maar hetzelfde woord ‘kans’ wordt ook vaak gebruikt om een zogenoemde graad van geloof uit te drukken (ook wel ‘epistemische kans’ genoemd). Dit betreft dan een kans in de zin van ‘de kans dat Oranje wereldkampioen wordt’, ‘de kans dat er leven is op Mars’ of ‘de kans dat deze verdachte de dader is’. We drukken daarmee onze overtuiging uit over wat er gaat gebeuren of is gebeurd. Als er nieuwe feiten bekend worden (bijvoorbeeld een getuige heeft de verdachte herkend), dan moeten we onze overtuiging bijstellen. We drukken deze verandering in onze overtuiging uit door te stellen dat de betreffende (epistemische) kans is toe- of afgenomen. Bayes heeft ons de rekenregels gegeven waarmee we niet alleen frequentistische kansen maar ook graden van geloof en dus onze overtuiging, logisch en wiskundig correct kunnen updaten zodra er nieuwe relevante feiten bekend worden (Bayesian epistomology).17 17 Er wordt in de literatuur nog wel gediscussieerd over de vraag of ‘graden van geloof’ inderdaad aan exact dezelfde zgn. kansaxioma’s voldoen als frequentistische kansen. Deze discussie valt buiten het kader van dit artikel, maar wordt bijv. uitgebreid Odds Kansen kunnen op allerlei manieren worden aangegeven, bijvoorbeeld als een getal (vaak ‘P’ genoemd, naar probability) dat onder alle omstandigheden tussen de 0 en de 1 (of 0 procent en 100 procent) moet liggen. Daarnaast kennen we nog uitdrukkingen als ‘10 tegen 1 dat het morgen regent’ of ‘2 tegen 3 dat hij gaat winnen’ of ‘hooguit 1 tegen 100 dat ze dat niet wist’. Met deze manier van uitdrukken geven we niet de kans zélf weer, maar de verhouding tussen ‘de kans dat iets wel zo is’ en ‘de kans dat iets niet zo is’. Dit quotiënt noemen we de ‘odds’. In de Angelsaksische wereld is dit een gebruikelijke manier om kansen uit te drukken. In tegenstelling tot een kans P is de numerieke waarde van odds niet aan een maximum gebonden (miljoen tegen één = vrijwel 100 procent). Maar hoewel de numerieke waarde dus verschilt, zijn kansen en odds conceptueel hetzelfde. Grote kans betekent ook grote odds en vice versa. Als odds = 1 (dus als beide kansen even groot zijn; de breuk is immers 1), dan drukt dat ‘fiftyfifty’ uit, oftewel een kans van 50 procent voor beide scenario’s.18 Transposed conditional en prosecutor’s fallacy Een conditional is een ‘als’-stelling. Hiermee kan bijvoorbeeld een zogenoemde voorwaardelijke kans worden omschreven: ‘Als een dier een koe is, dan is de kans dat het vier poten heeft erg groot’. In een transposed conditional zijn als en dan (c.q. het ná deze woordjes geponeerde) ten onrechte verwisseld: ‘Als een dier vier poten heeft, dan is de kans dat het een koe is erg groot’. Het blijkt in de praktijk dat transposed conditionals vaak moeilijk te herkennen zijn, wat tot logische valkuilen en zelfs tot gerechtelijke dwalingen kan leiden. Het is daarom goed om een aantal voorbeelden van deze fout voor ogen te houden. Het zinnetje ‘Als iemand géén fraudeur is, dan is de kans dat hij de loterij wint erg klein’ mag niet worden omgedraaid tot: ‘Als iemand de loterij wint, dan is de kans dat hij géén fraudeur is erg klein’. Ook dit voorbeeld is nog wel aan te voelen. Maar als er nu eens een akelige loterij zou worden gehouden welke verpleegster het komende jaar de meeste sterfgevallen mee gaat maken? In dat geval – zo is helaas gebleken – is het voor veel mensen niet direct duidelijk dat het zinnetje ‘Als een verpleegster geen seriemoordenares is, dan is de kans dat ze een zo uitzonderlijk groot aantal sterfgevallen 18 weergegeven in W. Talbott, ‘Bayesian epistemology’, The Stanford Encyclopedia of Philosophy, Stanford (CA): Stanford University 2008. Hierin wordt ook uitgelegd dat de zgn. Dutch Book-argumenten een solide basis kunnen vormen op grond waarvan graden van geloof inderdaad Bayesiaans mogen worden bijgesteld. De grondslagen van de toepassing van de Bayesiaanse methodiek in het strafrecht worden bijv. verdedigd in S. Brewer (ed.), The philosophy of legal reasoning. Logic, probability, and presumptions in legal reasoning, New York: Routledge 2011. Als men een kans P wil omrekenen naar odds, dan geldt: odds = P / (1 – P), als men omgekeerd odds wil omrekenen naar P, dan geldt: P = odds / (1 + odds). November 2015 Menu 13 291 Het blijkt dat lang niet altijd wordt ingezien hoe veelzeggend juist de combinatie van (zwakke) bewijsmiddelen kan zijn. meemaakt erg klein’ niet mag worden omgedraaid tot: ‘Als een verpleegster een zo uitzonderlijk groot aantal sterfgevallen meemaakt, dan is de kans dat ze onschuldig is erg klein’. Toch is de logische structuur van deze omdraaiing exact gelijk aan die in de het voorbeeld van de loterij. Het gaat natuurlijk om Lucia de Berk: zij had die akelige loterij gewonnen.19 Vaak wordt bij een transposed conditional conceptueel vooruit geredeneerd (dat wil zeggen van oorzaak naar gevolg) waar had moeten worden teruggeredeneerd (dat wil zeggen van gevolg naar oorzaak). Een ‘terugwaartse’ vraag zou bijvoorbeeld kunnen zijn: ‘Gegeven een dood iemand, hoe is hij dan gestorven?’, oftewel: ‘Deze ogenschijnlijk gezonde dertiger is onverwacht dood aangetroffen, wat is de kans dat hij niet werd vermoord?’ (= vraag 1). Het antwoord op deze vraag mag nooit worden gelijkgesteld aan het antwoord op de ‘voorwaartse’ vraag, waarbij niet wordt uitgegaan van een aangetroffen lijk, maar juist wordt gevraagd wat de kans is dat iemand als lijk zal worden aangetroffen: ‘Als een levende, ogenschijnlijk gezonde dertiger niet wordt vermoord, wat is dan de kans dat hij onverwacht dood zal worden aangetroffen?’ (= vraag 2). Een plausibel antwoord op vraag 1 zou bijvoorbeeld kunnen zijn: ‘minstens 97 procent’, het antwoord op de vraag 2: ‘hooguit 0,3 procent’20 Door dat laatste getal te zien als antwoord op de eerste vraag zit men er dus een zeer grote factor naast. In dit soort gedaantes wordt de transposed conditional ook wel de ‘prosecutor’s fallacy’ genoemd.21 Omdat dit nooit zomaar een benaderingsfout betreft, maar een fundamentele denkfout die de intuïtieve kansinschatting makkelijk een astronomische factor de verkeerde kant kan opsturen, is deze fallacy een gevaarlijke logische valkuil in het strafrecht.22 4. De likelihood ratio ‘De likelihood ratio van een bevinding’ is hét kernbegrip van het Bayesiaanse denken. De likelihood ratio, die ook wel ‘bewijskracht’ of ‘diagnostische waarde’ wordt genoemd, drukt de verhouding van twee likelihoods (waarschijnlijkheden) uit, uitgaande van twee elkaar uitsluitende scenario’s: 19 20 21 22 In wiskundige notatie wordt het denken – als altijd – veel makkelijker. Met de P (van probability) duiden we een kans aan en met het verticale streepje ‘ | ’ geven we een conditie aan. Het streepje mag worden uitgesproken als ‘als’ of ‘uitgaande van’ of ‘gegeven dat’ of ‘op voorwaarde dat’. De kans dat een onschuldige verpleegster x-sterf­gevallen meemaakt is dus P (x-sterfgevallen | onschuld), oftewel in woorden: de kans op x-sterfgevallen, uitgaande van onschuld. Deze kans is erg klein. Toch hoeven we alleen maar te onthouden dat P (A | B) niet gelijk is aan P (B | A) – denk aan de koe met de vier poten – om in te zien dat Lucia de Berk desondanks heel goed onschuldig kan zijn. Dit is een illustratie van de orde van grootte op basis van enkele redelijke statistische aannames. Soms wordt ook de hieraan verwante fout van het negeren van de zgn. base rate een prosecutor’s fallacy genoemd. I.W. Evett, ‘Avoiding the transposed conditional’, Science and Justice 1995, nr. 3, p. 127-131. 1. d e kans dat deze bevinding zou zijn opgetreden als we uitgaan van het eerste scenario (in ons geval het dader­ scenario); 2. d e kans dat deze bevinding zou zijn opgetreden als we uitgaan van het tweede scenario (in ons geval het onschuldscenario). De verhouding van deze twee kansen (dat wil zeggen de eerste kans gedeeld door de tweede) definieert de likelihood ratio en drukt de bewijskracht uit. Deze definitie van likelihood ratio houdt direct verband met het achterliggende principe van de Bayesiaanse methodiek: het scenario dat het minste ‘toeval’ nodig heeft om de waargenomen feiten te kunnen verklaren, wordt door het daadwerkelijk opgetreden zijn van die feiten gesteund. Als de kans op het optreden van een bepaalde bevinding onder het eerste scenario groter is dan onder het tweede scenario, dan biedt die bevinding dus steun aan het eerste scenario: de waarschijnlijkheid van het eerste scenario neemt toe. We zeggen dan dat de bevinding een bewijskracht richting het eerste scenario heeft. De numerieke waarde van die bewijskracht is precies het genoemde quotiënt. (We willen overigens benadrukken dat het LR-begrip zich moeiteloos laat veralgemeniseren voor meer dan twee in competitie zijnde hypotheses. Dit valt echter buiten het kader van dit artikel.) Voorbeeld 1 Stel er zijn twee scenario’s, te weten dat de verdachte gisteren op straat gevochten heeft óf dat hij niet gevochten heeft. De bewijskracht van de bevinding dat de verdachte een vers blauw oog heeft (‘vers’ wil zeggen: één dag oud) richting het eerste scenario is dan gelijk aan deze likelihood ratio: de kans dat de verdachte een blauw oog zou hebben opgelopen als hij gisteren had gevochten de kans dat hij de afgelopen dag een blauw oog zou hebben opgelopen zonder te vechten Let wel: de voor deze likelihood ratio te beantwoorden vraag is dus niet wat de kans is dat de verdachte gisteren gevochten heeft. We hoeven alleen maar te weten wat de kans op een blauw oog zou zijn als deze verdachte al dan niet vecht. Uit medische statistieken valt wel iets te achterhalen over de kansen per dag om een blauw oog op te lopen zonder te vechten (vallen, ergens tegenop lopen enzovoort) en ook wel iets over de kans op een blauw oog als men wel vecht. Uit deze algemene (dat wil zeggen niet-zaakspecifieke) gegevens valt dus op een weliswaar benaderende maar wel objectieve manier de bewijskracht van dit blauwe oog af te schatten. November 2015 Menu 14 292 Voorbeeld 2 Omdat de likelihood ratio gedefinieerd is als een verhouding van twee grootheden, kunnen we soms een likelihood ratio ook al tot op zekere hoogte schatten zonder de beide kansen expliciet te kennen. We hoeven bijvoorbeeld niet per se te weten wat de kans is dat iemand normaal gesproken van een keukentrapje zal vallen om te kunnen inschatten dat die kans flink groter zal zijn als hij veel gedronken heeft. De likelihood ratio van het ‘van de trap vallen’ voor de hypotheses van ‘al dan niet dronken’ zouden we dan bijvoorbeeld in eerste benadering kunnen baseren op de statistieken die voor dronkenschap en verkeersongelukken gelden. Advocaten proberen vaak de bewijsmiddelen één voor één ‘af te schieten’, in de hoop en verwachting dat de rechter niet al te Bayesiaans zal redeneren. Let wel: denk goed na over wat precies de bevinding is waaraan je een likelihood ratio wilt toekennen. Als je in een procesverbaal leest dat getuige A verdachte B heeft gezien, is de bevinding niet ‘verdachte B was daar ter plekke’, maar slechts ‘in het proces-verbaal staat dat getuige A verdachte B heeft gezien’. Bij het inschatten van de likelihood ratio moet dan bijvoorbeeld nog worden verdisconteerd dat getuige B zich kon vergissen, dat getuige B misschien heeft gelogen en dat de verbalisant zaken misschien onjuist heeft weergegeven. In deel twee zullen we nog veel voorbeelden van likelihood ratio’s tegenkomen bij het behandelen van concrete straf­ zaken. 5. De rekenregel van Bayes Volgens de rekenregel van Bayes is de likelihood ratio van een bevinding de updatefactor waarmee we de waarschijnlijkheidsverhouding tussen het daderscenario en het onschuldscenario (dus de odds op daderschap) mogen vermenigvuldigen: nieuwe odds = oude odds × likelihood ratio Dus als je je overtuiging over het daderschap van de verdachte (uitgedrukt in de odds op daderschap) wilt bijstellen naar aanleiding van een bepaalde bevinding, moet je de overtuiging die je had vóórdat je die bevinding in beschouwing had genomen vermenigvuldigen met de likelihood ratio van die bevinding. Het product geeft je de wiskundig correcte nieuwe overtuiging over het daderschap van de verdachte die je op grond van de feiten mag (eigenlijk moet) hebben. Vandaar ‘bewijskracht’ als synoniem voor likelihood ratio. We passen dit toe op ons eerdere ‘vecht’-voorbeeld. Als we, vóórdat we wisten dat de verdachte een ‘vers’ blauw oog had, al op andere gronden een overtuiging van – zeg – vijftien tegen één hadden dat de verdachte gisteren op straat gevochten had,23 en we bijvoorbeeld uit medische statistieken hadden geleerd dat ‘de kans dat men een blauw oog oploopt bij een straatgevecht’ ongeveer vijfhonderd keer groter is dan ‘de kans per dag dat men zonder straatgevecht een blauw oog oploopt’, dan kunnen we nu onze aanvankelijke overtuiging van 15 tegen 1 updaten met een factor 500. We mogen concluderen dat scenario 1 nu 15 × 500 = 7500 keer waarschijnlijker is dan scenario 2. Een likelihood ratio met een getalswaarde groter dan 1 biedt dus steun aan het eerste scenario (lees: daderscenario), terwijl een getalswaarde kleiner dan 1 wijst in de richting van het tweede scenario (onschuld). Een LR met de waarde 1 is neutraal: de betreffende bevinding was onder beide scenario’s even waarschijnlijk (of even onwaarschijnlijk) en kan ons niets nieuws leren. Het is belangrijk om te beseffen dat het enkele feit dat een bepaalde bevinding onder het daderscenario ‘zeer te verwachten’ was, dus niet automatisch steun biedt aan dat scenario. Alleen wanneer die bevinding onder het onschuld minder te verwachten was, is er een bewijskracht. Hetzelfde geldt voor bevindingen die onder een bepaald scenario ‘zeer onwaarschijnlijk’ waren. In de praktijk kan het best voorkomen dat een bepaalde bevinding onder beide scenario’s zeer onwaarschijnlijk was. En dan gaat het erom: wat bedoelen we met ‘zeer onwaarschijnlijk’? Het kan zinnig zijn om middels een vergelijking van de numerieke waarde van beide onwaarschijnlijkheden te proberen uitsluitsel te geven over het al dan niet neutraal zijn van de likelihood ratio. De verhouding tussen twee kleine kansen kan namelijk nog steeds een groot getal zijn.24 De rekenregel van Bayes kan voor iedere nieuwe bevinding weer opnieuw worden toegepast, mits deze bevindingen onafhankelijk van elkaar zijn (zie daarover paragraaf 7) en steeds onder dezelfde hypotheses worden beschouwd. De nieuwe odds die men via de eerste bevinding uit de oude odds verkreeg, dienen in een volgende stap juist als de oude odds voor de tweede bevinding. Men krijgt dan als het ware een keten van bevindingen, elk met zijn eigen updatefactor. Dus drie bevindingen met likelihood ratio’s (LR1, LR2 en LR3) leveren samen – via het herhaald toepassen van de reken­ regel – een gecombineerde updatefactor op van LR1 × LR2 × LR3. Let wel: in tegenstelling tot het traditionele ‘weegschaal’beeld van de rechtspraak, is de gezamenlijke bewijskracht dus niet de (optel)som, maar het (vermenigvuldigings)product van hun afzonderlijke bewijskrachten. 23 24 We kiezen dit getal hier willekeurig ten dienste van het rekenvoorbeeld, maar het zou bijv. kunnen samenhangen met – we noemen maar iets – onze inschatting van de betrouwbaarheid van een aangifte. De LR zou dan bijv. de verhouding kunnen zijn tussen twee kansen van 1/1000 en 1/100.000. Beide kunnen worden omschreven met ‘zeer onwaarschijnlijk’, maar de LR heeft dan wel een waarde van 100. November 2015 Menu 15 Zo kunnen onafhankelijke bewijsmiddelen in een strafzaak dus op een correcte manier worden gecombineerd. Aan elke bevinding wordt een likelihood ratio toegekend, een getal dat de bewijskracht uitdrukt. Door die getallen met elkaar te vermenigvuldigen verkrijg je de gecombineerde bewijskracht. 6. De rekenregel van Bayes werkt anders dan onze intuïtie 293 Hoe groot de onzekerheid in de kansinschatting ook is, door een likelihood ratio te bepalen hebben we in elk geval de juiste vraag gesteld. Het feit dat vermenigvuldigen zoveel ‘sneller’ tot zeer grote of zeer kleine getallen kan leiden dan optellen of aftrekken, is een van de redenen dat de uitkomst soms contra-intuïtief kan overkomen. Een bevinding met een LR van 5 is in zekere zin een zwakke aanwijzing. Onder de aanname van daderschap was deze bevinding slechts vijf keer waarschijnlijker dan onder aanname van onschuld. Op zichzelf natuurlijk niet doorslaggevend. Maar stel nu eens dat de aanklager vijf zwakke (maar wel onafhankelijke!) aanwijzingen aandraagt, met likelihood ratio’s van bijvoorbeeld 10, 2, 5, 4 en 15. Dan zou je geneigd kunnen zijn om deze bewijskrachten slechts op te tellen en tot ongeveer 30 à 40 te komen; nog steeds niet heel overtuigend. Maar correct gecombineerd leveren die vijf bevindingen een bewijskracht op van 10 × 2 × 5 × 4 × 15 = 6000, een meer dan honderd keer sterkere aanwijzing richting daderschap dan de sommatie oplevert. Als de odds op daderschap eerst ‘10 tegen 1’ waren, worden ze nu ‘60.000 tegen 1’. Het blijkt dat lang niet altijd wordt ingezien hoe veelzeggend juist de combinatie van (zwakke) bewijsmiddelen kan zijn. Dat komt doordat de bewijsmiddelen nog te makkelijk intuïtief en vanuit ‘gezond verstand’ optellend worden gewogen, in plaats van dat expliciet zowel de aparte likelihood ratio’s alsook de gecombineerde (= vermenigvuldigde) bewijskracht aan bod komen. Dit leidt er soms toe dat, ondanks de veelgebruikte formulering ‘... in onderling verband en samenhang gezien ...’, de bewijsmiddelen juist niet worden gekwantificeerd en in samenhang gewogen, maar dat van elk bewijsmiddel slechts in een soort ‘alles of niets’-benadering wordt bekeken of het op zich doorslaggevend is. Advocaten proberen daarom vaak de bewijsmiddelen één voor één ‘af te schieten’, in de hoop en verwachting dat de rechter niet al te Bayesiaans zal redeneren. Ook het omgekeerde komt natuurlijk voor. Een zaak begint met een op zich goed gefundeerde verdenking, zonder dat later wordt ingezien dat de combinatie van een aantal zwakke aanwijzingen richting onschuld veel sterker is dan de oorspronkelijke reden voor verdenking. Dit is het verhaal achter veel gerechtelijke dwalingen en daarmee een krachtig argument voor een Bayesiaanse aanpak. 7. In deze vorm is de rekenregel bedoeld voor onafhankelijke bevindingen Het is al eerder benadrukt: bij het op deze manier combineren van de bewijskrachten van afzonderlijke bevindingen moeten we er wel op letten dat de bevindingen onafhankelijk zijn. Een voorbeeld: stel dat bekend is dat de dader van een misdrijf een opvallend grote en forse man was. Dan heeft de bevinding dat de verdachte schoenmaat 54 heeft een LR groter dan 1, dus wijzend in de richting van daderschap. Immers: uitgaande van daderschap is de kans op schoenmaat 54 groter dan wanneer de verdachte een willekeurige onschuldige burger is. Datzelfde geldt ook voor de bevinding dat de verdachte een lengte heeft van 1,98 en voor de bevinding dat hij 140 kilo weegt. Het is echter onjuist om alle drie deze bevindingen afzonderlijk te gebruiken, aangezien het duidelijk is dat schoenmaat, lengte en gewicht met elkaar samenhangen: het bij een onschuldige optreden van de ene bevinding, vergroot de kans op het optreden van de andere bevindingen. Deze drie bevindingen zijn niet onafhankelijk. Ze moeten daarom – enigszins benaderend – samen worden gezien als één bevinding, anders bestaat het gevaar van ‘dubbeltelling’.25 In de praktijk zal soms de neiging voorkomen om bevindingen die slechts heel licht gecorreleerd zijn toch van een aparte likelihood ratio te voorzien. Men maakt dan een benaderingsfout. Hoewel die fout normaal gesproken kleiner is dan de benaderingsfouten die sowieso samenhangen met de noodzakelijke kansinschattingen, moet men hier voorzichtig mee zijn. Men kan, uitgaande van de belangrijkste onafhankelijke bevindingen, van de resterende bevindingen bekijken met welke bevindingen ze welke afhankelijkheid vertonen. Bepaalde sets van afhankelijke bevindingen kunnen dan vaak worden geclusterd en samen van één samenvattende LR worden voorzien. Er bestaan wiskundige uitdrukkingen voor de gecombineerde LR van twee of meer afhankelijke bevindingen. Dat valt buiten het kader van dit artikel. Een andere strategie zou kunnen zijn om bevindingen waarvan de onafhankelijkheid ter discussie staat geheel uit de analyse weg te laten. Soms kan dan nog steeds een veelzeggende boven- of ondergrens voor de onderlinge waarschijnlijkheid van de hypotheses worden bepaald. Het is echter ook denkbaar dat men in sommige zaken het ketenmodel zal moeten verlaten omdat een zinnige analyse alleen middels een Bayesiaans netwerk mogelijk is. 8. Waarom een (sporen)deskundige alleen een likelihood ratio zal kunnen rapporteren Er is – behalve het hiervoor genoemde – nog een belangrijke reden om in likelihood ratio’s te leren denken. In een deskundigenrapport zal de conclusie vaak geen andere vorm kunnen of mogen hebben dan die van een likelihood ratio. Alleen binnen het Bayesiaanse denken is zo’n gerapporteerde LR dan op een 25 Zoals gezegd: de Bayesiaanse methodiek kan wiskundig prima met afhankelijke bevindingen omgaan, alleen krijgt men dan niet een keten van likelihood ratio’s, maar een zgn. Bayesiaans netwerk. Dit valt buiten het bestek van dit artikel. November 2015 Menu 16 294 bruikbare manier te interpreteren, namelijk als een updatefactor voor de (in odds uitgedrukte) overtuiging omtrent de waarschijnlijkheidsverhouding tussen twee elkaar uitsluitende hypotheses. Voorbeeld Ook de recherche zou Bayesiaans moeten gaan werken. Volgens het OM is een dadergerelateerde vingerafdruk op de plaats delict afkomstig van de verdachte. Volgens de verdediging is de match puur toeval. De vraag die de rechter uiteindelijk moet beantwoorden (en die dus misschien ook wel in deze vorm aan de deskundige werd gesteld) luidt: ‘Is deze vingerafdruk van de verdachte?’ Stel nu dat de deskundige iets rapporteert in de trant van: ‘Deze afdruk is waarschijnlijk afkomstig van de verdachte.’ Het OM en de rechtbank zullen meestal tevreden zijn met dit antwoord. Dat zou echter onterecht zijn. Een deskundige mag op grond van enkel de match nooit een waarschijnlijkheid rapporteren over de herkomst van de afdruk. Dit verbod komt op veel mensen bijzonder contra-intuïtief over. Maar bedenk dat er nog andere bevindingen een rol kunnen spelen. Stel bijvoorbeeld dat deze verdachte met een waterdicht alibi komt. Dan is hij dus tijdens het misdrijf niet op de plaats delict geweest en is de dadergerelateerde afdruk, ook als de match vrijwel perfect zou zijn, hoogstwaarschijnlijk niet van hem. Een deskundige die heeft gerapporteerd dat het waarschijnlijk wel zo is, heeft onzin uitgekraamd. Of stel – omgekeerd – dat getuigen duidelijk hadden gezien hoe de verdachte op de plaats delict het misdrijf pleegde. Dan was de afdruk hoogstwaarschijnlijk wel van hem afkomstig en zou een deskundige die daarover nog een te ruime mate van twijfel liet bestaan verkeerd rapporteren. Aangezien we van een sporendeskundige ook niet kunnen vragen om de volledige context van de zaak mee te nemen in zijn rapportage, moeten we concluderen dat de aan hem te stellen vraag niet mag zijn: ‘Wat is de kans dat deze afdruk van deze verdachte afkomstig is, gegeven hun match?’, maar: ‘Wat is de LR van deze match?’ Het gaat dan in wezen om ‘de kans dat een willekeurig iemand even goed zou matchen met de “vingerafdruk van de dader” als de verdachte’. Het antwoord op die ‘zeldzaamheidsvraag’ is geheel onafhankelijk van de overige bevindingen (alibi, herkenning enzovoort). De betreffende LR weerspiegelt dus een zuivere, contextvrije bewijskracht en vormt een kant-en-klare schakel in de Bayesiaanse bewijsketen. Ook het NFI zal daarom in principe altijd een LR rapporteren.26 De hiervoor besproken fout is in wezen een transposed conditional-fout. Het zinnetje ‘Als deze verdachte de bron is, dan is deze match waarschijnlijk’ wordt ten onrechte omge26 Die likelihood ratio wordt door het NFI soms nog gerapporteerd in de vorm van woorden als ‘iets waarschijnlijker’ of ‘zeer veel waarschijnlijker’. Er is dan een door het NFI bijgeleverd tabelletje nodig om deze omschrijvingen weer terug te vertalen naar (een range van) getallen, die typisch een onzekerheid van een factor 10 bevatten. Het zou volgens ons aan te bevelen zijn om likelihood ratio’s altijd te rapporteren in de vorm van een getal met een bijbehorende onzekerheidsmarge. draaid tot: ‘Als deze match optreedt, dan is de verdachte waarschijnlijk de bron’. Voor veel mensen lijkt dit wellicht een louter theoretisch onderscheid zonder enige praktische waarde. Maar zoals we in deel 2 zullen zien bij de analyse van de zogenoemde Carnavalsmoord, was het misschien wel precies een soortgelijke foutieve formulering die in die zaak tot een verkeerde beoordeling van de ware toedracht heeft geleid.27 9. Enkele overwegingen over het maken van grove schattingen Men kan de likelihood ratio’s niet altijd bepalen zonder soms grove schattingen te maken. Een LR kan daardoor in de praktijk best een onzekerheid van, zeg, een factor 10 of meer bevatten. Stel bijvoorbeeld dat het voor het onschuldscenario in een smokkelzaak van belang is hoe vaak passagiers per abuis de verkeerde koffer van de bagageband pakken. Daar valt, met wat onderzoek, wel degelijk iets over te zeggen, maar natuurlijk niet heel exact. Een factor twee of drie onzekerheid lijkt het hoogst haalbare. Men zou dan, ten onrechte, kunnen denken dat de betreffende onnauwkeurigheden te groot zijn om een Bayesiaanse berekening enige zin te laten hebben. Soms zelfs zal het maken van een schatting alleen subjectief mogelijk zijn en daardoor geheel onverdedigbaar lijken. Wij willen daar de volgende argumenten tegenover stellen. • De schattingen zijn hoe dan ook onvermijdelijk. Iedereen die bepaalde bevindingen in haar oordeel betrekt maakt daarmee per definitie een kansinschatting. Dan kan beter expliciet gebeuren dan (óók voor jezelf ) onzichtbaar en oncontroleerbaar, op het gevoel, in een verborgen hoekje van de geest.28 • Als we een getal niet zeker weten, hebben we de neiging om uit te wijken naar formuleringen als ‘hoogst onaannemelijk’ of ‘zeker niet uit te sluiten’. Maar deze woorden bevatten natuurlijk net zo goed subjectieve elementen en enorme onzekerheden. Heeft iemand met ‘hoogst onaannemelijk’ een kans van 5 procent bedoeld? Of 0,1 procent? Of 0,005 procent? Als de lezer deze vraag niet kan beantwoorden, moeten we ons realiseren dat er dus misschien wel een factor 1000 onzekerheid in dat zinnetje verstopt zat (dat wil zeggen het verschil tussen 5 procent en 0,005 procent). Opnieuw is het essentiële punt: als we een bepaalde bevinding willen laten meewegen bij ons oordeel en ons oordeel dus mede gebaseerd zal zijn op hoe we de bijbehorende (on)waarschijnlijkheden inschatten, dan is het belangrijk 27 28 Het betrof een niet helemaal volmaakte kogelmatch. In plaats van de desbetreffende LR te rapporteren, vertelde een deskundige dat slechts kon worden gezegd dat de kogel ‘waarschijnlijk’ (maar niet ‘zeer waarschijnlijk’) uit een bepaald wapen afkomstig was. Uit de overige bevindingen bleek echter dat die kans groter dan 99,999 procent was. Ook bij een slechte match (= kleine LR) kan wel degelijk een hoge kans horen en vice versa. Daarom moet altijd een LR worden gerapporteerd. Let wel: men mag nooit de inschatting van de LR laten afhangen van de inschatting dat de verdachte al dan niet onschuldig is. Dat zou neerkomen op een cirkelredene­ ring, aangezien de kans op onschuld mede wordt bepaald door die LR. November 2015 Menu 17 • • • • 295 Een van de grootste verdiensten van de Bayesiaanse methodiek is het feit dat de inherente onzekerheden in de waarheidsvinding correct worden gekwantificeerd. dat men zichzelf (en anderen) bewust maakt van de mate van onzekerheid die met die inschatting samenhangt. Dit kan door van woorden over te stappen op getallen en daarbij goed na te denken over de bijbehorende onzekerheidsmarge. Over de onzekerheid in getallen kun je zinniger en gerichter discussiëren en communiceren dan over de onzekerheid in een verbale omschrijving. Daarin zit hem de winst. Het enkele feit dat men zich expliciet bezig houdt met het getalsmatig nadenken over de bevinding kan ertoe leiden dat men de onzekerheid vaak flink kan verkleinen ten opzichte van de meer ‘verbale’ formuleringen. Ook dat is winst. Een onzekerheid van een factor 10 is al veel beter dan een onzekerheid van een factor 100. Ja, ook een factor 10-onzekerheid is nog best veel. Maar dat los je niet op door dan maar weer terug te keren tot de (schijn)veiligheid van een verbale omschrijving. Door met likelihood ratio’s te werken hoeft men niet noodzakelijkerwijs de afzonderlijke kansen op de bevinding onder aanname van de beide hypotheses in absolute zin te kennen, het gaat slechts om de verhouding. Men hoeft bijvoorbeeld niet expliciet te weten wat onder het dader­ scenario de kans was op bepaalde uitlatingen van een getuige, om soms toch te kunnen oordelen dat die uitspraak onder het daderscenario – zeg – minstens tien keer waarschijnlijker was dan onder het onschuldscenario. Hoe groot de onzekerheid in de kansinschatting ook is, door een likelihood ratio te bepalen hebben we in elk geval de juiste vraag gesteld. We hebben meer aan een onzeker antwoord op de juiste vraag dan aan een exact antwoord op de verkeerde. Ook kan het denken in likelihood ratio’s laten zien welk extra onderzoek er eventueel nodig is. In de praktijk valt het mee. Subjectief is nog niet hetzelfde als irrationeel. In deel 2 zullen we naar echte rechtszaken gaan kijken en laten zien dat het vaak doenlijk is om relevante schattingen te maken, of althans om redelijke bovenof ondergrenzen in te schatten. Het leidt tot zinnige conclusies. En aan het feit dat onzekerheden nu expliciet zichtbaar worden in plaats van comfortabel verborgen te blijven, valt te wennen. Sterker nog, uiteindelijk voelt het juist prettiger. Tegenover het wellicht moeilijk te aanvaarden feit dat de kansinschattingen onvermijdelijk soms grote onzekerheidsmarges zullen bevatten, staat de wellicht troostrijke gedachte dat het tijdens de rechtszaak aan alle partijen vrij staat om hun eigen kansinschattingen daarvoor in de plaats te stellen en die vervolgens – dat dan natuurlijk wel – zo goed mogelijk te verdedigen. In die dialectiek wordt wellicht de waarheid dichter benaderd. Wat echter niet is toegestaan, is om over de bewijskracht alleen maar te zeggen: ‘Ik weet het niet, ik heb werkelijk geen enkel idee’ en desondanks de betreffende bevinding mee te laten wegen in het uiteindelijke oordeel. Maar wat als nu blijkt dat de onzekerheid in de benodigde kansinschattingen, ondanks alle pogingen tot het inperken van marges, dusdanig groot blijft dat we bijvoorbeeld slechts kunnen concluderen dat de kans op daderschap ergens tussen de 1 procent en 99,99 procent ligt? Maakt dat de Bayesiaanse aanpak in dat geval niet waardeloos? Nee, integendeel. Dan hebben we te maken met wat juist een van de grootste verdiensten van de Bayesiaanse methodiek is, namelijk het feit dat op deze manier de inherente onzekerheden in de waarheidsvinding correct worden gekwantificeerd en expliciet zichtbaar gemaakt. Het is belangrijk om te weten wat men (nog) niet weet. Zonder aanvullend onderzoek zal de blootgelegde onzekerheid niet verdwijnen. De opzet van een Bayesiaanse analyse is volkomen transparant en bestaat uit (1) de expliciete lijst van bevindingen, (2) de prior en (3) de materiële kansinschattingen. Over die opzet kan men gericht nadenken. Een belangrijke vraag is bijvoorbeeld of wel alle relevante bevindingen zijn meegenomen in de analyse en of wel alle bevindingen inderdaad onafhankelijk zijn. Maar gegeven de specifieke opzet van de betreffende analyse zal men met enkel verbale formulering niet makkelijk kunnen verhullen dat er onvoldoende gegevens zijn om een duidelijke conclusie te kunnen trekken. 10. Bayesiaans denken als middel tegen tunnelvisie en ‘primacy effect’ Dat het Bayesiaanse model van bewijsinterpretatie zulk krachtig gereedschap biedt voor de waarheidsvinding is niet uitsluitend te danken aan de wiskunde en de logica. Die kracht komt ook voort uit de symmetrie in het denken die dwingend wordt opgelegd: voor het bepalen van de noodzakelijke likelihood ratio’s moet elke bevinding, elk bewijsmiddel, expliciet tweemaal worden beschouwd: eerst onder aanname van daderschap, daarna onder aanname van onschuld. Dat is overigens moeilijker dan het lijkt: het aangeleverd dossier met belastend materiaal en het frame van de tenlastelegging maken het zuiver vanuit het onschuldscenario denken soms intuïtief lastig. Maar door die inspanning toch te verrichten worden automatisch wél enkele belangrijke cognitieve instincten bestreden die vaak de waarheidsvinding belemmeren, zoals de zogenoemde confirmation bias (tunnelvisie) en het primacy effect.29 Het kan in een goed toegepaste Bayesiaanse methodiek simpelweg niet voorkomen dat van de bevindin29 Bijv. P.E. Tetlock, ‘Accountability and perseverance of first impressions’, Social Psychology Quarterly 1983, p. 285‑292. November 2015 Menu 18 296 gen alleen wordt gezien hoe ze passen bij een van de twee scenario’s, terwijl onzichtbaar blijft wat ze voor het andere scenario betekenen. Dit lost natuurlijk niet alle problemen op. In de praktijk van het strafrecht komt het ook wel voor dat de verzameling relevante bevindingen zelf asymmetrisch samengesteld is. Dat wil zeggen dat reeds bij het verzamelen van het bewijs de tunnelvisie een rol heeft gespeeld. Er is geen enkele manier waarop een analyse van de wél verzamelde bevindingen dit effect weer kan corrigeren. Soms kan een rechter opmerken dat bepaalde voor de hand liggende vragen niet gesteld zijn of dat relevant sporenonderzoek ontbreekt. Maar om dit probleem echt op te lossen, zou ook de recherche Bayesiaans moeten gaan werken.30 Het Bayesiaans denken legt een intrinsieke symmetrie op tussen dader- en onschuldhypothese en vergt een statistische blik op de werkelijkheid. Dat is voor veel juristen onwennig. 11. Samenvatting en vooruitblik op deel 2 Wat er nu nog ontbreekt, is een startpunt. Als de likelihood ratio’s allemaal updatefactoren zijn, dan moet er natuurlijk eerst iets zijn om te updaten: dat is de prior. Daarvan wordt vaak gezegd dat het onze ‘beginovertuiging’ weergeeft dat iemand ‘het gedaan heeft’. Tegen elke verdachte moet ten minste een redelijk vermoeden van schuld bestaan, mogelijk is er zelfs sprake van ernstige bezwaren. Die ‘beginovertuiging’ moet nog worden gekwantificeerd en het is volgens ons belangrijk om voor ogen te houden dat deze prior zeker niet voorafgaat aan het bewijsproces of los staat van de bewijsmiddelen. Integendeel, de prior moet altijd gebaseerd zijn op de feiten en omstandigheden van de betreffende zaak, hetzij specifieke bevindingen, hetzij relevante algemene kennis, bijvoorbeeld in de vorm van statistieken. De prior heeft dus geen vaste waarde (er kunnen in reële zaken zowel zeer kleine als zeer grote priors optreden), maar moet per geval worden bekeken. In deel 2 zullen we dit uitgebreid behandelen en daarbij een praktisch bruikbare benadering voorstellen voor het vaststellen van Bayesiaanse priors. Ook zonder prior kunnen likelihood ratio’s al nut hebben. Ze vormen namelijk – zoals gezegd – niet alleen een goed middel tegen een aantal veelvoorkomende cognitieve instincten, maar kunnen daarnaast ook tot allerlei nuttige inzichten leiden, mits men maar helder beseft wat er wel en wat er zeker niet uit kan worden afgeleid. Likelihood ratio’s zijn de Bayesiaanse, numerieke uitdrukkingen van bewijskracht. Wat daarmee dus wél kan is het onderling combineren en vergelijken van de bewijskracht van verschillende bewijsmiddelen. Wat nooit kan met alleen maar likelihood ratio’s (dat wil zeggen zonder een prior) is een eindoordeel vellen over daderschap of onschuld. Men zou bijvoorbeeld door middel van likelihood 30 De recente werkwijze met ‘tegenspraakteams’ is overigens al een geweldige stap in de goede richting. ratio’s wel kunnen concluderen dat in een bepaalde zaak twee bewijsmiddelen (zeg een vingerafdrukmatch en een herkenning door een getuige) samen genomen ongeveer even sterk richting daderschap wijzen als het alibi richting onschuld wijst. Deze drie bewijsmiddelen kan men dan als het ware op een kwantitatieve en logisch goed onderbouwde manier tegen elkaar wegstrepen. Dat kan een nuttig inzicht zijn. Maar nooit zal men het eindoordeel over schuld of onschuld kunnen baseren op alleen likelihood ratio’s. Er zijn situaties denkbaar (en in de praktijk ook voorgekomen) dat de likelihood ratio’s bijzonder sterk in de richting van daderschap wijzen, terwijl tegelijkertijd de a priori-kans op daderschap zo ontzettend klein is dat het product van de prior met likelihood ratio’s – want daar gaat het uiteindelijk om – nog steeds alle ruimte voor onschuld laat. Of vice versa. Kortom, het denken in likelihood ratio’s is altijd nuttig, maar een Bayesiaanse analyse zonder prior blijft incompleet – alleen met een prior kan een eindconclusie worden bereikt. 12. Twijfels over de toepasbaarheid? Een laatste aspect dat hier moet worden genoemd, is de kritiek die sommige deskundigen (bijvoorbeeld Van Koppen en Derksen) wel eens hebben geuit over de praktische toepasbaarheid van Bayesiaanse technieken binnen de rechtspraak. Van Koppen steunt het denken in likelihood ratio’s, maar stelt dat het vinden van priors niet goed mogelijk zou zijn (eigenlijk zegt hij dat het volstrekt onmogelijk is).31 Derksen maakt zich eigenlijk niet zozeer zorgen over de geldigheid van een Bayesiaanse berekening (integendeel), als wel over het risico dat bijvoorbeeld rechters de resultaten van een dergelijke berekening verkeerd zullen interpreteren. We kunnen deze discussie hier niet helemaal behandelen, maar willen verwijzen naar een online vrij beschikbare publicatie van Marjan Sjerps en Charles Berger (beiden werkzaam bij het NFI): Het Bayesiaanse model biedt een helder zicht op een complexe werkelijkheid.32 Deze publicatie biedt, hoewel alweer enkele jaren oud, in een kort en zeer leesbaar bestek een paar heldere inzichten over hoe de praktijk van de strafrechtspraak en de Bayesiaanse methodiek harmonieus kennis met elkaar zouden kunnen maken en welke misverstanden daarbij liefst moeten worden vermeden. Enkele zinnetjes uit deze publicatie wil ik met instemming citeren. 31 32 P. van Koppen, Overtuigend bewijs, Den Haag: Boom Juridische uitgevers 2011, hfd. 9 (‘Rekenen met bewijs’). M. Sjerps & Ch. Berger Het Bayesiaanse model biedt een helder zicht op een complexe werkelijkheid, Den Haag: Nederlands Forensisch Instituut 2011. November 2015 Menu 19 “Toepassing van het Bayesiaanse model laat zien dat de werkelijkheid ingewikkeld is. Het is dus niet zo dat het model die complexiteit toevoegt.” “De correcte reactie op een dergelijke zorg [dat Bayesiaanse resultaten verkeerd zouden worden geïnterpreteerd] is het informeren en bijscholen van rechters, niet het overboord gooien van een wetenschappelijk juiste methode.” Nooit zal men het eindoordeel over schuld of onschuld kunnen baseren op alleen likelihood ratio’s. Van recentere datum zijn bijvoorbeeld publicaties van Barbara van den Berg waarin zij pleit voor een bredere toepassing van het Bayesiaanse denken binnen het strafrecht33 en van Henry Prakken34 en Jaap de Groot35 waarin zij zich juist kritisch 33 34 35 Van den Berg, a.w. H. Prakken, ‘Strafrechtelijk bewijzen: met Bayes of met verhalen? Of is er een derde weg?’, Expertise en Recht 2014, afl. 1, p. 4-19. De Groot, a.w. 297 hebben uitgelaten over (de toepassingsmogelijkheid van) sommige aspecten van de Bayesiaanse methodiek. Prakken schrijft: “De eis om altijd een schatting van de a-priorikansen te maken leidt bij graden van geloof tot nog een probleem. Het maakt Bayesiaanse redeneringen [...] namelijk circulair, omdat de conclusie sterker gerechtvaardigd wordt naarmate men er vooraf meer in gelooft.” En hij bespreekt bijvoorbeeld ‘verhaal en verankering’ en ‘argumentatie’ als door sommigen gebruikte alternatieve modellen voor bewijswaardering. De Groot is vooral bang dat de Bayesiaanse methodiek niet praktisch toepasbaar zou zijn in de rechtspraak. We zullen zowel de zorgen over het vinden van bruikbare priors (Van Koppen, Prakken) als de zorgen over de praktische toepasbaarheid (De Groot) proberen weg te nemen in deel 2. Daarover kan de lezer dan zelf oordelen. November 2015 Menu 20 F. Alkemade en H.G.W. Stikkelbroeck, ‘In onderling verband en in samenhang bezien: een praktische uitleg van een Bayesiaans aanpak in het strafrecht deel 2: Het bepalen van de Bayesiaanse Prior Odds in strafzaken’, Trema november 2015, p. 340‐354 Menu 21 340 Frans Alkemade en Harry Stikkelbroeck Dr. F. Alkemade werkt als cursusdocent voor de SSR en treedt af en toe op als Bayesiaans deskundige in strafzaken. Ook is hij fysicus en als atmosfeeronderzoeker verbonden geweest aan onder andere RIVM, KNMI, Universiteit Utrecht en SRON. Mr. H.G.W. Stikkelbroeck werkt als senior raadsheer bij het hof Arnhem-Leeuwarden.1 In onderling verband en in samenhang bezien: een praktische uitleg van een Bayesiaanse aanpak in het strafrecht deel 2 Het bepalen van de Bayesiaanse ‘prior odds’ in strafzaken In dit deel van ons tweeluik over de toepasbaarheid van het Bayesiaans denken in het strafrecht willen we laten zien hoe we in strafzaken de zogenoemde prior probability (c.q. prior odds) kunnen inschatten op een manier die zowel praktisch bruikbaar is, alsook logisch en wiskundig goed onderbouwd. Daarmee maken we het Bayesiaanse ketenmodel dat we in deel 1 hebben uitgelegd compleet en in principe toepasbaar in het strafrecht. We zullen dit met voorbeelden illustreren. Daarbij zullen we niet zozeer optimale kansinschattingen maken, maar redelijke boven- of ondergrenzen zoeken. We hadden in deel 1 de likelihood ratio’s (LR’s) geïntroduceerd, en gezien dat ze de update factors vormen waarmee de waar­ schijnlijkheidsverhouding van de scenario’s van bijvoorbeeld 1 We willen Heika Frankena, John Coster van Voorhout, Henry Prakken, Richard Gill, Eric Rassin, en een onbekende referent bedanken voor hun commentaar op de conceptversies van deze artikelen. daderschap en onschuld (oftewel: de odds op daderschap) onder bepaalde voorwaarden steeds mogen worden verme­ nigvuldigd. Maar een updatefactor heeft natuurlijk pas bete­ kenis als er eerst iets is om te updaten. Voor een complete analyse moeten we dus nog een beginwaarschijnlijkheid hebben die als startpunt dient. Dit is de prior probability, vaak December 2015 Menu 22 341 Afbeelding: Shutterstock uitgedrukt in de vorm van prior odds, en meestal kortweg prior genoemd.2 De rekenregel van Bayes leert ons dat het product van de prior odds met alle relevante likelihood ratio’s voor de onafhanke­ lijke bevindingen de zogenoemde posterior odds oplevert. Dit is de uiteindelijke waarschijnlijkheidsverhouding tussen de scenario’s op grond van de specifieke set bevindingen en de specifieke kansinschattingen. Na herhaaldelijk toepassen krijgt de rekenregel dan deze vorm: posterior odds = prior odds × LR1 × LR2 × LR3 × ... Maar hoe komen we nu aan die prior? Door sommigen wordt gedacht dat deze ‘beginovertuiging’ een soort filosofische grootheid is die voorafgaat aan het bewijsproces of los staat van de bewijsmiddelen, en daarmee dus iets willekeurigs of zelfs onkenbaars zou zijn. Dat is niet zo. De prior moet altijd worden gebaseerd op een of meer van de specifieke feiten en omstandigheden van de betreffende zaak, waarbij eventueel ook de toepasbaarheid van bepaalde statistieken een bevin­ ding kan vormen. Dit laatste zou je een gedeelte van de achter­ 2 grondkennis kunnen noemen: het geheel van feiten dat (al dan niet impliciet) naast de expliciet genoemde bevindingen ook invloed heeft op onze kansinschattingen. De prior heeft dus geen vaste waarde (er kunnen in reële zaken zowel zeer kleine als zeer grote priors optreden), maar moet per geval worden bekeken. Zoals we in paragraaf 3 zullen zien zijn er meerdere keuze­ mogelijkheden om in een zaak de prior te bepalen. Hoewel de prior dus heel verschillende waarden kan krijgen, zal deson­ danks de posterior odds (= de uiteindelijke uitkomst van de analyse) in principe ruwweg gelijk blijven. De prior is als het ware de uitkomst van een (op zich niet noodzakelijkerwijs Bayesiaanse) deelanalyse die de kans (c.q. odds) op daderschap vaststelt louter op grond van een geselecteerde subset van bevindingen en/of achtergrond­ kennis. Omdat we de betreffende subset vrij mogen samenstellen, kan deze vaak zo worden gekozen dat deze deelanalyse conceptueel simpel is. Op deze manier blijkt de prior vaak op een helder te verwoorden en logisch goed onderbouwde manier in te schatten, waarbij het subjec­ tieve element relatief klein kan worden gehouden. In het vervolg zullen we met prior soms prior probability bedoelen en soms prior odds. Beide zijn een-op-een aan elkaar gerelateerd, mits de hypotheses elkaar uitsluiten. December 2015 Menu 23 342 De prior heeft geen vaste waarde, maar moet per geval worden bekeken. Zelf passen wij vaak het volgende recept toe: beschouw het moment waarop een persoon in beeld komt bij de opsporing.3 Op dat moment heeft per definitie iemand (meestal een deskundig iemand) kennelijke redenen om een zekere waarschijnlijkheid toe te kennen aan een daderscenario voor deze persoon. Als we die redenen analyse­ ren, en de kans op daderschap inschatten uitsluitend op grond van de bevindingen die op dat moment en in die situatie tot de verdenking hebben geleid (dus zonder acht te slaan op alle andere bevindingen die daarna en/of daarbuiten nog bekend zijn geworden), dan blijkt dat vaak op een redelijk inzichtelijke manier een prior op te leveren. Aan alle andere bevindingen (die we dus nog niet in beschouwing hadden genomen ten behoeve van de prior, meestal omdat ze pas later zijn opgekomen) kan dan vervol­ gens een likelihood ratio worden toegekend. We gaan dit recept met wat korte voorbeelden verduidelijken. Daarbij is het goed om nog even in herinnering te roepen dat we het steeds over slechts twee scenario’s hebben: daderschap of onschuld. De prior geldt voor één persoon (die eventueel nog wel kan behoren tot een groep van mogelijke daders voor wie elk dezelfde prior geldt). In de praktijk kunnen er natuurlijk best meer dan twee scenario’s zijn, zoals meerdere mogelijke toedrachten en/of meerdere onschuldscenario’s. Over het opstellen van zinnige scenario’s heeft bijvoorbeeld Van Koppen zeer behartigenswaardige dingen geschreven.4 De Bayesiaanse methodiek kan ook worden toegepast op meer dan twee scenario’s, al krijgt de rekenregel dan een iets andere vorm. Dat valt buiten het kader van dit artikel. Voorbeeld 1 Een vrouw is vermoord. In principe, nog los van een concrete strafrechtelijke verdenking maar zuiver statistisch, is een even­ tuele partner dan direct ‘in beeld’, aangezien voor moord op vrouwen geldt dat in ruwweg 40 procent de partner de dader is.5 Op grond van dit enkele statistische feit worden de prior odds dus ‘kans op daderschap’ gedeeld door ‘kans op onschuld’ = 40/60 = 2/3 (‘twee tegen drie’). Voor alle duidelijkheid, deze prior moet niet (onbewust) worden geïnterpreteerd als een concrete verdenking of exact getal. Het is slechts de nume­ rieke uitdrukking van het inzicht dat wanneer een vrouw vermoord is, de kans op daderschap a priori groter is voor haar partner dan voor een willekeurige burger. Dat betekent dat als een daderspoor in zekere mate matcht met de partner, dit tot een sterkere verdenking mag leiden dan wanneer het dader­ spoor in diezelfde mate zou matchen met een volstrekt wille­ keurig iemand. De orde van grootte van die a priori waarschijn­ 3 4 5 Er kan dan bijv. al sprake zijn van een redelijk vermoeden van schuld (art. 27 lid 1 Sv), mogelijk zelfs van ernstige bezwaren tegen die persoon. Maar het kan ook iemand zijn die tot een groep van mogelijke daders wordt gerekend. P. van Koppen, Overtuigend bewijs. Indammen van rechterlijke dwalingen, Amsterdam: Nieuw Amsterdam 2011. H. Stöckl et al., ‘The global prevalence of intimate partner homicide. A systematic review’, The Lancet 2013, p. 859–865. lijkheid wordt gegeven door de statistiek, precies zoals de statistiek bijvoorbeeld ook de incidentie van bepaalde ziektes geeft, zonder daarmee nog iets te zeggen over een individuele patiënt. Voor eventuele latere bevindingen richting daderschap (DNA, recente levensverzekering, historie van huiselijk geweld) of richting onschuld (alibi) kunnen dan likelihood ratio’s worden ingeschat die respectievelijk groter dan 1 of kleiner dan 1 zullen zijn. Voorbeeld 2 Een tasjesroof. Een ervaren rechercheur denkt dat de dader best wel eens kon behoren (fiftyfifty naar zijn mening) tot het groepje van 25 rondom de plaats van delict opererende veel­ plegers dat hij al een tijdje volgt. Enerzijds is dit natuurlijk een subjectieve inschatting. Anderzijds is dit de professionele mening van een ervaren rechercheur. Zijn inschatting is geba­ seerd op alle feiten en omstandigheden die op dat moment over de zaak bekend zijn (locatie, werkwijze enzovoort), en als zodanig een optimale kansinschatting, niet zomaar een wille­ keurig getal. Deze 25 veelplegers zijn daarmee op dat moment ‘in beeld’ gekomen. Voor elk van hen schatten we op dat moment de kans op daderschap dus ongeveer 0,5 × 1/25 = 0,02 = 2 procent.6 Deze prior bevat – uiteraard – een flinke onzekerheid, maar daarmee is het nog geen betekenisloos getal. Er zal gegeven een prior van 0,02 van eventuele latere bevindingen (signalement, herkenning in de fotoconfrontatie, bekentenis, bezit van de betreffende tas) flink wat bewijs­ kracht worden geëist om tot een veroordeling te kunnen komen, maar veel minder dan voor een willekeurige burger zou gelden. Voor die laatste ligt de prior misschien maar in de orde van één miljoenste. Voorbeeld 3 Een roofoverval in Groningen, eind van de middag. Twee gemaskerde mannelijke daders vluchten in een zwarte BMW 5 met Nederlands kenteken. Stel dat de statistieken ons ruwweg het volgende leren: er zijn zo’n drieduizend van dit soort auto’s in Nederland, op het moment van de overval zullen er daarvan gemiddeld dertig (= 1 procent) ergens in Noord-Nederland op de weg zijn, en in ongeveer vijf daarvan zullen twee mannen zitten. Als er een kwartier later in Assen een zwarte BMW 5 met twee mannen wordt gesignaleerd, is de kans dus 20 procent (want één van de vijf ) dat het de daders betreft, 80 procent kans dat het onschuldigen zijn. De prior odds zijn dus ongeveer 20/80 = 1/4. (Dat dit slechts een orde van grootte betreft spreekt – opnieuw – vanzelf, het getal is afhankelijk van vele factoren, zoals wat we precies als ‘Noord-Nederland’ beschou­ wen enzovoort) Na aanhouding kan deze prior worden verme­ 6 De factor 0,5 in het rekensommetje ‘0,5 × 1/25 = 0,02’ weerspiegelt de fiftyfifty-kans dat 1 van de 25 veelplegers de dader is. De prior odds zijn dan 2 procent/98 procent, dus óók ongeveer 0,02. In het algemeen zijn voor kleine kansen de numerieke waardes voor kans en odds ongeveer gelijk. Zie deel 1 van dit tweeluik voor het verband tussen odds en kansen. December 2015 Menu 24 nigvuldigd met de likelihood ratio’s van eventuele nadere bevindingen (bivakmut­ sen, buit, wapens). Voorbeeld 4 Het vergt waarschijnlijk enige gewenning om te werken met onzekerheden en aannames. Toch is het in onze visie zinvol om op deze manier naar priors te kijken. Een moord. Er zijn geen braaksporen. Stel dat de ervaring ons leert dat in ongeveer de helft van de vergelijkbare gevallen de dader een bekende was. (Natuurlijk is dit afhanke­ lijk van de situatie. In een klein Drents dorpje waar alle achterdeuren altijd open­ staan ligt het anders.) Men schat daarom fiftyfifty dat de dader een bekende van het slachtoffer was. De politie heeft een lijst van honderd bekenden opgesteld. We schatten dat twee derde van alle bekenden op die lijst staat. Er is dus 50 procent × 2/3 = 1/3 kans dat de dader op die lijst staat.7 Stel nu dat een biologisch daderspoor iedereen op de lijst uitsluit, op één iemand na. Dan geldt voor hem – louter op grond van deze gegevens – een kans van 1/3 op daderschap en (dus) 2/3 op onschuld. Oftewel: 1 tegen 2 dat hij de dader is. Prior odds = 1/2. Na aanhouding kan deze prior worden vermenigvuldigd met likelihood ratio’s van nadere bevindingen. Opnieuw moet natuurlijk de onzekerheidsmarge niet worden vergeten. Misschien moeten we stellen dat de kans dat de dader een bekende van het slachtoffer was ergens tussen de 25 en 75 procent ligt. Dan blijken de prior odds – na even rekenen – tussen de 0,2 en 1 te liggen. Het vergt – zoals gezegd – waarschijnlijk enige gewenning om te werken met onzekerheden en aannames, zoals we die ook in de voorbeeldjes hiervoor zijn tegengekomen. Toch is het in onze visie zinvol om op deze manier naar priors te kijken. Om, met andere woorden, steeds de vraag te stellen hoe een verdachte oorspronkelijk in beeld is gekomen en hoe sterk de aanwijzingen op dat moment waren. We hoeven onze ogen niet te sluiten voor de onzekerheidsmarges om toch te kunnen inschatten over welke orde van grootte we het hebben. Zodra iemand bij zichzelf denkt ‘dat zou hem wel eens kunnen zijn’, weet hij immers na enig zelfonderzoek wellicht ook wel aan te geven waarom hij dat dacht, en hoe sterk hij dat dacht. Bovendien, we zullen wel moeten. De logica leert ons dat de overwegingen die bij de oorspronkelijke verdenking een rol hebben gespeeld hoe dan ook doorwerken in de uiteindelijke waarschijnlijkheid van daderschap of onschuld. Iedereen die een oordeel daarover wil geven, zal hierover dus moeten nadenken en tot zo goed mogelijke schattingen moeten komen. 7 343 De Duitse wetenschapper Gerd Gigerenzer propageert voor het begrijpen van dit soort argumenten de zogenoemde natural frequencies. Dat zou in dit geval als volgt gaan: er zijn naar schatting 150 voor het slachtoffer bekende personen. De kans dat de dader daartussen zit is 1/2. De politie kon van die 150 personen een lijst opstellen waarop er 100 staan (2/3 dus van de 150). De kans dat de dader daartussen zit is dan 2/3 × 1/2 = 1/3. Van die 100 worden er vervolgens 99 uitgesloten. Voor die ene die overblijft, is de kans op daderschap dus 1/3. 1. Het verschil tussen prior en likelihood ratio Het is belangrijk om goed het verschil te onderkennen tussen prior odds en een like­ lihood ratio. Omdat het in beide gevallen kansverhoudingen betreft (eenheidsloze getallen dus) die ook op enig moment met elkaar worden vermenigvuldigd, ligt enige verwarring op de loer. Toch is er een wezen­ lijk verschil: een prior gaat over de kans op hypotheses, likelihood ratio’s gaan over de kans op bevindingen. Preciezer, een prior beschrijft een directe (in het jargon: ‘absolute’) kans op een hypothese, de likeli­ hood ratio is gebaseerd op twee voorwaar­ delijke kansen op een bevinding, waarbij respectievelijk wordt gekeken naar de kans op de bevinding bij de ene hypothese tegenover de kans op de bevinding bij de andere hypothese. De formulering van prior odds kan dus de vorm hebben ‘4 tegen 1 dat hij het gedaan heeft’ (oftewel een absolute kans van 80 procent op daderschap), terwijl in de formulering van een likelihood ratio het woordje ‘als’ een (conceptuele) rol moet spelen, zoals in: ‘Als hij het gedaan heeft, dan was de kans op deze bevinding 90 procent. Als hij onschuldig is, dan was de kans op deze bevinding 30 procent.’ (Oftewel een likeli­ hood ratio van 90/30 = 3 richting daderschap; de odds op daderschap mogen met een factor 3 worden verhoogd.) Weer anders gezegd: voor een likelihood ratio zijn kansin­ schattingen nodig in ‘voorwaartse’ richting (dat wil zeggen, redenerend vanuit twee verschillende hypotheses over de oorzaak naar hetzelfde waargenomen gevolg), terwijl een prior een directe inschatting is van de waarschijnlijkheid van de daderhypothese, echter nog zonder dat alle bevindingen dan al noodzakelijkerwijs in beschouwing zijn genomen. Het bepalen van de prior staat op zich dus los van de rekenregel van Bayes. Deze rekenregel verbindt slechts de afzonderlijke puzzelstukjes weer tot een samenvattende conclusie. We zullen verderop uitleggen dat we een keuze hebben om een bewijsmiddel óf van een likelihood ratio te voorzien, óf het (mede) te gebruiken voor het bepalen van de prior. In beide gevallen kunnen deels dezelfde materiële kansinschattingen een rol spelen. Juist bij dat soort exercities is het belangrijk om het verschil tussen prior en likelihood ratio (zowel conceptueel als numeriek) goed in gedachten te houden. 2. Verwarring over de prior, en hoe dat op te lossen In deel 1 hebben we dit al kort aangestipt: over de priors wordt verschillend gedacht.8 Hier willen we slechts één punt uit deze 8 We zullen die discussie nu niet in zijn geheel behandelen, maar verwijzen naar de recente publicatie van Henry Prakken, ‘Strafrechtelijk bewijzen: met Bayes of met verhalen? Of is er een derde weg?’, Expertise en Recht 2014, afl. 1, p. 4-19. In dit artikel geeft Prakken een heldere uiteenzetting van de kritiek op de Bayesiaanse methode zoals die o.a. door Peter van Koppen (a.w.) is geuit en beschrijft hij de weerlegging van deze kritiek door zowel M. Sjerps en Ch. Berger (Het Bayesiaanse model biedt een December 2015 Menu 25 344 discussie kort bespreken. Volgens Van Koppen bestaan er in het strafrecht geen goed te beredeneren a priori waarschijn­ lijkheden.9 De achtergrond van dit veelvoorkomende misver­ stand is het idee dat een prior vooraf zou moeten gaan aan de bewijsvoering, en dus als het ware los zou staan van de bewijs­ middelen.10 Volgens Van Koppen menen ‘de Bayesianen’ dat een prior bijvoorbeeld draait om de algemene kans dat een mens een misdaad pleegt, of om de algemene kans dat een verdachte schuldig is, puur op grond van het gegeven dat hij een verdachte is. Dit is echter niet wat ‘de Bayesianen’ in het algemeen menen. Ook is wel gezegd dat de prior ten diepste onkenbaar is, en dus maar op 1/2 moet worden gesteld. Of dat de prior er eigenlijk niet toe doet omdat hij toch ‘verwatert’ als er maar genoeg aanvullend ander bewijs is. Ook dit is onjuist. Interessanter is het verweer van Prakken, die de prior helder uitlegt, maar een probleem ziet als de betreffende kans niet in frequenties kan worden uitgedrukt, maar in feite een graad van geloof is.11 Hoewel, zoals reeds gezegd in deel 1, ook graden van geloof volgens ons voldoen aan de kansaxioma’s, zullen we deze zorg zo goed mogelijk ondervangen door priors maximaal te baseren op objectiveerbare gegevens, helder zicht op een complexe werkelijkheid, Den Haag: Nederlands Forensisch Instituut 2011) alsook door D.J.C. Aben (‘Trial and guess’, Expertise en Recht 2011, p. 45-51). Van Koppen, a.w., p. 214. Van Koppen, a.w., p. 219: Van Koppen bekritiseert Aart de Vos die in zijn prior alvast allerlei bewijsmiddelen heeft verwerkt. Zie deel 1 van dit tweeluik: Prakken schrijft: “De eis om altijd een schatting van de a-priori-kansen te maken leidt bij graden van geloof tot nog een probleem. Het maakt Bayesiaanse redeneringen [...] namelijk circulair, omdat de conclusie sterker gerechtvaardigd wordt naarmate men er vooraf meer in gelooft.” 9 10 11 Stelling: voor het bepalen van een prior zijn er meerdere mogelijkheden, gebaseerd op de keuze om bevindingen al dan niet te gebruiken voor het bepalen van een prior. We presenteren hier een fictieve casus, schematisch geba­ seerd op een moord in Alphen aan de Rijn.1 Een jonge vrouw is alleen in haar ouderlijk huis en wordt later vermoord aangetroffen op haar zolderkamer. We beschouwen slechts vier bevindingen die we – ten behoeve van het voorbeeld – zonder enige nuancering als vaststaande feiten presenteren. (De werkelijkheid was natuurlijk ingewikkelder. Er was bijvoorbeeld enige discussie of bepaalde sporen wel dader­ sporen waren.) • Bevinding 1: er zijn geen sporen van inbraak. • Bevinding 2: van de dader is een zeer onvolledig autoso­ maal DNA-spoor aangetroffen. • Bevinding 3: van de dader is een y-chromosomaal DNAspoor aangetroffen. • Bevinding 4: van de dader is een schoenafdruk aangetrof­ fen. 1 Hof ’s-Gravenhage 27 oktober 2010, ECLI:NL:GHSGR:2010:BO1756. kansinschattingen en/of statistieken. Bovendien wordt het bezwaar van Prakken dat “de conclusie sterker gerechtvaardigd wordt naarmate men er vooraf meer in gelooft” ondervangen doordat bevindingen die als basis voor de prior dienen, niet langer middels een likelihood ratio de posterior odds zullen versterken. Grotere prior odds leiden in dat geval dus niet automatisch tot grotere a posteriori odds. Volgens ons is de prior een goed te hanteren begrip, waarvan de numerieke waarde in veel gevallen op redelijk objectieve, of althans rationele wijze kan worden uitgerekend of geschat. Zoals gezegd, de prior kan en moet worden gebaseerd op een subset van de specifieke bevindingen in een zaak, inclusief de geldende statistieken en/of relevante achtergrondkennis. De bepaling van de prior zelf hoeft niet Bayesiaans te gebeuren, maar mag bijvoorbeeld ook gebaseerd zijn op een in deze zaak relevant statistisch gegeven, op een kansboom, op het feit dat de dader zich in een bepaalde groep moet bevinden enzovoort. In het Bayesiaanse systeem kan een bepaalde bevinding op twee manieren in de berekening worden betrokken: (i) de bevinding vormt (mede) de basis voor het bepalen van de prior of (ii) er wordt aan de bevinding een likelihood ratio toegekend die een vermenigvuldigingsfactor vormt in de keten van likelihood ratio’s zoals die hiervoor is weer­ gegeven. Als men bij dit soort exercities steeds dezelfde materiële kans­ inschattingen gebruikt, zal het voor het uiteindelijke resultaat Puur ten behoeve van dit voorbeeld gaan we verder uit van een volwassen Nederlandse man als dader, en doen we even alsof nader onderzoek zonder enige onzekerheid de volgende cijfers en resultaten heeft opgeleverd. • Omdat er geen sporen van inbraak zijn gaan we ervan uit dat er 50 procent kans is dat de moordenaar een bekende van het slachtoffer was. (Dit is dus géén wetenschappelijk gegeven, maar een heuristische inschatting.) • De recherche heeft een lijst opgesteld van honderd mannelijke bekenden die het slachtoffer vrijwillig zou binnenlaten. We schatten in dat deze lijst twee derde van alle mannen bevat voor wie dat geldt. • Van alle Nederlandse mannen matcht 5 procent met het y-chromosomaal DNA-spoor. • De schoenafdruk is afkomstig van een type en maat waarvan er in Nederland driehonderd paar verkocht zijn. Uitgaande van zes miljoen volwassen Nederlandse mannen, heeft dus 1 op de 20.000 dergelijke schoenen. (We gaan er in dit voorbeeld van uit dat de schoenen wille­ keurig over Nederland verdeeld zijn.) • Hoewel het NFI van het autosomale DNA-spoor geen likeli­ hood ratio zegt te kunnen berekenen, blijkt dat precies 1 van de 100 mannen op de recherchelijst matcht met (en December 2015 Menu 26 dus niet wordt uitgesloten door) dit spoor. Deze man is vanaf dat moment de verdachte. Het blijkt dat hij ook matcht met het y-chromosomaal DNA en dat hij het betreffende type schoenen bezit. Wat is nu de kans dat deze verdachte de dader is? We zullen de Bayesiaans berekening in drie varianten laten zien. Variant 1 We baseren de prior op de redenen waarom de verdachte in beeld kwam: hij stond op de recherchelijst en werd als enige niet uitgesloten door het autosomale DNA. • Bevinding 1 en Bevinding 2 leveren dus de prior, die we ‘Prior12’ noemen. We redeneren als volgt: er bestaat een kans van 1/2 dat de dader een bekende was, en voor een willekeurige bekende is de kans 2/3 dat hij op de lijst van de recherche staat. Er is dus 1/2 × 2/3 = 1/3 kans dat de dader op die lijst staat. De enige op die lijst die de dader kan zijn, is de verdachte. Dus geldt voor hem een kans van 1/3 op daderschap en 2/3 op onschuld. Oftewel: 1 tegen 2 dat hij de dader is. De prior odds zijn dus 1/2. • Bevinding 3 levert LR3. Het quotiënt van twee kansinschat­ tingen is nodig: wat was de kans dat de verdachte zou matchen met het y-chromosomaal DNA-spoor uitgaande van daderschap (100 procent natuurlijk), en wat was de kans op die match uitgaande van onschuld? Voor een willekeurige Nederlandse man is dat slechts 5 procent. De LR3 is dus 100/5 = 20. • Bevinding 4 levert LR4. Voor de dader geldt een kans van 100 procent dat hij in het bezit was van schoenen die matchen met het schoenspoor. Voor een willekeurige Nederlandse man is die kans 1 op de 20.000, oftewel 0,005 procent. LR4 is dus 100/0,005 = 20.000. De odds op daderschap zijn dan: Prior12 × LR3 × LR4 = (1/2) × 20 × 20.000 = 200.000 Conclusie: 200.000 tegen 1 dat deze verdachte de dader is. Variant 2 We kiezen nu een andere manier om de bevindingen te verdelen over prior en likelihood ratio’s. Alles wordt daardoor wel wat ingewikkelder. • Bevinding 1 levert LR1. We hadden in variant 1 al gezien dat als we uitgaan van daderschap van de verdachte, de kans dat hij op de lijst zou staan 33,3 procent was. Uitgaande van onschuld was voor een willekeurige onschuldige Nederlandse man die kans slechts 100 op de 6.000.000, oftewel 0,001666... procent. • LR1 is dus 33,3/0,001666... = 20.000. • Bevinding 2 levert LR2. Als de verdachte de dader is, was de kans op de match 100 procent. Als de verdachte onschul­ dig was, hebben we eigenlijk de random match probability 345 nodig. Het NFI kon die niet berekenen, maar we kunnen hem wel schatten. Uitgaande van onschuld was het namelijk puur toeval dat precies 1 van de 100 (onschul­ dige) mannen matchte. Statistische wetten (buiten het kader van dit artikel) leren ons dat dan onder bepaalde, redelijke aannames de optimale schatting voor de match­ kans per individu ongeveer 1/150 is.2 (‘Optimaal’ wil hier zeggen dat de kans dat je te hoog zit precies even groot is als de kans dat je te laag zit.) Dus LR2 = 150. • Bevinding 3 levert dezelfde LR3 als in de eerste variant: LR3 = 20. • Bevinding 4 levert nu Prior4. Er is een schoenspoor van een maat en type waarvan maar driehonderd paar verkocht zijn in Nederland. Voor iemand die een dergelijk paar bezit, geldt dus een prior odds van 1/300 = 0,00333... op dader­ schap. De odds op daderschap zijn nu: Prior4 × LR1 × LR2 × LR3 = 0,00333 × 20 × ±150 × 20.000 = ±200.000 Opnieuw is de conclusie dus: 200.000 tegen 1 dat deze man de dader is. Variant 3 Men kan er ook voor kiezen om de prior conceptueel helemaal ‘aan het begin’ te nemen en simpelweg te stellen dat voor elk van de zes miljoen Nederlandse mannen de kans op daderschap 1 op 6.000.000 (= 0,0000001666...) was. Alle vier de bevindingen leveren nu een likelihood ratio voor de odds op daderschap: Prior0 × LR1 × LR2 × LR3 × LR4 = 0,0000001666... × 20.000 × 20 × ±150 × 20.000 = ±200.000 Opnieuw dezelfde uitkomst. Uiteraard hebben we allerlei nuanceringen weggelaten en zullen in realistische situaties de uitkomsten ook nooit zo mooi gelijk uitkomen. We wilden slechts illustreren dat er meerdere varianten mogelijk zijn voor het kiezen van de prior, die ruwweg dezelfde posterior odds zullen opleveren, zolang de materiële kansinschattin­ gen maar gelijk blijven. Voor veel mensen zal de eerste variant het natuurlijkst aanvoelen. Er zijn echter ook mensen die graag een ‘zuiverder’ prior willen, zoals in variant 3. 2 Moet het niet 1/100 zijn? Nee, hier dreigt een transposed conditional: als P = 1/100, dan is – inderdaad – de verwachtingswaarde gelijk aan 1 match op 100 experimenten. Maar andersom hoeft dit niet te gelden. Dat komt omdat je bijv. moet gaan meewegen dat P misschien gelijk was aan 1/400 en je toevallig toch nog één match had, of dat P gelijk was aan 1/40 en je toevallig toch maar één match had. Dit hoeft geen symmetrische integraal rondom 1/100 te zijn. Als je alleen die ene match hebt maar niets over de waarde van P weet, dan zul je een redelijke aanname moeten maken over de waarschijnlijkheid dat bepaalde kansintervallen P omvatten, bijv. door voor alle logaritmische intervallen een gelijke kans te nemen. Die aanname leidt tot een schatting van ongeveer 1/150. December 2015 Menu 27 346 Het bepalen van de prior staat op zich los van de rekenregel van Bayes. Deze rekenregel verbindt slechts de afzonderlijke puzzelstukjes weer tot een samenvattende conclusie. niet veel uitmaken hoe men de bevindingen als het ware verdeeld heeft over de prior en de likelihood ratio’s. Dit betekent dus, strikt genomen, dat men ook een prior zou kunnen kiezen die geba­ seerd is op het totaal van alle bevindingen van een zaak, zodat men Bayes überhaupt niet meer nodig heeft. En inderdaad zijn er (simpele) zaken denkbaar (bijvoorbeeld een onbetwiste heterdaad) waarin dit een prima oplossing is. Wanneer echter de verzame­ ling bevindingen complexer en de waar­ heidsvinding minder duidelijk is, kan een menselijk brein onmogelijk nog alle bevin­ dingen tegelijk in de prior betrekken. De Bayesiaanse methodiek staat ons dan toe om te bekijken welke beperkte subset van de bevindingen wel op een logische en natuur­ lijke manier tot een (start)waarschijnlijkheid kan leiden. Zoals we hebben laten zien, geeft het moment waarop iemand bij de opsporing in beeld komt hiervoor vaak een mooi handvat. Men heeft dan de vrijheid om op die bevin­ dingen de prior te baseren, en voor de andere bevindingen de hulp van Bayes in te roepen. Hoewel een gedetailleerde onder­ bouwing van deze stelling buiten het kader van dit artikel valt en voor het volgen van ons betoog ook niet nodig is, willen we deze priorkeuzevrijheid toch (in een apart kader) met een voorbeeld illustreren. Dit doen we omdat we hiermee een aantal hiervoor genoemde misverstanden hopen te bestrijden die de hardnekkige neiging hebben om een acceptatie van de Bayesiaanse methodiek in de weg te staan. 3. Twee echte strafzaken Bayesiaans geanalyseerd We gaan nu twee echte strafzaken Bayesiaans analyseren. De ruimte om dat gedetailleerd te doen ontbreekt. Toch zullen onze analyses, hoe basaal en simplistisch ook, belangrijke inzichten opleveren. In de eerste zaak, de Schiedammer park­ moord, zullen we namelijk alle kansinschattingen oprekken richting daderschap, en aantonen dat zelfs dan de kans op daderschap zeer laag blijft. In de tweede zaak, de Nederweert­se carnavalsmoord, zullen we juist alle kansinschattingen oprekken richting onschuld, en aantonen dat zelfs dan de kans op daderschap zeer hoog blijft. Deze strategie om niet zozeer te zoeken naar optimale schat­ tingen inclusief een foutenmarge, maar om, binnen redelijke grenzen, zo hoog of zo laag mogelijke schattingen te maken, is een bewuste keuze en heeft twee voordelen. 1. Soms kan het maken van een optimale schatting bijzonder gecompliceerd zijn, maar kunnen die complicaties worden vermeden door op veel eenvoudiger wijze een bepaalde boven- of ondergrens te bepalen. 2. In de praktijk blijkt dat mensen die niet snel geneigd zijn een schatting te geven (‘Ik heb geen idee hoe ver Istanbul hiervandaan ligt’) of te aanvaarden (‘Hoe kom je aan dat getal?’) zich soms wel comfortabel voelen bij het schatten of aanvaarden van een boven- of ondergrens (‘Oké, mee eens, Istanbul ligt zéker meer dan 1000 km hier­ vandaan’). Deze strategie is succesvol als blijkt dat óók boven- of ondergrenzen al tot stevige conclusies leiden. Zo niet, dan zal men alsnog subtieler te werk moeten gaan, en wellicht met een onzeker antwoord moeten leven. 3.1 Voorbeeld 1: de Schiedammer parkmoord De casus: het gaat om een pedoseksueel misdrijf, gepleegd in een park in Schiedam. De slachtoffers zijn twee kinderen van wie er een overleeft en kan getuigen. De verdachte was aanvankelijk slechts als getuige in beeld gekomen: hij was de tweede omstander die kwam aanfietsen nadat de dader was vertrokken. Later bleek dat deze getuige bekendstond als iemand met pedofiele neigingen. Dat was het moment dat hij verdachte werd. De politie oordeelde kennelijk dat een als pedofiel bekend­ staande man die als tweede omstander bij een zojuist gepleegd pedoseksueel delict aan komt fietsen wel erg toeval­ lig was. Dit kon wel eens de dader zijn, terugkerend naar de plaats delict. Een aldus geformuleerd redelijke vermoeden van schuld is natuurlijk gebaseerd op een paar impliciete, niet als zodanig uitgesproken kansinschattingen, waarover ook nog niet echt kwantitatief is nagedacht. Bayes vraagt van ons om dat nu wel te doen. We gaan daarom nu de prior expliciet inschatten gebaseerd op deze oorspronkelijke reden om de verdachte als mogelijke dader te zien. Daarbij zullen we zoals gezegd niet op zoek gaan naar de meest waarschijnlijke schatting, maar naar een bovengrens. We zoeken de maximale kans op daderschap die we redelijkerwijs mogen aannemen, dus gebaseerd op schat­ tingen die zo ver mogelijk worden opgerekt richting dader­ schap. Het is duidelijk dat hoe minder mensen als pedofiel bekend­ staan, hoe toevalliger de coïncidentie12 (omstander zijn én als pedofiel bekendstaan) was. Van de andere kant, hoe minder vaak daders terugkeren naar de plaats delict, hoe groter de kans weer is dat de aanwezigheid van de verdachte toch puur toeval was. De relevante vragen zijn dus: 1. Wat is een redelijke laagste schatting voor het percentage Nederlandse mannen van wie bekend is dat zij pedofiele neigingen hebben? 2. Wat is een redelijke hoogste schatting voor de kans dat de pleger van zo’n misdrijf, na gevlucht te zijn, weer terug­ keert naar de plaats delict, en daar dus vrijwillig het risico op herkenning loopt? 12 Met ‘coïncidentie’ bedoelen we hier de samenloop van deze twee feiten. December 2015 Menu 28 Eerste vraag Geschat wordt dat 0,2 tot 1 procent van de Nederlandse mannen pedofiel is, en dat minimaal 0,1 procent ook als zodanig bekendstaat. Omdat we in deze analyse een lage schatting willen, gaan we uit van 0,05 procent (1 op de 2000) mannen met bekende pedofiele neigingen.13 Tweede vraag Welk percentage pedoseksuele moordenaars keert (maximaal) terug naar de plaats delict en blijft daar rondhangen, ook als hij ziet dat een van de slachtoffers nog leeft en hem dus elk moment als dader kan aanwijzen? Zolang we hierover geen relevante statistieken kunnen vinden (of samenstellen) zullen we zelf een schatting moeten geven. Dit roept wellicht weer­ stand op, maar we mogen er niet voor weglopen. Iedereen die meent dat het op de plaats delict zijn van de verdachte belas­ tend is (of zelfs ‘geen toeval kan zijn’) heeft immers noodzake­ lijkerwijs óók een dergelijke inschatting gemaakt, zij het impli­ ciet en hoogstwaarschijnlijk onbewust. Het is beter om die schatting expliciet te maken en daarmee open te stellen voor analyse en discussie. Al was het maar omdat het uiteindelijke resultaat daardoor heel anders kan zijn dan de intuïtie aangeeft. Intermezzo Dit is een essentieel punt. Veel mensen zullen van zichzelf wellicht denken dat ze op geen enkele manier een ‘zinnig’ getal kunnen toekennen aan het antwoord op de hiervoor gestelde vraag. Ons pleidooi is echter dat als, zoals in dit geval, de vraag ‘in welke mate kan dit toeval zijn?’ moet worden beantwoord, het beter is om de kansen numeriek te schatten (desnoods met een grote onzekerheidsmarge) dan in woorden. Alleen als er getalsmatig wordt nage­ dacht, kan de betreffende bevinding worden afgewogen tegenover ander bewijs. Ook dient, zoals we al in deel 1 betoogden, het noemen van een getal de communicatie: hoe kunnen twee mensen ooit weten of ze met woorden als ‘soms’ of ‘onwaarschijn­ lijk’ ook maar bij benadering hetzelfde bedoelen, zolang ze er geen numerieke waarde aan hebben verbonden? En mocht zich toch een situatie voordoen dat het werkelijk onzinnig is om ergens een getal aan toe te kennen, dan leren we daaruit ten minste dat er dus niets kan worden geconcludeerd over de bewijskracht van deze bevinding, en dat hij dus geen rol mag spelen in het uiteindelijke oordeel. Het is in dat geval belangrijk dat iedereen zich dat ook realiseert, en niet via (te) vage bewoordingen aan dat inzicht ontsnapt. Dit alles geldt, mutatis mutandis, ook voor alle volgende kansinschattingen. Dat lijkt onredelijk hoog. Zeker zal niet de helft van de daders terugkeren en op de plaats delict alsnog arrestatie riskeren. 5 procent dan? Dat lijkt redelijk, maar is het ook de hoogste schatting die we durven maken? Wij komen uit op 10 procent als schatting die we maximaal voor onze rekening willen nemen. (Mocht iemand menen een nog hogere schatting te kunnen verdedigen, dan staat het hem vrij om met dat hogere getal verder te rekenen.)14 Voor een correcte vergelijking moeten we nu nog verdisconteren welk percentage van deze categorie pedoseksuele daders, net als de verdachte, bekend­ staat als pedofiel. Volgens onderzoek15 is dat ongeveer de helft. Dus onze 10 procent verandert nu in 5 procent. Conclusie op grond van de hiervoor genoemde kansinschat­ tingen. 1. Er was (maximaal) 5 procent kans dat we een als pedofiel bekendstaand iemand zouden aantreffen die ook de dader was. 2. Er was (minimaal) 0,05 procent kans dat we een als pedofiel bekendstaand iemand zouden aantreffen als eerste of tweede omstander die niet de dader was, maar een toeval­ lige omstander. Er was dus a priori niet veel kans dat we een als pedofiel bekendstaand iemand zouden aantreffen, noch als dader, noch als omstander. Maar gegeven het feit dat er zo iemand werd aangetroffen, was de kans dat deze persoon de dader was dus 5/0,05 = 100 keer groter dan de kans dat deze persoon de dader niet was. Onze prior is dus (maximaal) 100 tegen 1 dat de verdachte de dader is.16 We zetten nu de Bayesiaanse analyse voort door van de overige relevante bevindingen de likelihood ratio in te schatten. Alle hiervoor gemaakte overwegingen over het maken van schattingen blijven daarbij gelden. Bevinding 1 Het overlevende slachtoffer heeft de verdachte niet als dader herkend toen deze even later op de plaats delict was. Ook heeft hij een gedetailleerd dadersignalement gegeven dat totaal niet overeenkomt met verdachte. Om de likelihood ratio te bepalen moeten we kans op deze bevinding twee keer inschatten. Eerst uitgaande van dader­ schap van de verdachte, daarna uitgaande van onschuld. De eerste schatting zullen we zo hoog mogelijk maken, de laatste zo laag mogelijk. Op deze manier zal de likelihood ratio (die 14 We gaan dus een zo hoog mogelijk, maar nog wel redelijk, antwoord op de hiervoor gestelde vraag schatten. 50 procent? 13 Zie, naast Wikipedia, ook E. Leuw, R.V. Bijl & A. Daalder, Pedoseksuele delinquentie. Een onderzoek naar prevalentie, toedracht en strafrechtelijke interventies, Meppel: Boom Juridische uitgevers 2004. Hierin wordt vermeld dat over de jaren 1996–2002 in Nederland bijna elfduizend verdachten van pedoseksuele delicten bekend zijn geworden. Uitgaande van ongeveer zes miljoen volwassen mannen zou dat ruwweg neerkomen op 1 op de 600. Hieruit blijkt dat de hiervoor gegeven schatting inderdaad zeer laag is. 347 15 16 Dit klinkt misschien niet erg objectief of wiskundig. Toch betreft het hier wel degelijk objectieve wiskunde, maar dan toegepast op getallen waarover nog kan worden gediscussieerd. Iedereen mag/moet bij sommige kansinschattingen immers zijn eigen intuïtie volgen. Rechters doen per definitie ook niet anders als ze een zaak beoordelen. Maar het is goed als transparant wordt gemaakt welke intuïtie/kansinschatting er door wie wordt gebruikt. Dan is er een gerichte discussie mogelijk. Pas daarna komt de wiskunde in beeld om de bewijskrachten te combineren tot een samenvattende conclusie. Zie opnieuw Leuw, Bijl &Daalder, a.w. Allerlei subtiliteiten die in het voordeel van de verdachte werken, zoals het feit dat er in het park bovengemiddeld veel pedofielen rondliepen enz. zijn hier nog buiten beschouwing gelaten. December 2015 Menu 29 348 gelijk is aan de eerste kans gedeeld door de tweede) zo hoog mogelijk zijn, dus met maximale bewijskracht richting dader­ schap. • Eerste schatting, uitgaande van daderschap. De kans dat een slachtoffer onder deze omstandigheden de dader niet zou herkennen én een totaal verkeerd signalement zou geven schatten wij op maximaal 10 procent. • Tweede schatting, uitgaande van onschuld. Wij schatten dat gemiddeld zeker niet meer dan 1 op de 20 onschuldige omstanders (5 procent) spontaan door een slachtoffer als dader zal worden aangewezen. Dus de kans dat een onschul­ dige omstander niet spontaan als dader wordt aangewezen is minimaal 95 procent. • Eerste schatting, uitgaande van daderschap. Als deze verdachte de dader was, moet een willekeurig horloge meer dan een kwartier achter hebben gelopen. We willen deze kans zo hoog mogelijk inschatten, en komen op maximaal 1 op de 20 = 5 procent.20 • Tweede schatting, uitgaande van onschuld. Om de verdachte, indien onschuldig, een alibi te verschaffen was slechts nodig dat een willekeurig horloge niet meer dan een kwartier achter zou lopen. Met dezelfde materiële inschat­ ting als hiervoor komen we op een kans van minimaal 95 procent. LR1 is dus 0,1/0,95 = 0,105. Er speelden onder de daderhypothese meerdere problemen met de ‘tijdlijn’. In deze versimpelde voorbeeldanalyse gebrui­ ken we de ‘horlogebevinding’ om al deze problemen als het ware collectief te representeren. LR3 achten wij echter wel een reële ondergrens, ook als we de mogelijkheden meewegen dat het slachtoffer loog enzovoort. Bevinding 2 Na vier dagen verhoor bekent de verdachte. Opnieuw twee schattingen. • Eerste schatting, uitgaande van daderschap. De kans dat deze man, indien moordenaar, zou bekennen was, gezien zijn zwakke persoonlijkheid,17 erg groot. Omdat we alle schattingen richting daderschap willen oprekken schatten we die kans op 100 procent. • Tweede schatting, uitgaande van onschuld. Internationaal gelden schattingen dat meer dan 10 procent van onschul­ dige moordverdachten bekent.18, 19 Voor deze verdachte, die een zwakke persoonlijkheid had, kunnen we moeilijk aannemen dat deze kans veel kleiner was. Bovendien waren essentiële zaken in de bekentenis strijdig met de getuigenis van het slachtoffer, en trok hij zijn bekentenis meteen weer in. We schatten de kans op deze bevinding op minimaal 10 procent. LR3 is dus 5/95 = 0,053. Bevinding 4 Er is geen DNA van verdachte aangetroffen op de slachtoffers of plaats delict. • Eerste schatting, uitgaande van daderschap. Gezien het gepleegde geweld was er volgens het NFI 90 procent kans op het aantreffen van DNA-sporen van de dader.21 • Tweede schatting, uitgaande van onschuld. Als de verdachte onschuldig was, is de kans op het niet aantreffen van zijn DNA 100 procent. LR4 is dus 10/100 = 0,1. Samenvattend LR2 is dus 100/10 = 10. Bevinding 3 Het slachtoffer geeft een tijdstip voor het misdrijf dat minimaal een kwartier strijdig is met de hypothese dat verdachte de dader is. Het slachtoffer kon dat tijdstip tamelijk nauwkeurig aangeven, aangezien de kinderen vlak tevoren aan een voorbijganger hadden gevraagd hoe laat het was. Het OM verwerpt dit alibi echter, en stelt dat het betreffende horloge de foute tijd aangaf. Opnieuw twee schattingen. 17 18 19 De zaakofficier heeft gezegd dat de verdachte, Kees B., een labiele man was die in staat moest worden geacht verklaringen af te leggen die niet op waarheid berustten. Door de raio-officier is verklaard dat door de politie werd opgemerkt dat men voorzichtig moest omgaan met Kees B., “want als je hem te hard zou aanpakken, zou hij misschien nog bekennen” – uit Evaluatieonderzoek in de Schiedammer parkmoord (rapport Posthumus), Den Haag: Openbaar Ministerie 2005, p. 103. H.A. Bedau & M.L. Radelet, ‘Miscarriages of justice in potentially capital cases’, Stanford Law Review 1987, p. 21-179; S.A. Drizin & R.A. Leo, ‘The problem of false confessions in the post-DNA world’, North Carolina Law Review 2004, p. 891-1008. In experimentele settings, dus buiten een strafrechtelijke context, worden nog lagere likelihood ratio’s gevonden. prior odds (gebaseerd op omstander zijn én als pedofiel bekendstaan) = 100 LR1 (verdachte niet herkend, afwijkend signalement) = 10/95 = 0,105 LR2 (herroepen bekentenis) 100/10 = 10 LR3 (alibi, tenzij horloge een kwartier achterliep) = 5/95 = 0,053 LR4 (geen DNA van verdachte gevonden) = 10/100 = 0,1 = De rekenregel van Bayes geeft nu de posterior odds: 20 21 Dit is een erg hoge schatting. Waarschijnlijk loopt niet 10 procent van alle Nederlandse horloges meer dan een kwartier fout (voor óf achter). Gebaseerd op evaluatieonderzoek door Frits Posthumus (a.w., p. 45): “Op mijn uiteindelijke vragen: is het DNA-spoor van een derde onbekend persoon een daderspoor? Sluit het niet vinden van DNA van verdachte op de PD verdachte uit als dader? geven de heren van het NFI geen 100 procent oordeel. Zij merken op dat in 9 van de 10 soortgelijke gevallen er wel DNA van verdachte gevonden zou moeten zijn.” December 2015 Menu 30 posterior odds = prior × LR1 × LR2 × LR3 × LR4 = 100 × 0,105 × 10 × 0,053 × 0,1 = 0,56 (= ongeveer 1/2) De odds op daderschap zijn dus ongeveer 1 tegen 2, overeenkomend met een kans van ruwweg 35 procent. Conclusie In de Schiedammer parkmoord zullen we alle kans­ inschattingen oprekken richting daderschap, en aantonen dat zelfs dan de kans op daderschap zeer laag blijft. Hoe eenvoudig en weinig gedetailleerd deze analyse ook is, het resultaat is wel degelijk veelzeggend. De wiskunde klopt, de volgens ons belangrijkste bevindingen zijn in beschouwing genomen22 en alle kansinschattingen zijn stevig opgerekt richting daderschap. Desondanks blijft de betreffende kans klein, laat staan ‘boven elke twijfel verheven’. Ook een meer verfijnde analyse zal deze uitkomst niet wezenlijk anders maken. Toch werd deze verdachte veroordeeld. Zonder becij­ fering, ‘met gezond verstand’ en vanuit professionele intuïtie was het kennelijk erg moeilijk om de bevindingen op gewicht te schatten, zowel apart als in onderlinge samenhang. 3.2 Voorbeeld 2: prior odds voor de Nederweertse carnavalsmoord Casus: tijdens een nachtelijke overval in Nederweert is er over en weer geschoten tussen drie zwartgeklede overvallers met bivakmutsen en het slachtoffer, dat dodelijk wordt getroffen.23 De overvallers vluchten, maar volgens een getuige was een van hen zwaargewond. Een half uur na de overval wordt op een half uur rijden afstand, in het Maxima Medisch Centrum te Veldhoven, een man – hierna: de verdachte – met een schot­ wond in zijn buik afgeleverd door twee andere mannen met bivakmutsen. De desbetreffende kogel blijkt in zekere mate te matchen met het pistool van het slachtoffer. Er is die nacht geen melding gemaakt van een andere schietpartij in de buurt van Veldhoven, noch is er die nacht een andere patiënt met een kogelwond in de buurt van Nederweert opgenomen. Twee hypotheses: volgens het openbaar ministerie is de kogel in de buik afkomstig van het wapen van het slachtoffer. Volgens de verdediging is de verdachte elders neergeschoten (hij is vergeten waar) en heeft hij niets met de overval in Neder­ weert te maken. Over deze zaak is veel gepubliceerd. M.A. Loth heeft de casus uitgebreid behandeld,24 zij het niet op Bayesiaanse wijze. Berger en Aben hebben van deze zaak een aantal aspecten Bayesiaans beschouwd,25 hetgeen vervol­ gens door Prakken26 weer van kritiek is voorzien. De discussie is onder meer zo boeiend omdat de advocaat-generaal destijds expliciet betoogde dat de zaak zich leende voor een Bayesiaanse aanpak, ook al is het requisitoir niet volledig Bayesiaans te noemen. Maar over de vraag hoe de prior moet worden gekozen, wordt verschillend gedacht. De advocaat-generaal nam als startpunt de kogelmatch, waarschijnlijk enigszins op het verkeerde been gezet door de formulering van de vuurwapendeskundige, die (zoals we in deel 1 al kort noemden) ten onrechte rapporteerde dat de kogel in de buik van de verdachte ‘waarschijnlijk’ afkomstig was van de revolver van het slachtoffer.27 Hier had een likelihood ratio moeten worden gerap­ porteerd, maar is een transposed conditional-fout gemaakt. Daardoor kreeg de conclusie over het kogelspoor nu ten onrechte de vorm van een prior, een onvoorwaardelijke uitspraak dat het waarschijnlijk was dat de kogel uit een bepaald vuurwapen afkomstig was (en de verdachte dus de dader). Mogelijk op grond hiervan hebben zowel de advocaatgeneraal als het hof dit kogelspoor genomen als het uitgangs­ punt van hun waarschijnlijkheids­inschattingen (beide overi­ gens zonder het ook daadwerkelijk een prior te noemen of er een getalswaarde aan te koppelen). Berger en Aben doorzien als geoefende Bayesianen deze transposed conditional uiteraard, en willen de prior baseren op het volgende gegeven: de verdachte heeft zich op de avond van het misdrijf als enige in de wijde omtrek met een kogelwond in het ziekenhuis gemeld. Ook Prakken ziet in dat het kogelspoor geen goede basis vormt voor een prior, maar hij stelt dat ook de aanpak van Berger en Aben niet tot een goede prior leidt.28 We kiezen onze eigen benadering, en stellen ons dus de vraag op grond van welke feiten en omstandigheden de verdachte als zodanig in beeld kwam. Welnu, dat was niet alleen vanwege de ziekenhuisopname zelf, maar vanwege de coïncidentie tussen schietpartij en ziekenhuisopname. Verder willen we, anders dan de hiervoor genoemde auteurs, onze prior ook getalsmatig inschatten. Daarvoor zijn de volgende gegevens van belang. (Vervolg op pag. 352) 25 26 27 22 23 24 349 Voor de eenvoud laten we de herkenning van de fiets van de verdachte door een (telefonisch gehoorde) getuige weg. Een andere getuige was juist vrij stellig in het nietherkennen van de fiets. Het product van deze twee likelihood ratio’s zal ongeveer 1 zijn. Hof ’s-Hertogenbosch 24 september 2008, ECLI:NL:GHSHE:2008:BF2188. M.A. Loth, Waarheid en waarheidsvinding in het recht (Handelingen Nederlandse Juristen-Vereniging, nr. 1), Deventer: Kluwer 2012. 28 C.E.H. Berger & D.J.C. Aben, ‘Bewijs en overtuiging. Redeneren in de rechtszaal’, Expertise en Recht 2010, p. 159-165. Prakken, a.w. Waarbij we, aangezien we het rapport niet zelf onder ogen hebben gehad, wel de mogelijkheid willen openlaten dat die deskundige op dit punt verkeerd werd geparafraseerd. Prakken legt uit dat als in de aanpak van Berger en Aben de prior met een nieuwe toepassing van Bayes zou worden bepaald, het probleem verschuift naar een nieuwe prior, terwijl als de prior op argumentatieve wijze wordt bepaald met de generalisatie ‘criminelen met kogelwonden melden zich over het algemeen snel in een ziekenhuis’, het niet duidelijk is hoe dat kan. December 2015 Menu 31 352 (Vervolg van pag. 349) 1. Hoeveel van dit soort criminele schietpartijen vinden er in Nederland plaats? 2. Bij hoeveel ziekenhuizen kan iemand met een kogelwond terecht? Antwoord op vraag 1 We googleden simpelweg op ‘aantal schiet­incidenten Neder­ land’. Letterlijk het eerste zoekresultaat gaf: “Toename van aantal schietincidenten | RTL Nieuws:29 De research­redactie van RTL Nieuws heeft op basis van nieuws­ berichten zelf het aantal schietincidenten geregistreerd en kwam over de eerste 6 maanden uit op 166 schietincidenten. Daarbij vielen 107 gewonden (...).” Volgens RTL waren er, in 2011, dus 107 gewonden gedurende een half jaar, oftewel zo’n tweehonderd schotwonden per jaar. Maar veel van die gewonden waren waarschijnlijk niet in de zwarte ‘werkkleding’ en bivakmuts van de crimineel gehuld, simpelweg omdat het conflict een wat spontaner karakter had (caféruzie, relatietoestanden). Een reële schatting zou kunnen zijn dat het per jaar hooguit zo’n tien keer voorkomt dat het om ‘drie zwartgeklede mannen met bivakmutsen’ gaat. Omdat we hier alle schattingen in het voordeel van de verdachte willen oprekken gaan we echter uit van honderd dergelijke gevallen. Antwoord op vraag 2 We googleden op ‘aantal ziekenhuis locaties’ en vonden www. zorgatlas.nl,30 waarop we lazen: “De laatste jaren neemt het aantal ziekenhuislocaties met een afdeling spoedeisende hulp af. Zo waren er in 2008 nog 104 locaties (...).” Er zijn dus ongeveer honderd plekken in Nederland waar je ’s nachts met een kogelwond terechtkunt. Kort door de bocht: per jaar krijgen er in Nederland (hóóguit) zo’n honderd mannen die deel uitmaken van een zwartgekleed trio een kogel in hun lichaam, die ze er op zo’n honderd plaatsen ook weer uit kunnen laten halen. Elk ziekenhuis zal dus typisch gemiddeld één keer per jaar voor een dergelijke gewonde het dichtstbijzijnde ziekenhuis zijn. Voor het Maxima in Veldhoven was dat bijvoorbeeld het geval in de carnavals­ nacht van maandag 27 februari 2006 om 05.27 uur, toen zich daar iemand meldde die in alle opzichten (reistijd, kleding, gezelschap) de gewonde moordenaar uit Nederweert kon zijn. Het onschuldscenario zegt echter dat deze verdachte niet uit Nederweert kwam en vereist dus de volgende coïncidentie. Er moeten die nacht bij twee onafhankelijke schietpartijen twee gewonden zijn gevallen voor wie allebei gold (1) dat zij beiden 29 30 www.rtlnieuws.nl/nieuws/binnenland/toename-van-aantal-schietincidenten. www.zorgatlas.nl/zorg/ziekenhuiszorg/algemene-en-academische-ziekenhuizen/ aanbod/reistijd-naar-ziekenhuis-met-afdeling-spoedeisende-hulp. in alle opzichten de moordenaar uit Nederweert hadden kunnen zijn, (2) dat het Maxima Medisch Centrum het dichtst­ bij was en (3) dat zij zich daar beiden binnen een kwartier31 nauwkeurig om 05.27 uur hadden kunnen melden. Hoeveel toeval zou een dergelijke coïncidentie nu eigenlijk bevatten? Welnu, de gevonden statistische gegevens golden per jaar, en er gaan 365 × 24 × 4 kwartieren in een jaar, dat zijn ongeveer 35.000 kwartieren. Als er typisch één dergelijke patiënt per jaar binnenkomt, is de kans dat er zich precies in datzelfde kwartiertje nog een tweede soortgelijke gewonde had kunnen melden van een andere schietpartij dus 1/35.000. Dit geeft een eerste indruk van de hoeveelheid toeval die het onschuldscenario vereist. Maar het is daarmee nog geen prior.32 De prior moet de directe waarschijnlijkheidsverhou­ ding van de twee scenario’s weergeven, en in die scenario’s speelt, naast de coïncidentie, ook mee dat een gewonde over­ valler zich al dan niet kan laten behandelen. We hebben daarvoor een kansboom opgezet (zie de afbeelding hierna). De kansboom laat zien dat de prior odds ergens tussen de 35.000 en de 300.000 liggen. Hoewel deze priorberekening natuurlijk veel subtieler en nauwkeuriger kan worden uitgevoerd (de reistijd kan precie­ zer, de overeenkomsten in uiterlijk kunnen gedetailleerder worden verdisconteerd enzovoort), zal er ook dan niets veran­ deren aan het feit dat de daderhypothese tienduizenden tot honderdduizenden malen waarschijnlijker blijft dan de onschuldhypothese. Dit is noch door de advocaat-generaal, noch door het hof voldoende ingezien.33 Hoewel men uiter­ aard wel aanvoelde dat de coïncidentie tussen schietpartij en ziekenhuisopname richting daderschap wees, werd deze bevinding slechts gebruikt als een ondersteuning van de kogelmatch. We bekijken ook nog de likelihood ratio van dit kogelspoor. Hoewel de deskundige slechts heeft gezegd dat het ‘waar­ schijnlijker’ is dat de kogel uit het vuurwapen van het slachtof­ fer afkomstig was (een formulering die zoals we zagen ten onrechte geen likelihood ratio maar een prior beschrijft), lijkt het een redelijke schatting om te stellen dat de likelihood ratio minimaal 10 moet zijn geweest. (Het NFI hanteert de omschrij­ ving ‘waarschijnlijker’ voor likelihood ratio’s tussen de 10 en de 100.) Dus op grond van de prior en deze ene likelihood ratio zijn de odds op daderschap al minimaal 350.000 tegen 1. 31 32 33 Dat we plus of min zeven minuten kiezen is omdat we dat ongeveer inschatten als de maximale onzekerheid in de reistijd. Formeel gezien beschrijft het getal 35.000 hier eerder een likelihood ratio van de ‘kale’ coïncidentie. Het hof meent dat de opgetreden coïncidentie eigenlijk weinig zegt. In het arrest worden de bevindingen aangegeven met de letters a t/m f (waarbij a het kogelspoor aanduidt, en b en c de coïncidentie betreffen). Men overweegt: “Vervolgens heeft het hof zich de vraag gesteld of de omstandigheden onder b, c, d, e, en f, in onderling verband beschouwd, voldoende nader wettig bewijs opleveren naast de omstandigheid onder a. Het hof beantwoordt die vraag negatief. De omstandigheden onder b, c, d, een f zijn ieder voor zich en in onderling verband beschouwd te indirect en te weinig significant om in voldoende mate bij te dragen aan de omstandigheid onder a, om de voor bewezenverklaring wettelijk vereiste zekerheid te bereiken dat verdachte een van de daders van de overval in Nederweert was.” December 2015 Menu 32 Om de prior te bepalen moeten we, naast de eerderge­ noemde coïncidentie, ook de kans nog verdisconteren dat een gewonde overvaller zich daadwerkelijk bij een zieken­ huis meldt. We noemen deze kans Pz. We vermoeden dat Pz redelijk dicht bij 1 zal liggen, maar kennen er op dit moment nog geen getalswaarde aan toe. We gaan nu gebruikmaken van een kansboom waarin we de mogelijke loop van de gebeurtenissen bekijken. De top van de kansboom begint met wat we zeker weten: er is in elk geval één schietpartij geweest (Nederweert) waarbij een overvaller gewond is geraakt. Vervolgens splitst de situatie zich uit: in de linkertak (daderscenario) liet deze gewonde overvaller uit Nederweert zich wel opnemen (die kans was Pz) en in de rechtertak (onschuldscenario) deed hij dat niet (die kans was 1 – Pz). Zowel de linker- als de rechter­ tak splitst zich nu opnieuw voor de mogelijkheid dat zich die nacht nog een – perfect getimede – schietpartij in de buurt voordeed (die kans was 1/35.000) en de mogelijkheid dat dat niet zo was (die kans was 34.999/35.000). In het onschuldsce­ nario was de tweede gewonde een onschuldige, die dus geen reden had om zich niet te laten opnemen. De twee takken waarin zich een tweede schietpartij voordeed, splitsen zich daarom niet opnieuw. (Ten overvloede, ook als we de kansboom zouden uitbreiden voor de mogelijkheid dat een tweede gewonde zich misschien niet zou laten opnemen, verandert er vrijwel niets aan de numerieke waarde van de prior.) Omdat we weten dat er in werkelijkheid precies één opname was die nacht, kunnen we de takken die eindigen met 0 of met 2 ziekenhuisopnames (de rode vakjes) negeren. Dan blijven er twee (groene) vakjes over met elk precies één 353 ziekenhuisopname. Eén van die vakjes moet de ware toedracht weerspiegelen. In het groene vakje van de linker­ tak – met (ietsjes afgerond) een kans van Pz – was de verdachte de dader. In het groene vakje van de rechtertak – met kans van {(1 – Pz)/35.000} – was hij onschuldig. De verhouding tussen deze twee takken geeft ons de prior: prior = {kans op daderschap} / {kans op onschuld} = {Pz} / {(1 – Pz)/35.000} = 35.000 × Pz / (1 – Pz) In deze prior zit nog de onbekende Pz, de kans dat een over­ valler met een kogelwond zich ook daadwerkelijk meldt in een ziekenhuis (dus niet stilletjes sterft of geneest). Stel bijvoorbeeld dat Pz = 0, dat wil zeggen dat een gewonde overvaller zich nooit in een ziekenhuis zou melden. Dan moet een patiënt die zich daar wel heeft gemeld per definitie onschuldig zijn. Daarom wordt de waarde van de prior voor Pz = 0 dus gelijk aan 0. We kunnen ook uitgaan van het omge­ keerde: als Pz = 1, dan wil dat zeggen dat een gewonde over­ valler zich altijd in een ziekenhuis zal melden, en dan moet de patiënt die zich daar heeft gemeld dus per definitie de dader van Nederweert zijn. Ook dat klopt met de waarde van de prior odds, die voor Pz = 1 nadert naar oneindig. In werkelijk­ heid zal Pz natuurlijk noch gelijk aan 0 zijn, noch gelijk aan 1, maar ergens tussen de – zeg – 50 en 90 procent liggen. • Voor Pz = 0,5 is de factor Pz / (1 – Pz) gelijk aan 0,5/0,5 = 1. • Voor Pz = 0,9 is de factor Pz / (1 – Pz) gelijk aan 0,9/0,1 = 9. Daarmee komen de prior odds ruwweg ergens uit tussen de 35.000 en de 300.000. gewonde in Nederweert kans = 100% geen ziekenhuisopname ziekenhuisopname kans = 1 PZ kans = PZ nog een tweede schietpartij kans = PZ (1/35.000) 2 ziekenhuisopnames kans = PZ × (1/35.000) niet nog een tweede schietpartij kans = PZ × (34.999/35.000) 1 ziekenhuisopname kans = PZ × (34.999/35.000) nog een tweede schietpartij kans = (1 PZ) × (1/35.000) 1 ziekenhuisopname kans = (1 PZ) × (1/35.000) niet nog een tweede schietpartij kans = (1 PZ) × (34.999/35.000) 0 ziekenhuisopnames kans = (1 PZ) × (34.999/35.000) December 2015 Menu 33 354 Conclusie Ook dit resultaat is, ondanks de nog weinig verfijnde analyse, veelzeggend. Alle kansin­ schattingen zijn maximaal opgerekt richting onschuld. Desondanks blijven de odds op daderschap minimaal 350.000 tegen 1. Een iets realistischer, maar nog steeds lage schatting is een miljoen tegen een. Dit terwijl een aantal aanvullende belastende bevindingen nog niet eens in de berekening zijn betrokken. Het hof heeft de verdachte vrijgesproken. 4. Conclusie De discussie over de carnavalsmoord is boeiend omdat de advocaat-generaal destijds expliciet betoogde dat de zaak zich leende voor een Bayesiaanse aanpak. Onze conclusie: de noodzaak om een prior te bepalen vormt géén wezenlijk beletsel voor een Bayesiaanse analyse. Er zijn vaak meerdere manieren om een prior te kiezen. Conceptueel komt de keuze neer op een beslissing welke combinatie van bevindingen en/of achter­ grondkennis de basis zal vormen voor het bepalen van de prior, en welke bevindingen middels een likelihood ratio via de regel van Bayes in de berekening zullen worden betrokken. De prior is dan als het ware de uitkomst van een deelanalyse die de kans/odds op daderschap vaststelt louter op grond van een geselecteerde subset van bevindingen. De betreffende subset kan vaak zo worden gekozen dat de priorbepaling conceptu­ eel simpel wordt. De berekeningen zullen, welk startpunt ook wordt gekozen in principe ongeveer dezelfde uitkomst opleveren. Het is een beetje een kwestie van smaak welke prior het meest natuurlijk aanvoelt. Onze voorkeur gaat vaak uit naar een prior die de redenen weerspiegelt waarom iemand in beeld komt bij de opsporing. We hebben laten zien dat de waardes van de prior zeer sterk kunnen variëren (in onze voorbeeldjes zijn priors ter sprake gekomen tussen de één-zesmiljoenste en de 350.000) en dat het dus onjuist is om de prior altijd een vaste waarde te geven (of dat nou 1/2 is of iets anders). Omdat de prior een verme­ nigvuldigingsfactor is, is het eveneens onjuist om te denken dat de waarde van een prior er minder toe doet naarmate er meer ander bewijs voorhanden is.34 Een Bayesiaanse aanpak is niet alleen prak­ tisch mogelijk (zij het waarschijnlijk voorlo­ pig in complexe zaken nog niet zonder hulp van een Bayesiaanse deskundige), maar deze manier van denken is in een aantal zaken in zekere zin ook nodig om tot een goede uitspraak te komen. Er moet dus naar worden gestreefd om op dit gebied meer opleiding en scholing te bieden.35 34 35 Bij optelling werkt dat anders. Een klein getal in een sommatie waarin ook grote getallen voorkomen doet er voor de uitkomst niet meer zo veel toe. Maar een vermenigvuldigingsfactor blijft altijd even relevant. Een tien keer grotere prior zal altijd een tien keer grotere posterior odds opleveren, wat de overige factoren ook zijn. In NJB van 13 februari 2015 (p. 377) concludeert Jaap de Groot in ‘Bayes een brug te ver?’: “De SSR, het opleidingsinstituut van de rechterlijke macht, is – voor zover ik weet – de enige instantie die voor rechters en OM-ers cursussen organiseert in thema’s rond feiten-onderzoek. [...] De noodzaak van institutionalisering van dat nog niet bestaande vakgebied is de impliciete boodschap van dit stuk.” December 2015 Menu 34 A.J. Meulenbroek, ‘Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA‐onderzoek’, Expertise en Recht, p. 73‐903 Menu 35 Drs. A.J. Meulenbroek* Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek Met de onverminderd snelle ontwikkelingen in de DNA-technologie nemen ook de mogelijkheden van het forensisch DNA-onderzoek steeds verder toe. Zo is met de komst van een nieuwe generatie DNA-analysesystemen en geoptimaliseerde LCN (Low Copy Number) DNA-analysemethoden het forensisch DNA-onderzoek nog gevoeliger geworden en wordt steeds meer informatie verkregen uit biologisch sporenmateriaal. De keerzijde hiervan is dat dit type forensische expertise ook steeds complexer wordt. Het beoordelen van de onderzoeksresultaten en het hieruit trekken van conclusies stelt steeds hogere eisen aan de kennis en ervaring van de DNA-deskundigen en aan de wijze waarop zij de resultaten rapporteren. Maar ook van de juristen die met dergelijke rapporten te maken krijgen, wordt steeds meer gevergd. Dit artikel biedt de juristen een leidraad bij het doorgronden van het uitgevoerde DNA-onderzoek en de gerapporteerde resultaten en conclusies. Aan de hand van de aangereikte handvatten kan worden getoetst of het onderzoek zo onbevooroordeeld mogelijk is uitgevoerd en de gerapporteerde conclusies daadwerkelijk zijn begrepen. Centraal staan de opeenvolgende fasen van het forensisch DNA-onderzoek en de verschillende categorieën waarin de resultaten en conclusies van het forensisch DNA-onderzoek kunnen worden onderverdeeld. Waaraan moet DNA-onderzoek van minimale biologische sporen voldoen en wat is het belang van de consensusmethode? Uiteindelijk dienen de resultaten van het DNA-onderzoek te worden beschouwd in de context van de zaak. Aan welke voorwaarden moet zijn voldaan alvorens een deskundige een waarschijnlijkheidsuitspraak kan doen in het licht van hypothesen over hoe het DNA op een object kan zijn terechtgekomen? Conventioneel forensisch DNA-onderzoek Het doel van forensisch DNA-onderzoek is doorgaans de vraag te beantwoorden van welke persoon het biologisch sporenmateriaal afkomstig is. Daartoe maakt men standaard gebruik van het conventionele forensische DNA-onderzoek, dat erop is gericht autosomale DNA-profielen1 te verkrijgen van biologische sporen en van referentiemateriaal van personen (meestal wangslijmvlies). DNA-profielen van biologische sporen kunnen met elkaar worden vergeleken en met DNA-profielen van verdachten, slachtoffers en andere betrokkenen in strafzaken, en in het geval van een match een zeer sterke aanwijzing geven over de herkomst van een biologisch spoor. Een DNA-profiel is een weergave (in pieken en cijfers) van de DNA-kenmerken van een aantal, tegenwoordig meestal vijftien, hypervariabele gebieden op het DNA. De hypervariabele gebieden bevinden zich op het ‘niet-coderende DNA’2 en bestaan uit zich herhalende, ofwel ‘repeterende’, korte stukjes DNA. In een hypervariabel gebied kan het aantal herhalingen per persoon sterk variëren. Hypervariabele gebieden zijn daarom zeer geschikt om biologische sporen naar per- * sonen te herleiden. De plaats van een hypervariabel gebied op het DNA noemt men ‘locus’ (meervoud ‘loci’); elk locus heeft een specifieke code. Elk locus heeft twee DNA-kenmerken. De verschijningsvorm van een locus wordt namelijk bepaald door zowel het DNA-kenmerk voor dit hypervariabele gebied dat van de vader is overgeërfd, als het DNA-kenmerk voor dit hypervariabele gebied dat van de moeder is overgeërfd. De DNA-kenmerken van de loci worden weergegeven in cijfers. Het cijfer staat voor het aantal keer dat het repeterende stukje DNA voorkomt. De twee cijfers kunnen verschillend of gelijk zijn. Als de twee cijfers verschillend zijn is de lengte van het hypervariabele gebied dat van de vader is overgeërfd niet gelijk aan de lengte van het hypervariabele gebied dat van de moeder is overgeërfd. Zo kan bijvoorbeeld bij een bepaalde persoon het locus bestaan uit een serie van zes keer hetzelfde stukje DNA en een serie van acht keer hetzelfde stukje DNA. Dan heeft in dit geval het locus de DNA-kenmerken 6 en 8 (notatie 6/8 of 6;8 of 6,8). Bij een ander persoon bestaat ditzelfde locus bijvoorbeeld uit negen keer hetzelfde stukje DNA en tien keer hetzelfde stukje DNA. Dit locus heeft dan bij Drs. A.J. Meulenbroek is gerechtelijk deskundige Humane biologische sporen en DNA-onderzoek en werkzaam bij het Nederlands Forensisch Instituut (NFI). De auteur bedankt mr. D.J.C. Aben, prof. mr. F.W. Bleichrodt, mr. W. van Schaijck, prof. dr. A.P.A. Broeders, prof. dr. J.F. Nijboer, prof. dr. G.G.J. Knoops LL.M., dr. A.G.M. van Gorp, dr. W.M. Aarts en dr. L.H.J. Aarts voor het kritisch lezen van een eerdere versie van dit artikel en hun waardevolle commentaar. 1. In elke celkern is het DNA verdeeld over tweeëntwintig paren zogenoemde autosomale chromosomen (de ‘niet-geslachtschromosomen’) en één paar geslachtschromosomen. Het DNA in de autosomale chromosomen is het autosomale DNA. Autosomaal DNA-onderzoek is gericht op het verkrijgen van een DNA-profiel op basis van ten minste tien (doorgaans vijftien) plaatsen op het autosomale DNA. 2. Ongeveer 98% van het DNA codeert niet voor erfelijke eigenschappen. Op dit ‘niet-coderende DNA’ bevinden zich duizenden hypervariabele gebieden. Voor forensisch DNA-onderzoek onderzoekt men speciaal hiervoor geselecteerde, hypervariabele gebieden. Expertise en Recht 2011-3 73 Menu 36 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek Forensisch DNA-onderzoek (Pieter Van Driessche) deze persoon de DNA-kenmerken 9 en 10 (9/10). Ook komt het voor dat een locus bestaat uit twee keer een gelijk aantal van hetzelfde stukje DNA. Dit resulteert in twee dezelfde DNA-kenmerken, bijvoorbeeld twee keer 7 (7/7). Specificiteit, gevoeligheid, betrouwbaarheid en digitale opslag De prominente rol die het forensisch DNA-onderzoek heeft verworven in de strafrechtsketen is te danken aan drie eigenschappen die voor elk wetenschappelijk diagnostisch onderzoek van cruciaal belang zijn: specificiteit, gevoeligheid en betrouwbaarheid. Het conventionele autosomale DNA-onderzoek analyseert specifiek tien of meer (doorgaans vijftien) hypervariabele loci. Een DNA-profiel met de DNAkenmerken van tien of meer loci is extreem zeldzaam, en met een frequentie van voorkomen van minder dan één op een miljard in hoge mate persoonsonderscheidend. Gevoeligheid staat voor de geringe hoeveelheid biologisch sporenmateriaal dat voor het onderzoek nodig is. De betrouwbaarheid en robuustheid van de gebruikte techniek, apparatuur en reagentia is aangetoond door validatiestudies en uitgebreid internationaal kwaliteitsonderzoek bij forensische laboratoria. Een vierde belangrijke eigenschap van forensisch DNA-onderzoek is de mogelijkheid van digitale opslag van DNA-profielen: de cijfercodes van DNAprofielen kunnen digitaal worden opgeslagen en vergeleken in een databank. De Nederlandse DNAdatabank voor strafzaken is inmiddels een zeer belangrijk en succesvol opsporingsmiddel gebleken. Forensisch DNA-onderzoek in vier opeenvolgende fasen Forensisch autosomaal DNA-onderzoek vindt plaats in vier opeenvolgende fasen: • Fase 1. Analyseren van de verkregen DNA-profielen: het bepalen van de DNA-kenmerken van de DNA- profielen van het referentiemateriaal en/of de sporen; • Fase 2. Interpreteren van de verkregen DNAprofielen: het kwalificeren van de DNA-profielen van de sporen; • Fase 3. Vergelijkend DNA-onderzoek en vaststellen van de bewijswaarde3 van de resultaten, en het formuleren van de conclusie op bronniveau; • Fase 4. Beschouwen van de bevindingen van het forensisch biologisch onderzoek in samenhang met de overige feiten en omstandigheden in de strafzaak, en het formuleren van de conclusie op activiteitniveau. Stapsgewijs DNA-onderzoek, waarbij deze fasen achtereenvolgens worden doorlopen, geeft de beste waarborg voor een zo objectief mogelijk onderzoek. Twee belangrijke uitgangspunten staan hierbij centraal: • Voor elk te onderzoeken spoor worden de analyse en interpretatie afzonderlijk uitgevoerd, los van het analyseren en interpreteren van andere sporen. Verkregen analyseresultaten van verschillende sporen (of bemonsteringen) mogen niet bij elkaar worden gevoegd om die als één samengesteld, gecombineerd DNA-profiel te vergelijken met andere DNA-profielen. • Informatie over DNA-profielen van referentiemateriaal van personen wordt buiten beschouwing gelaten bij het analyseren en interpreteren van de DNA(meng)profielen van de sporen. Op deze manier wordt voorkomen dat kennis van de DNA-profielen van personen de uitkomst van het later uit te voeren vergelijkend DNA-onderzoek beïnvloedt. Fase 1. Analyseren Bij het conventionele autosomale DNA-onderzoek bepaalt men de DNA-kenmerken van ten minste tien (doorgaans vijftien) verschillende loci en stelt het geslacht vast via het Amelogenine-gen. Hiertoe onderzoekt men altijd dezelfde loci. Forensische laboratoria 3. De bewijswaarde is de door de deskundige toegekende getalsmatige of verbale betekenis van de bevindingen van het forensisch onderzoek. Bij forensisch biologisch onderzoek betreft dit de resultaten en conclusies van het biologische sporenonderzoek (aangetroffen sporen en de aard van de sporen) en/of van het vergelijkend DNA-onderzoek (Uitsluiting, Match met statistische berekening, Match zonder statistische berekening, Niet uit te sluiten en Geen uitspraak). 74 Expertise en Recht 2011-3 Menu 37 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek gebruiken voor het DNA-onderzoek speciaal hiervoor ontwikkelde commerciële DNA-analysesystemen. Het NFI gebruikt sinds 2011 het NGM DNA-analysesysteem (zie kader ‘Het NGM DNA-analysesysteem’). Wanneer de DNA-kenmerken van alle onderzochte loci waarneembaar zijn, wordt gesproken van een volledig DNA-profiel. Isoleren, kwantificeren, vermeerderen (PCR) en detecteren DNA-onderzoek begint met het zo zuiver mogelijk isoleren van het DNA (DNA-extractie) uit de biologische sporen of het referentiemateriaal. Om te voorkomen dat sporenmateriaal wordt gecontamineerd door referentiemateriaal, gebeurt het isoleren van DNA uit biologische sporen in andere laboratoriumruimten dan waar isolatie van DNA uit de referentiemonsters plaatsvindt. Het geïsoleerde DNA, het ‘DNA-extract’, wordt vervolgens gekwantificeerd (het bepalen van de hoeveelheid DNA).4 Tijdens de vermeerderingsstap wordt heel specifiek en exact het DNA van de te analyseren loci in enorm grote hoeveelheden gekopieerd. Het vermeerderen van het DNA van de te analyseren loci gebeurt met de zogenoemde PCR-methode (Polymerase Chain Reaction), waarbij in zich herhalende cycli (in de regel 28-30 ‘PCR-cycli’) het DNA wordt gekopieerd. De vermeerderingsstap is nodig om een voldoende hoeveelheid van het DNA van de loci te verkrijgen om deze te kunnen analyseren. Op basis van de kwantificering wordt een zo optimaal mogelijke hoeveelheid DNAextract gebruikt voor de PCR.5 In één PCR worden alle loci gelijktijdig gekopieerd. Na PCR wordt het gekopieerde DNA van de loci door zogenoemde ‘capillaire gelelektroforese’ van elkaar gescheiden en gedetecteerd op basis van lengte en het fluorescerend kleurlabel dat tijdens de PCR is toegevoegd. Met speciale software worden de lengtes van de gekopieerde loci vastgesteld en wordt uitgerekend uit hoeveel repeterende stukjes DNA ze bestaan. Het resultaat van de analyse, de DNA-kenmerken van de onderzochte loci, wordt weergegeven in een piekenprofiel, het ‘elektroferogram’. De plaats van een piek geeft aan welk DNAkenmerk het betreft en wordt weergegeven met een cijfer. De hoogte van een piek weerspiegelt in welke relatieve hoeveelheid het DNA met het desbetreffende DNA-kenmerk in de bemonstering aanwezig is. Dit wordt weergegeven in ‘relatieve fluorescentie units’ (RFU’s). Het NGM DNA-analysesysteem Het NGM DNA-analysesysteem behoort tot de nieuwe generatie DNA-analysesystemen en is door producent Applied Biosystems ontwikkeld in nauwe samenwerking met de internationale wetenschappelijke gemeenschap van forensisch DNA-deskundigen. NGM staat voor Next Generation Multiplex. Door implementatie van nieuwe inzichten en technologie biedt het NGM DNA-analysesysteem een aantal belangrijke voordelen ten opzichte van het SGM-Plus DNA-analysesysteem, dat in de periode 1999-april 2011 door het NFI werd gebruikt. Hoger persoonsonderscheidend vermogen Het NGM DNA-analysesysteem bepaalt van vijftien loci de DNA-kenmerken en stelt daarnaast het geslacht vast.6 Het betreft de tien loci die ook met het SGM-Plus DNA-analysesysteem worden bepaald, plus vijf extra loci. Door deze uitbreiding worden meer DNA-kenmerken bepaald en hebben de DNAprofielen die zijn verkregen met het NGM DNAanalysesysteem een lagere frequentie van voorkomen en daardoor een hogere zeldzaamheidswaarde en hoger persoonsonderscheidend vermogen dan DNA-profielen die zijn verkregen met het SGM-Plus DNA-analysesysteem. Gevoeliger Het NGM DNA-analysesyteem is gevoeliger dan het SGM-Plus DNA-analysesysteem en daardoor beter geschikt voor onderzoek van minimale biologische sporen. Robuuster Door de verder geoptimaliseerde chemie heeft het NGM DNA-analysesyteem minder last van onzuiverheden en remmende effecten in bemonsteringen. Het is daardoor beter geschikt voor onderzoek van deels afgebroken DNA en verontreinigd DNA. Europese Standaard Set van twaalf loci Om bij de internationale uitwisseling van DNAprofielen de kans op toevallige matches zo klein mogelijk te houden is internationaal7 besloten (en bekrachtigd in Europese wetgeving) om de Europese Standaard Set (ESS) uit te breiden van zeven naar twaalf loci. Al deze twaalf loci maken deel uit van het NGM DNA-analysesysteem. 4. Tijdens de kwantificering wordt ook bepaald hoeveel mannelijk DNA in het extract aanwezig is. Daarnaast wordt vastgesteld of het DNA-extract componenten bevat die een remmende of blokkerende werking hebben op de hierna uit te voeren vermeerderingsstap. Deze componenten zijn meestal afkomstig van het object waarvan het spoor is veiliggesteld (bijvoorbeeld kleurstoffen in kleding). 5. Dit is essentieel omdat te veel of te weinig DNA resulteert in moeilijk of niet te interpreteren DNA-profielen. 6. Het NGM DNA-analysesysteem bepaalt de DNA-kenmerken van vijftien loci en stelt het geslacht vast (Amelogenine-gen). De vijftien loci zijn: D3S1358; VWA; D16S539; D2S1338; D8S1179; D21S11; D18S51; D19S433; TH01; FGA; D10S1248; D22S1045; D2S441; D1S1656; D12S391. De cursief gedrukte loci maakten ook deel uit van het SGM-Plus DNA-analysesysteem. De onderstreepte loci vormen de Europese Standaard Set (ESS). 7. European Network of Forensic Science Institutes (ENFSI) en European DNA Profiling Group (EDNAP). Expertise en Recht 2011-3 75 Menu 38 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek Meer informatieve DNA-profielen Al geruime tijd voor april 2011 zette het NFI het NGM DNA-analysesysteem in bij aanvullend DNAonderzoek in complexe zaken en cold cases. In veel gevallen werden daarbij meer informatieve DNAprofielen verkregen dan bij eerder uitgevoerd onderzoek met het SGM-Plus DNA-analysesysteem. Dit betreft met name onderzoek van minimale biologische sporen, sporen van meerdere personen, deels afgebroken en/of verontreinigd DNA. Fase 2. Interpreteren De tweede fase is het interpreteren van het DNAprofiel dat van het spoor is verkregen. Hierbij beschouwt de deskundige het DNA-profiel van het spoor in zijn totaliteit en onderzoekt hij in hoeverre er sprake is van een onderlinge samenhang van de verschillende DNA-kenmerken. Het in zijn totaliteit beschouwen van het DNA-profiel is een belangrijke waarborg die voorkomt dat tijdens de derde fase van het onderzoek, het vergelijkend DNA-onderzoek, een enkel DNA-kenmerk afzonderlijk, los van de andere DNA-kenmerken in het DNA-profiel, wordt verklaard. Bij het interpreteren, het kwalificeren van het DNAprofiel, zijn onder meer de volgende vragen van belang: • Bevat het spoor waarvan het DNA-profiel is verkregen een relatief grote of een relatief kleine hoeveelheid DNA? Is er sprake van een DNA-profiel van een minimaal biologisch spoor? • Is het een volledig of onvolledig DNA-profiel? • Betreft het een enkelvoudig DNA-profiel (één persoon)? • Betreft het een DNA-mengprofiel (meer dan één persoon)? Zie verder ‘DNA-mengprofielen’; • Is het enkelvoudige DNA-profiel van een man of een vrouw? • Hoe zeldzaam is het enkelvoudige DNA-profiel? De zeldzaamheidswaarde wordt uitgedrukt in de berekende frequentie van voorkomen. Berekende frequentie De zeldzaamheidswaarde van een DNA-profiel wordt uitgedrukt in de ‘berekende frequentie’ van voorkomen van het DNA-profiel in de populatie. De berekening wordt uitgevoerd met speciaal daarvoor ontwik- kelde, gevalideerde rekenprogramma’s en is gebaseerd op populatiegenetische gegevens uit een referentiedatabestand. Met dit referentiedatabestand is voor elk DNA-kenmerk dat bij het DNA-onderzoek kan voorkomen bepaald hoe vaak het in de populatie voorkomt.8 Het rekenprogramma berekent de frequentie van een DNA-profiel door de frequenties van de vastgestelde DNA-kenmerken met elkaar te vermenigvuldigen (door toepassing van de zogenoemde ‘productregel’, inclusief statistische correcties).9 Voor DNA-profielen met de DNA-kenmerken van tien of meer loci is de berekende frequentie altijd kleiner dan één op een miljard. Met andere woorden, de kans dat het DNA-profiel van een persoon matcht met het DNAprofiel van een willekeurig gekozen, niet-bloedverwante persoon, is altijd kleiner dan één op een miljard.10 Onvolledige DNA-profielen In een onvolledig DNA-profiel zijn niet van al de onderzochte loci de DNA-kenmerken bepaald.11 Met name bij sporen die heel weinig DNA bevatten, of waarvan het DNA deels is afgebroken komt het voor dat het DNA van een of meer loci tijdens de vermeerderingsstap (fase 1) in onvoldoende mate wordt gekopieerd. De zeldzaamheidswaarde van een onvolledig DNA-profiel is geringer dan dat van een volledig DNA-profiel. Immers, de kans dat een willekeurig gekozen persoon bijvoorbeeld dezelfde acht DNA-kenmerken (van vier loci) als die van het spoor heeft, is vele malen groter dan de kans dat hij dezelfde dertig DNA-kenmerken (van vijftien loci) als die van het spoor heeft. De bewijswaarde van een match met een onvolledig DNA-profiel is daarom in de regel minder hoog dan van een match met een volledig DNA-profiel. De berekende frequentie van voorkomen is afhankelijk van het aantal DNA-kenmerken én van de frequentie waarmee deze DNA-kenmerken voorkomen. Een onvolledig DNA-profiel bestaande uit slechts enkele, maar wel zeldzame DNA-kenmerken kan daarom toch een lage berekende frequentie van voorkomen hebben en derhalve bij een match een hoge bewijswaarde. DNA-mengprofielen Een spoor kan ook celmateriaal van meer dan een persoon bevatten, zoals een bemonstering van een door meerdere personen gedragen bivakmuts. In de regel geldt dat als van een spoor een DNA-profiel is verkre- 8. Het is een statistische schatting op basis van een referentiedatabestand. Rekenmodellen laten zien dat de frequenties van de verschillende DNA-kenmerken die per locus kunnen voorkomen betrouwbaar statistisch zijn te schatten met een referentiedatabestand van ten minste tweehonderd personen. Het NFI en het Forensisch Laboratorium voor DNA Onderzoek (FLDO) maken gebruik van een referentiedatabestand van 2085 personen. De frequenties van voorkomen van de verschillende DNA-kenmerken liggen over het algemeen tussen 0,2% en 30%. 9. De statistische correcties betreffen een rekenkundige correctie voor het feit dat subgroepen in de populatie voorkomen en een rekenkundige correctie voor het feit dat de gehanteerde frequenties waarmee de DNA-kenmerken in de populatie voorkomen zijn vastgesteld op basis van een referentiedatabestand. 10. De berekende frequentie is niet van toepassing op bloedverwante personen. Voor bloedverwanten van de met het spoor matchende verdachte geldt dat de kans groter is dat hun DNA-profiel matcht met dat van het spoor, dan het DNA-profiel van een niet-bloedverwante persoon. Daarnaast hebben eeneiige tweelingen hetzelfde DNA-profiel. 11. De aanduiding ‘onvolledig’ is een kwantitatief waardeoordeel over het verkregen DNA-profiel en nadrukkelijk geen kwalitatief waardeoordeel over het verkregen DNA-profiel. 76 Expertise en Recht 2011-3 Menu 39 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek gen waarin een of meer loci méér dan twee DNAkenmerken hebben, er sprake is van een DNAmengprofiel. Immers, een persoon heeft per locus maximaal twee verschillende DNA-kenmerken. Bij het interpreteren van DNA-mengprofielen worden de volgende vragen beantwoord: • Is het een volledig of onvolledig DNA-mengprofiel? • Van (minimaal) hoeveel personen is celmateriaal (DNA) in de desbetreffende bemonstering aanwezig? De aanname over het aantal personen wordt gebaseerd op het aantal DNA-kenmerken dat per locus wordt waargenomen. Zijn bijvoorbeeld op een of meer loci ten minste vijf DNA-kenmerken zichtbaar, dan bevat de bemonstering DNA van minimaal drie personen. • Betreft het DNA van mannen en/of vrouwen? • Hoe verhouden de bijgedragen hoeveelheden celmateriaal van de verschillende personen zich tot elkaar? Op basis van de hoogte van de pieken kan de relatieve hoeveelheid celmateriaal die iemand heeft bijgedragen aan het spoor worden geschat. Hierbij geldt: hoe hoger de piek, hoe meer celmateriaal aanwezig is met het desbetreffende DNA-kenmerk. • Is uit het DNA-mengprofiel een enkelvoudig DNAprofiel (afkomstig van één persoon) af te leiden? Een enkelvoudig DNA-profiel kan worden afgeleid wanneer op grond van zaaksinformatie een van de celdonoren bekend kan worden verondersteld, of op basis van verschillen in piekhoogtes. Hoe zeldzaam is het afgeleide enkelvoudige DNA-profiel? Dit wordt uitgedrukt in de berekende frequentie van voorkomen. • Is uit het DNA-mengprofiel geen enkelvoudig DNAprofiel af te leiden? Als uit het DNA-mengprofiel geen enkelvoudig DNAprofiel is af te leiden, dan wordt vastgesteld of voor het DNA-mengprofiel is te berekenen hoe groot de kans is dat het DNA-profiel van een willekeurig gekozen persoon hiermee matcht (de zogenoemde ‘inclusiekans’, zie kader ‘Statistische berekening van een match’ op pagina 81 en 82).12 Voor meer informatie over DNA-mengprofielen zie Bijlage ‘Onderscheid DNA-profielen’ op pagina 89 en 90. DNA-profielen van minimale biologische sporen Minimale biologische sporen zijn biologische sporen die zeer weinig DNA bevatten. Dit kunnen sporen zijn van minimale hoeveelheden bloed, sperma of speeksel, of haarsporen met zeer weinig celmateriaal aan de haarwortel, maar vaak gaat het om biologische contactsporen.13 Doordat minimale biologische sporen zeer weinig DNA bevatten, resulteert de standaard DNA-analyse meestal in onvolledige DNA-profielen waarin pieken zo zwak aanwezig kunnen zijn dat ze niet eenduidig aan DNA-kenmerken zijn toe te schrijven. Dergelijke onvolledige DNA-profielen met relatief zwak aanwezige pieken zijn vaak onvoldoende geschikt voor vergelijkend DNA-onderzoek. Afhankelijk van de kwaliteit van het DNA-profiel beoordeelt de DNA-deskundige of aanvullend DNA-onderzoek kan resulteren in een informatiever DNA-profiel en welke methoden daarvoor het best geschikt zijn. In grote lijnen zijn er twee opties voor aanvullend DNA-onderzoek: • de uitgevoerde (standaard) DNA-analyse twee keer, eventueel (bij een relatief zeer geringe hoeveelheid DNA) drie keer op dezelfde manier herhalen en op basis hiervan een zogenoemd consensus DNAprofiel vaststellen; • LCN (Low Copy Number) DNA-analyse en dit twee keer, eventueel (bij een relatief zeer geringe hoeveelheid DNA) drie keer herhalen en op basis hiervan een consensus LCN DNA-profiel vaststellen. Consensus DNA-profiel Om vast te stellen of (zwak aanwezige) pieken in DNAprofielen van minimale biologische sporen daadwerkelijk DNA-kenmerken van het desbetreffende spoor representeren en geen complicerende neveneffecten zijn (zie kader ‘Complicerende neveneffecten’), wordt de DNA-analyse van minimale biologische sporen drie keer, eventueel vier keer, uitgevoerd.14 De drie of vier monsters van het DNA-extract worden onder vergelijkbare reactieomstandigheden onderworpen aan een DNA-analyse. Al deze resultaten worden met elkaar vergeleken. Op basis hiervan wordt beoordeeld of een waargenomen piek reproduceerbaar is en een DNAkenmerk representeert. Pieken die ten minste twee keer worden waargenomen in de drie of vier DNA- 12. In dit stadium van het onderzoek, het interpreteren van het verkregen DNA-(meng)profiel, is alleen de inclusiekans aan de orde. De andere veel gebruikte statistische methode, de likelihood ratio-methode, is gebaseerd op twee verschillende hypothesen op bronniveau en kan pas worden toegepast wanneer er sprake is van een match met het DNA-profiel van een persoon (in de derde fase van het onderzoek). 13. Een biologisch contactspoor is een biologisch spoor waarvan de aard niet is te bepalen/bepaald en waarvan het aannemelijk is dat het is ontstaan doordat, als gevolg van direct of indirect contact, lichaamscellen en/of vloeistoffen van een persoon zijn overgedragen op een andere persoon of op een object. 14. Het NFI heeft wetenschappelijk onderzoek verricht naar het optimale aantal DNA-analyses voor de bepaling van een consensus DNA-profiel in geval van minimale biologische sporen. Dit onderzoek wijst uit dat de vaststelling of een piek een DNA-kenmerk representeert of een complicerend neveneffect kan zijn drie, bij voorkeur vier keer de uitvoering van een DNA-analyse onder vergelijkbare reactieomstandigheden vergt. Pieken die ten minste twee keer worden waargenomen in de drie of vier DNA-analyses kunnen worden beschouwd als betrouwbare DNA-kenmerken. C.C.G. Benschop, C.P van der Beek, H.C. Meiland, A.G.M. van Gorp, A.A. Westen & T. Sijen, ‘Low template STR typing: Effect of replicate number and consensus method on genotyping reliability and DNA database search results’, Forensic Science International: Genetics, 2010, doi:10.1016/j.fsigen.2010.06.006. Expertise en Recht 2011-3 77 Menu 40 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek analyses kunnen worden beschouwd als betrouwbaar vastgestelde DNA-kenmerken van de celdonor(en) van het spoor. De op deze manier vastgestelde combinatie van DNA-kenmerken van het spoor wordt in de vakliteratuur doorgaans aangeduid als het ‘consensus DNA-profiel’. Het consensus DNA-profiel wordt vervolgens betrokken bij het vergelijkend DNA-onderzoek. Niet-reproduceerbare pieken kunnen niet zonder meer als DNA-kenmerken worden gekwalificeerd en niet zonder meer worden betrokken bij vergelijkend DNAonderzoek. LCN (Low Copy Number) DNA-analyse LCN DNA-analysemethoden zijn toegespitst op het analyseren van een geringe hoeveelheid DNA.15 Hiermee kunnen DNA-kenmerken zichtbaar worden gemaakt die niet of nauwelijks zichtbaar waren in de DNA-profielen uit standaard DNA-onderzoek. Bij LCN DNA-analyse worden dezelfde loci onderzocht (met dezelfde DNA-analysesystemen) als bij standaard DNAanalyse. De resultaten kunnen daarom worden vergeleken met die van de standaard DNA-analyse. In grote lijnen zijn twee vormen van LCN DNA-analyse te onderscheiden: • LCN DNA-analyse met extra vermeerderingsstappen (34 PCR-cycli in plaats van de standaard 28-30 PCRcycli). Een LCN DNA-analyse met extra PCR-cycli resulteert in theorie in meer kopieën en is over het algemeen de meest gevoelige methode. • LCN DNA-analyse met gevoeligere detectie. Door aanpassingen in het detectieproces wordt een grotere hoeveelheid van het vermeerderde DNA geanalyseerd. De LCN DNA-analysemethode met gevoeligere detectie heeft geen extra PCR-cycli. De hogere gevoeligheid wordt gerealiseerd doordat het detectieproces zodanig is aangepast dat een veel grotere hoeveelheid van het gekopieerde DNA kan worden geanalyseerd. Hierdoor kunnen DNAkenmerken die in geringe mate zijn gekopieerd nu wel of beter worden gedetecteerd. Het grote nadeel van de zeer hoge gevoeligheid van de LCN DNA-analysemethoden is dat de kans op complicerende neveneffecten veel groter is dan bij de standaard DNA-analyse. Om deze reden wordt LCN DNAanalyse niet standaard toegepast. Bij LCN DNA-analyse worden de (na herhaald onderzoek) betrouwbaar vastgestelde DNA-kenmerken weergegeven in het consensus LCN DNA-profiel. LCN DNA-analyse wordt pas overwogen nadat de resultaten van de standaard DNAanalyse bekend zijn. De hoeveelheid en de kwaliteit van het DNA en het resultaat van het standaard DNAonderzoek zijn bepalend voor de keuze welke LCN DNA-analysemethode wordt toegepast. Complicerende neveneffecten Inherent aan de hoge gevoeligheid van LCN DNAanalyse is dat de kans op het optreden van complicerende neveneffecten groter is dan bij standaard DNA-analyse. Deze neveneffecten zijn van invloed op de betrouwbaarheid van de verkregen DNAprofielen. De neveneffecten hebben vaak een ‘stochastisch karakter’, wat betekent dat ze deels door toeval ontstaan. LCN DNA-analyse vereist dat de reproduceerbaarheid van de pieken wordt getoetst, en dat op grond daarvan een consensus DNA-profiel wordt vastgesteld. De belangrijkste complicerende neveneffecten die kunnen optreden zijn allele drop-in, heterozygoot onbalans, allele drop-out en prominent aanwezige stotterpieken. Allele drop-in betreft een (extra) piek in het DNAprofiel die geen DNA-kenmerk representeert van het DNA van het spoor. Het gaat dan om een DNAkenmerk van een minimale hoeveelheid DNA die vanuit de ‘omgeving’ het spoor (of het stuk van overtuiging) of het DNA-extract, heeft gecontamineerd en tijdens de vermeerderingsstap is meegekopieerd. Een dergelijk DNA-kenmerk behoort veelal toe aan een deel van een enkele cel met slechts een fragment van het totale DNA van die cel. Allele dropin doet zich in de praktijk vooral voor bij LCN DNAanalyses met extra vermeerderingsstappen. Bij het standaard DNA-onderzoek van sporen met voldoende DNA is de kans op dit neveneffect zeer veel kleiner, omdat de hoeveelheid DNA van een celfragment of enkele cellen uit de omgeving van het spoor wegvalt bij de veel grotere hoeveelheid DNA van het spoor zelf. Bij heterozygoot onbalans (of heterozygoot disbalans) verschillen op een locus de piekhoogtes van de twee DNA-kenmerken van een persoon dermate dat uit het DNA-profiel niet is op te maken dat ze toebehoren aan dezelfde persoon. Doordat het biologische spoor slechts zeer weinig celmateriaal en dus DNA bevat, worden tijdens de vermeerderingsstap (PCR) niet beide DNA-kenmerken van het locus in vergelijkbare mate gekopieerd, zoals bij voldoende DNA. Dit effect wordt mede door het toeval bepaald (stochastisch effect). Hoe geringer de hoeveelheid DNA, des te groter de kans op, en mate van heterozygoot onbalans. Allele drop-out is een extreme vorm van heterozygoot onbalans, waarbij een DNA-kenmerk van een bepaald locus niet (of dermate onvoldoende) is gekopieerd, waardoor dit DNA-kenmerk niet (als piek) zichtbaar is in het DNA-profiel.16 Allele dropout is inherent aan alle typen DNA-onderzoek 15. Andere termen voor deze categorie van DNA-onderzoeken zijn ‘Low Template’ DNA-analyse (afgekort als LT DNA-analyse) en ‘Low level DNA-analyse’. 16. In het geval van locus drop-out zijn geen van beide DNA-kenmerken van het desbetreffende DNA als pieken zichtbaar in het DNA-profiel. 78 Expertise en Recht 2011-3 Menu 41 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek waarbij slechts een zeer geringe hoeveelheid DNA in het uitgangsmateriaal aanwezig is. Het is bekend dat sommige loci gevoeliger zijn voor allele drop-out dan andere. Een prominent aanwezige stotterpiek is een (extra) piek in het DNA-profiel die geen DNA-kenmerk representeert van het DNA van het spoor. Stotterpieken bevinden zich over het algemeen één positie voor de pieken van de werkelijke DNA-kenmerken. Ook komt het soms voor dat een stotterpiek één positie na de piek van het werkelijke DNA-kenmerk ligt. DNA-profielen verkregen met standaard DNA-onderzoek bevatten ook stotterpieken, maar deze zijn in de regel goed te onderscheiden van pieken die toebehoren aan DNA-kenmerken. Omdat bij LCN DNA-analyse deze stotterpieken prominent aanwezig kunnen zijn, zijn ze moeilijker te onderscheiden van de pieken van DNA-kenmerken. Fase 3. Vergelijken en bewijswaarde Na het analyseren (fase 1) en het interpreteren (fase 2) volgt de derde fase: het vergelijkend DNA-onderzoek van het DNA-profiel van het spoor met DNA-profielen van personen en/of andere sporen. Deze stapsgewijze benadering waarborgt onbevooroordeeld (‘unbiased’) vergelijkend DNA-onderzoek. De deskundige neemt immers pas kennis van het DNA-profiel van de te vergelijken persoon nadat het analyseren en het interpreteren van het DNA-profiel van het spoor is afgerond. Op deze manier wordt voorkomen dat de deskundige het DNA-profiel van bijvoorbeeld de verdachte als uitgangspunt neemt en er onbewust op is gespitst in het DNA-profiel van het spoor DNA-kenmerken waar te nemen die ook in het DNA-profiel van de verdachte aanwezig zijn, of informatie in het DNA-profiel over het hoofd ziet die kan wijzen op een uitsluiting van de verdachte. Dit zou zich met name kunnen voordoen bij DNA-profielen van minimale biologische sporen. Het vergelijkend DNA-onderzoek neemt niet alleen overeenkomsten, maar ook verschillen tussen de DNAprofielen in aanmerking. Bewijswaarde De bewijswaarde van het resultaat van het vergelijkend DNA-onderzoek is afhankelijk van de waargenomen overeenkomsten en verschillen tussen de DNAprofielen. Het resultaat van vergelijkend DNA-onderzoek van het DNA-profiel van een persoon met het DNA-(meng)profiel van een spoor is onder te brengen in een van de vier onderstaande categorieën: • Categorie A: Uitsluiting; • Categorie B: Match met statistische berekening; • Categorie C: Match zonder statistische berekening; Expertise en Recht 2011-3 • Categorie D: Geen uitsluiting of match. Categorie D is onderverdeeld in subcategorie D1: Niet uit te sluiten en subcategorie D2: Geen uitspraak. Categorie A en categorie B hebben relatief de hoogste bewijswaarden en categorie D doorgaans relatief de laagste bewijswaarde. De deskundige spreekt van een match (categorie B en C) wanneer voor de bij het vergelijkend DNA-onderzoek betrokken loci kan worden geconcludeerd dat alle DNA-kenmerken van de persoon ook aanwezig zijn in het DNA-profiel van het spoor. Voor een DNA-mengprofiel betekent dit dat de loci waarop de match is gebaseerd (onder meer) dezelfde DNA-kenmerken bevatten als de desbetreffende loci van het DNA-profiel van de persoon. Idealiter Idealiter zou forensisch DNA-onderzoek moeten resulteren in DNA-profielen waarin alle DNA-kenmerken van al de celdonoren zichtbaar zijn. Het resultaat van vergelijkend DNA-onderzoek zou dan zijn: uitsluiting (categorie A) of een match met statistische berekening (categorie B). In de praktijk komt het echter veelvuldig voor dat de hoeveelheid en/of de kwaliteit van het te onderzoeken DNA van het spoor zelfs met de nieuwste forensische DNA-analysesystemen onvoldoende is om hiervan alle DNA-kenmerken van alle celdonoren (voldoende betrouwbaar) aan te tonen. Wanneer niet alle DNA-kenmerken (reproduceerbaar) aanwezig zijn in het DNA-profiel van het spoor, zal het resultaat van het vergelijkend DNA-onderzoek in veel situaties vallen onder categorie C of D. Categorie A: Uitsluiting Een persoon wordt uitgesloten als celdonor van een spoor als: • zijn/haar DNA-profiel niet matcht met het DNAprofiel van het biologische spoor, en • het DNA-profiel van het spoor bovendien geen aanwijzingen bevat (zoals mogelijk allele drop-out) die erop kunnen duiden dat er wel sprake zou kunnen zijn van een match als het technisch mogelijk was alle DNA-kenmerken van het spoor vast te stellen. De uitsluiting als celdonor is absoluut. Het betreft geen kansuitspraak, zodat een statistische berekening niet nodig is. Categorie B: Match met statistische berekening Resulteert het vergelijkend DNA-onderzoek in matchende DNA-profielen, dan is van belang of de bewijswaarde daarvan statistisch is te onderbouwen. De voorwaarde voor een statistische berekening van de bewijswaarde van een match is de vaststelling of aanname (op basis van het resultaat van het DNAonderzoek) dat van de loci waarop de match is geba- 79 Menu 42 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek seerd, alle DNA-kenmerken van alle celdonoren van het spoor in het DNA-profiel aanwezig zijn.17 In de praktijk is dit over het algemeen alleen mogelijk voor enkelvoudige DNA-profielen en DNA-mengprofielen van twee personen (en in uitzonderlijke gevallen voor DNA-mengprofielen van drie personen).18 Voor DNAmengprofielen van twee personen betekent dit dat aangenomen moet kunnen worden dat van de loci waarop de match is gebaseerd alle DNA-kenmerken van beide celdonoren van het spoor zijn vastgesteld. Categorie C: Match zonder statistische berekening Wanneer van de loci waarop de match is gebaseerd niet alle DNA-kenmerken van alle celdonoren van het spoor zijn vast te stellen (of dat onzeker is of al deze DNA-kenmerken zijn vastgesteld),19 kan de bewijswaarde van een match niet worden onderbouwd met een statistische berekening. Omdat deze informatie ontbreekt hebben dergelijke matches doorgaans een relatief lagere bewijswaarde dan matches waarbij wel een statistische berekening mogelijk is. Bij categorie C is het soms mogelijk in voorkomende gevallen een match met een verbale waarschijnlijkheidsuitspraak (in het licht van twee elkaar uitsluitende hypothesen op bronniveau, zie kader ‘Hypothesen op drie niveaus’) te kwalificeren. Een verbale waarschijnlijkheidsuitspraak is minder nauwgezet dan een getalsmatige uitspraak. Categorie D: Geen uitsluiting of match Situaties waarin er, overeenkomstig de definities, geen sprake is van een uitsluiting (categorie A) of van een match (categorieën B en C) vallen onder categorie D. De kwaliteit en/of hoeveelheid van het DNA van het spoor is dan dermate onvoldoende dat essentiële informatie in het verkregen DNA-profiel ontbreekt om te kunnen spreken van hetzij een uitsluiting, hetzij een match. Er zijn in dat geval twee situaties te onderscheiden: Categorie D1: Niet uit te sluiten De desbetreffende persoon is niet uit te sluiten als (een) celdonor van het spoor. De mogelijkheid bestaat dat een relatief groot aantal DNA-kenmerken van een persoon ook voorkomt in een (zeer) onvolledig DNAmengprofiel, maar dat tegelijkertijd ook een of enkele DNA-kenmerken niet eenduidig in het DNA-mengprofiel voorkomen. In dat geval kan niet worden vastge- steld of er een overeenkomst is op alle bij het vergelijkend DNA-onderzoek betrokken loci. Aan de voorwaarden voor een match (zoals in categorie B en C) wordt vanwege zowel overeenkomsten als verschillen niet voldaan. Met name bij minimale biologische sporen wordt tijdens de vermeerderingsstap (PCR, fase 1) niet van alle loci het DNA in dezelfde mate gekopieerd, waardoor DNA-kenmerken (van sommige loci) onvoldoende of niet zichtbaar kunnen zijn als pieken in het DNA-profiel (allele drop-out). In dergelijke gevallen is de desbetreffende persoon niet uit te sluiten als een van de personen van wie het celmateriaal in de bemonstering afkomstig kan zijn. In categorie D1 kan de mate van overeenkomst tussen de DNA-profielen van de persoon en het spoor en de mogelijk te verklaren verschillen soms met een verbale waarschijnlijkheidsuitspraak (in het licht van twee elkaar uitsluitende hypothesen op bronniveau) worden uitgedrukt. Afhankelijk van de posities en de mate waarin de niet eenduidig voorkomende DNAkenmerken zich manifesteren, kunnen de verkregen resultaten beter passen bij de hypothese dat het spoor celmateriaal (DNA) bevat van de desbetreffende persoon dan bij de hypothese dat het spoor geen celmateriaal (DNA) bevat van de desbetreffende persoon. Andersom kan ook het geval zijn. De bewijswaarden van overeenkomsten die vallen onder categorie D1 zullen veelal lager zijn dan van matches die vallen onder categorie C. Immers, bij een vergelijkbaar aantal bij het vergelijkend DNA-onderzoek betrokken loci is, in tegenstelling tot categorie D1, bij categorie C wel vastgesteld dat voor de desbetreffende loci alle DNA-kenmerken van de persoon ook aanwezig zijn in het DNA-profiel van het spoor. Categorie D2: Geen uitspraak Het kan zijn dat op basis van het resultaat van het vergelijkend DNA-onderzoek geen uitspraak kan worden gedaan over de mogelijke aan- of afwezigheid van celmateriaal van de vergeleken persoon in de bemonstering van het spoor. Een dergelijk resultaat geeft noch steun aan een hypothese over de aanwezigheid noch steun aan een hypothese over afwezigheid van DNA van deze persoon in het spoor. Dit betekent feitelijk dat (zeer) veel personen op grond van het vergelijkend DNA-onderzoek niet met zekerheid zijn uit te sluiten als mogelijke celdonor en dat de bewijswaarde zeer gering is. Deze toestand doet zich vooral 17. Dus niet alleen de DNA-kenmerken die overeenkomen met de matchende persoon, maar alle DNA-kenmerken van alle celdonoren van het spoor. Een statistische berekening is immers gebaseerd op alle DNA-kenmerken die het spoor heeft voor de desbetreffende loci. 18. In de wetenschappelijke literatuur zijn inmiddels statistische modellen en rekenprogramma’s beschreven waarmee met complicerende neveneffecten als allele drop-out, allele drop-in en prominent aanwezige stotterpieken in DNA-profielen rekening wordt gehouden. Deze methoden moeten verder worden ontwikkeld voor toepassing in de praktijk. Met dergelijke methoden zal de statistische berekening niet meer beperkt zijn tot matches met enkelvoudige DNA-profielen en DNA-mengprofielen van twee personen. 19. Voor de bij het vergelijkend DNA-onderzoek betrokken loci kan worden geconcludeerd dat alle DNA-kenmerken van de desbetreffende (matchende) persoon ook aanwezig zijn in het DNA-mengprofiel van het spoor, en dat niet van alle celdonoren de DNA-kenmerken konden worden vastgesteld (of dat dit onzeker is). 80 Expertise en Recht 2011-3 Menu 43 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek voor bij vergelijkend DNA-onderzoek met onvolledige, zeer weinig persoonsonderscheidende DNA-mengprofielen, afkomstig van ten minste drie personen. Statistische berekening van een match Match met een enkelvoudig DNA-profiel: berekende frequentie van voorkomen Bij een match met een enkelvoudig DNA-profiel wordt de bewijswaarde uitgedrukt met de berekende frequentie van voorkomen van het enkelvoudige (afgeleide en/of onvolledige) DNA-profiel van het spoor in de populatie. Hoe lager de berekende frequentie, hoe zeldzamer het DNA-profiel en hoe hoger de bewijswaarde van de match. Bij een enkelvoudig DNA-profiel, dat bestaat uit de DNAkenmerken van tien of meer loci, is de berekende frequentie altijd kleiner dan één op een miljard. Betreft het een (onvolledig) DNA-profiel dat uit minder dan tien loci bestaat, dan is de berekende frequentie hoger en de bewijswaarde dus lager. Bloedverwanten De berekende frequentie van voorkomen heeft betrekking op de kans op een match met DNAprofielen van willekeurig gekozen personen uit een populatie, en is niet van toepassing op bloedverwanten. Voor bloedverwanten van de met het spoor matchende persoon geldt dat de kans dat hun DNAprofiel matcht met dat van het spoor aanzienlijk groter is dan het geval is bij personen die geen bloedverwant zijn van de met het spoor matchende persoon. Dit komt doordat mensen die genetisch aan elkaar verwant zijn, onderling meer overeenkomsten in hun DNA hebben dan niet-bloedverwanten. Met name bij onvolledige enkelvoudige DNA-profielen (met een hogere frequentie en een lagere bewijswaarde) en DNA-mengprofielen kan dit van belang zijn. Geen absolute herkomstuitspraak alleen op basis van een match Ook al is een DNA-profiel extreem zeldzaam, het is nooit te achterhalen of dit DNA-profiel echt uniek is in de gehele wereldbevolking. Daarnaast hebben eeneiige meerlingen hetzelfde DNA-profiel. Een deskundige kan daarom op grond van matchende DNAprofielen geen absolute uitspraak doen en met zekerheid concluderen dat de matchende verdachte de celdonor is van het spoor. Het is uiteindelijk aan de rechter om hierover een uitspraak te doen door de bevindingen van het DNA-onderzoek te combineren met de overige feiten en omstandigheden in de zaak. Een deskundige kan wél een absolute herkomstuitspraak doen wanneer het DNA-profiel van een persoon niet matcht met dat van het spoor. Dan kan men deze persoon uitsluiten als celdonor van het biologische spoor (onder voorbehoud van fouten in de onderzoeksketen). Uitspraak over zeldzaamheid, niet over herkomst De berekende frequentie van voorkomen geeft de zeldzaamheid van het DNA-profiel weer: de kans dat het DNA-profiel van een willekeurig gekozen persoon matcht met dit DNA-profiel. Deze zeldzaamheidswaarde betreft géén kansuitspraak over de ‘herkomst van het DNA-profiel’, en dus géén kansuitspraak over de herkomst van het desbetreffende spoor. Zij mag niet worden geïnterpreteerd als ‘de kans dat het spoor van iemand anders is’. Match met een DNA-mengprofiel: inclusiekans of likelihood ratio-methode De bewijswaarde van een match met een DNA-mengprofiel kan niet worden bepaald met de berekende frequentie van voorkomen, zoals het geval is bij een match met een enkelvoudig DNA-profiel. De twee internationaal veel gebruikte methoden om de bewijswaarde van een match met een DNA-mengprofiel, waaruit geen DNA-profielen van individuele celdonoren zijn af te leiden, te berekenen en weer te geven zijn de inclusiekans en de likelihood ratiomethode. Belangrijke voorwaarde voor een statistische berekening is dat van de loci waarop de match betrekking heeft alle DNA-kenmerken van alle celdonoren zijn vast te stellen. De inclusiekans is de kans dat het DNA-profiel van een willekeurig gekozen persoon matcht met het DNA-mengprofiel. Bij het bepalen van de inclusiekans van een DNA-mengprofiel worden, met speciale software, alle theoretisch mogelijke DNA-profielen die met het DNA-mengprofiel matchen (‘in het DNAmengprofiel passen’) in beschouwing genomen. Hoe kleiner de inclusiekans, des te minder mensen zullen matchen met het DNA-mengprofiel, hoe hoger de bewijswaarde. Een nadeel van de inclusiekans is dat het in veel gevallen een conservatieve, behoudende, manier van berekenen van de bewijswaarde is.20 De likelihood ratio-methode berekent in welke mate het verkregen DNA-mengprofiel past bij twee verschillende hypothesen.21 Bijvoorbeeld: 20. Bijvoorbeeld in het geval dat het DNA-mengprofiel een zeer zeldzaam DNA-kenmerk heeft en dat dit zeer zeldzame DNA-kenmerk ook voorkomt in het DNA-profiel van de met het DNA-mengprofiel matchende verdachte. Dan is dit een sterke aanwijzing dat de verdachte een van de celdonoren kan zijn. Bij de berekening volgens de inclusiekans bepaalt men de zeldzaamheidswaarde door alle mogelijke DNA-profielen die tot dit DNA-mengprofiel kunnen leiden in de berekening mee te nemen. Hierdoor wordt echter de hoge bewijswaarde van het zeer zeldzame DNA-kenmerk voor een groot deel tenietgedaan vanwege de vele andere mogelijkheden die in de berekening worden meegenomen. De hoge bewijswaarde van het zeer zeldzame DNA-kenmerk wordt overschaduwd en sneeuwt als het ware onder, waardoor de uiteindelijke bewijswaarde ten onrechte zwakker wordt. Mede om deze reden kiest men in dergelijke situaties bij voorkeur voor de likelihood ratio-methode. 21. Het betreft hypothesen op bronniveau (de herkomst van het spoor). Expertise en Recht 2011-3 81 Menu 44 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek hypothese I: ‘het spoor bevat celmateriaal van de verdachte en een onbekende persoon’; hypothese II: ‘het spoor bevat celmateriaal van twee onbekende personen’. Men berekent eerst hoe groot de kans is op het verkregen DNA-mengprofiel in het geval hypothese I juist is. Vervolgens berekent men hoe groot de kans is op het DNA-mengprofiel in het geval hypothese II juist is. De verhouding tussen deze twee kansen krijgt men door ze op elkaar te delen. De uitkomst is de likelihood ratio (afgekort als LR), ook wel de diagnostische waarde van het bewijs genoemd. Voor de berekeningen maakt men gebruik van speciaal hiervoor ontwikkelde en gevalideerde software. De LR kan een waarde hebben tussen nul en oneindig. Een LR van 1 geeft aan dat het DNA-mengprofiel even goed past bij beide hypothesen. Een LR groter dan 1 betekent dat het DNA-mengprofiel beter past bij hypothese I dan bij hypothese II. Een LR kleiner dan 1 betekent het omgekeerde. Hoe groter de likelihood ratio, hoe meer steun de bevindingen van het DNA-onderzoek geven aan hypothese I ten opzichte van hypothese II. Evenzo geldt hoe kleiner (lager dan 1, maar groter dan 0) de LR, hoe meer steun de bevindingen van het DNA-onderzoek geven aan hypothese II ten opzichte van hypothese I. De LR is nadrukkelijk geen maat voor de waarschijnlijkheid van de hypothesen zelf. De waarschijnlijkheden van de hypothesen I en II zelf kunnen nimmer worden bepaald enkel en alleen op grond van de grootte van de LR. Deze waarschijnlijkheden hangen namelijk ook af van al de andere technische en tactische feiten en omstandigheden in de zaak. Fase 4. Beschouwen in context Na de analyse (fase 1), de interpretatie (fase 2) en het vergelijkend DNA-onderzoek (fase 3) legt de deskundige de resultaten en conclusies van het forensisch DNA-onderzoek vast in een deskundigenrapport. De jurist beschouwt vervolgens de bevindingen van het DNA-onderzoek in samenhang met al de feiten en omstandigheden in de strafzaak. Soms kan de jurist de DNA-deskundige daarbij betrekken. Dit betreft dan vraagstukken met betrekking tot de ‘delictgerelateerdheid’ van het spoor en het hiervan verkregen DNA-profiel. Immers, de centrale vraag bij elk forensisch biologisch onderzoek is of het spoor een (directe) relatie heeft met het misdrijf en daarmee relevant is voor de opsporing en/of bewijsvoering. Is dit het geval, dan kan een hieruit verkregen DNA-profiel een sterke aanwijzing zijn om een persoon in relatie te brengen met het delict. Bloed en sperma zijn biologische sporen die vaak sterk delictgerelateerd zijn, want zij kunnen in veel gevallen direct in verband worden gebracht met het misdrijf. Denk hierbij aan bloed op de kleding van een verdachte van een geweldsdelict, of sperma op een slachtoffer van een zedendelict. Ook speeksel en haren kunnen delictgerelateerd zijn, bijvoorbeeld wanneer deze biologische sporen zijn aangetroffen op het lichaam van een slachtoffer van een zedendelict. Van biologische contactsporen is doorgaans minder duidelijk of zij delictgerelateerd zijn.22 Meer inzicht over de delictgerelateerdheid van een spoor kan worden verkregen door de bevindingen van het DNA-onderzoek te beschouwen onder twee (of meer) hypothesen die elk een verklaring geven over de wijze waarop het celmateriaal (DNA) op een stuk van overtuiging kan zijn terechtgekomen. Het betreft hypothesen op zogenoemd activiteitniveau: de handeling of activiteit met betrekking tot de manier waarop sporen zijn overgedragen en zijn terechtgekomen op een stuk van overtuiging. Hypothesen op drie niveaus Resultaten van forensisch onderzoek kunnen worden beschouwd onder verschillende, elkaar uitsluitende hypothesen. Er zijn hypothesen op drie verschillende niveaus: 1. Hypothesen op bronniveau (herkomst spoor): de hypothesen richten zich op de bron (de herkomst) van het spoor; 2. Hypothesen op activiteitniveau (relatie met delict): de hypothesen richten zich op de handeling/ activiteit waardoor, hoe en wanneer sporen zijn overgedragen (op een object of lichaam zijn terechtgekomen); 3. Hypothesen op delictniveau (toedracht): de hypothesen richten zich op de aard van het misdrijf en de vraag wie de dader is. Op elk van deze onderzoeksniveaus kunnen verschillende hypothesen worden opgesteld en beschouwd. Hiertoe beziet men telkens twee hypothesen (een hypothesepaar). Indien van belang kunnen per onderzoeksniveau ook meer hypotheseparen worden opgesteld en beschouwd. Bij de hypothesen op bronniveau staat de herkomst van het biologische spoor centraal. De deskundige beschouwt het resultaat van het vergelijkend DNA-onderzoek, zoals de match (en de eventuele zeldzaamheidswaarde) of de mate van overeenkomst, in het licht van deze hypothesen over van wie het spoor al dan niet afkomstig is. Hypothesen op bronniveau spelen een rol in fase 3, het vergelijkend DNA-onderzoek en het vaststellen van de bewijswaarde daarvan. 22. Er zijn drie groepen biologische sporen te onderscheiden: (1) sporen van de lichaamsvloeistoffen bloed, sperma en speeksel, (2) haarsporen en (3) biologische sporen waarvan de aard niet is te bepalen/bepaald. Deze laatste groep betreft veelal biologische contactsporen. 82 Expertise en Recht 2011-3 Menu 45 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek Bij de hypothesen op activiteitniveau staat de delictgerelateerdheid van het spoor centraal: de vraag hoe en wanneer het celmateriaal (DNA) op een stuk van overtuiging kan zijn terechtgekomen. Het beschouwen van de bevindingen van het forensisch biologisch onderzoek in het licht van deze hypothesen vindt niet eerder plaats dan in fase 4, waarin de context van de zaak in aanmerking wordt genomen. Hierin worden alle bevindingen van het forensisch biologisch onderzoek betrokken. Naast de bevindingen van het vergelijkend DNA-onderzoek is ook de analyse van het volledige biologische sporenbeeld van belang: de plaatsen waar wel of niet biologische sporen zijn aangetroffen en de hoeveelheid celmateriaal die het betreft. Contextinformatie over de zaak die betrekking heeft op mogelijke handelingen en activiteiten waardoor celmateriaal kan zijn overgedragen, en wetenschappelijke inzichten hierover, worden meegenomen in de beschouwing. Terwijl het beschouwen van hypothesen op bronniveau plaatsvindt zonder contextinformatie over de zaak, is relevante contextinformatie over de zaak dus wel noodzakelijk voor het beschouwen van hypothesen op activiteitniveau. De hypothesen op delictniveau richten zich op de vraag of er sprake is van een misdrijf en de vraag wie de dader is. Alle feiten en omstandigheden, zowel technische als tactische, worden meegewogen. De resultaten van het DNA-onderzoek (bronniveau), het biologische sporenbeeld en contextinformatie over mogelijk hieraan ten grondslag liggende handelingen en activiteiten (activiteitniveau) zijn een onderdeel van de totale beschouwing. Dit is exclusief het domein van de feitenrechter. Om hypothesen op respectievelijk bronniveau, activiteitniveau en delictniveau te kunnen beschouwen, is steeds meer informatie nodig. Men spreekt daarom van een ‘hiërarchie van hypothesen’. Hoe hoger in de hiërarchie van hypothesen, hoe meer informatie wordt betrokken bij het beschouwen van het hypothesepaar. De deskundige en het doen van waarschijnlijkheidsuitspraken op activiteitniveau Op basis van alleen een DNA-profiel kan geen uitspraak worden gedaan over het tijdstip en de wijze waarop het desbetreffende celmateriaal op het stuk van overtuiging is terechtgekomen. Niettemin kan de deskundige onder omstandigheden, namelijk wanneer alle informatie van het forensisch biologisch onderzoek wordt beschouwd in samenhang met andere informatie in de zaak, een waarschijnlijkheidsuitspraak doen in het licht van hypothesen op activiteitniveau. Hij baseert deze uitspraak in dat geval op het geheel van de resultaten van het forensisch biologisch Expertise en Recht 2011-3 onderzoek, zoals de aard en plaats van aantreffen van de biologische sporen (het sporenbeeld), de hoeveelheid en kwaliteit van het DNA in de bemonsteringen en de samenstelling van de verkregen DNA-profielen. De deskundige beoordeelt hoe verschillende facetten van de verkregen onderzoeksresultaten passen bij de te beschouwen hypothesen. Zo bepaalt hij daarbij telkens hoe groot de kans is om een bepaald spoor en DNA-profiel al dan niet waar te nemen in het licht van de verschillende hypothesen. Door deze kansen ten opzichte van elkaar te wegen, komt de deskundige tot een bepaalde verbale kwalificatie. Bijvoorbeeld, de deskundige neemt de volgende twee hypothesen in ogenschouw: hypothese I (aanklager): ‘het bloed – waarvan het DNAprofiel matcht met dat van het slachtoffer – is op de schoen van de verdachte terechtgekomen tijdens het mishandelen van het slachtoffer in de keuken van het hotel’; hypothese II (verdediging): ‘het bloed – waarvan het DNA-profiel matcht met dat van het slachtoffer – is op de schoen van de verdachte terechtgekomen door indirecte overdracht doordat de verdachte een dag na het delict tijdens het schoonmaken van de keuken van het hotel nog achtergebleven bloedsporen heeft weggeveegd’. Vervolgens concludeert de deskundige (afhankelijk van de omstandigheden): ‘de bevindingen van het forensisch biologisch onderzoek zijn veel waarschijnlijker wanneer hypothese I juist is, dan wanneer hypothese II juist is’. NB Slachtoffer en verdachte zijn beiden werkzaam in het hotel. De verbale waarschijnlijkheidsuitspraak is deels subjectief en gebaseerd op kennis die de deskundige heeft vergaard door zijn opleiding, ervaring met forensisch onderzoek in andere strafzaken en het bijhouden van nieuwe ontwikkelingen op het vakgebied. De deskundige onthoudt zich daarbij van enig oordeel over de waarschijnlijkheid van de hypothesen zelf. Dat oordeel is exclusief voorbehouden aan de feitenrechter. In de praktijk zal het echter niet altijd mogelijk zijn om op basis van de verkregen onderzoeksresultaten een waarschijnlijkheidsuitspraak op activiteitniveau te doen die steun geeft aan een van beide hypothesen. Dit doet zich voor wanneer de bevindingen van het forensisch biologisch onderzoek net zo goed of net zo min kunnen worden verklaard onder beide hypothesen. ‘Kunt u uitsluiten dat…?’; ‘Is het mogelijk dat…?’ ‘Kunt u uitsluiten dat het DNA (waarvan het DNA-profiel matcht met het DNA-profiel van de verdachte) al veel eerder op het vuurwapen aanwezig was, voordat het slachtoffer ermee werd doodgeschoten?’ ‘Is het mogelijk dat het DNA (waarvan het DNA-profiel matcht met het DNA-profiel van de verdachte) op de 83 Menu 46 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek jas van het slachtoffer is terechtgekomen door indirecte overdracht van celmateriaal?’ Vaak is dit de strekking van de vragen die de jurist aan de deskundige stelt en waarmee hij een uitspraak wil krijgen over de mogelijkheid of onmogelijkheid van het aantreffen van celmateriaal van een bepaalde persoon op een stuk van overtuiging. Dergelijke vragen zullen geen inzicht verschaffen, omdat logisch gezien doorgaans geen enkele hypothese die theoretisch uitvoerbaar is, absoluut is uit te sluiten. De criminalistische betekenis van celmateriaal op een object is afhankelijk van wat er met dat object is gebeurd. Pas als daarover meer bekend is, of verondersteld kan worden, kunnen hypothesen worden geformuleerd en kan de deskundige zijn bevindingen in het licht van deze hypothesen beschouwen. Op deze manier kunnen vragen op activiteitniveau worden beantwoord. Daarom zullen vragen als ‘Hoe groot is de waarschijnlijkheid van het aantreffen van DNA van de verdachte op het vuurwapen, gegeven de gebeurtenissen en/of die veronderstellingen’ meer recht doen aan het op de juiste waarde beoordelen van de bevindingen van het forensisch biologisch onderzoek dan simpelweg de vraag ‘of kan worden uitgesloten dat celmateriaal van de verdachte al voordat het delict plaatsvond op het vuurwapen aanwezig was.’ Bij het beschouwen van een hypothese dat DNA van de verdachte al op het stuk van overtuiging aanwezig was voordat het delict plaatsvond, is het van belang in kaart te brengen wat logischerwijs met het stuk van overtuiging kan zijn gebeurd in de periode tussen het gestelde laatste contact van de verdachte met het stuk van overtuiging en het delict. Bijvoorbeeld in het geval dat de verdachte verklaart dat het vuurwapen waarmee het slachtoffer is doodgeschoten al enige tijd voordat het delict plaatsvond van hem is gestolen. Als deze verklaring op waarheid berust, hoe waarschijnlijk is het dan om van de bemonstering van het vuurwapen een enkelvoudig DNA-profiel te verkrijgen dat matcht met het DNA-profiel van de verdachte? Is tussen het moment van de diefstal en het moment van het delict (nagenoeg) niets met het vuurwapen gebeurd wat van invloed is geweest op de voor de diefstal aanwezige biologische sporen op het vuurwapen? Is het waarschijnlijk dat de nieuwe bezitter van het vuurwapen tijdens het uittesten en prepareren van het wapen voorafgaand aan het plegen van het delict, hierop geen detecteerbaar DNA heeft achterlaten, én tijdens handelingen met het wapen reeds op het wapen aanwezig DNA (van de verdachte) niet heeft afgeveegd? Mogelijke contaminatie en hypothesen op activiteitniveau Forensisch onderzoek gebeurt met de grootst mogelijke zorgvuldigheid. Hierbij wordt alles in het werk gesteld om fouten in de onderzoeksketen (van het sporenonderzoek op de plaats delict tot en met het deskundigenrapport) te voorkomen. Zo gelden voor het onderzoekslaboratorium zeer stringente regels en eisen waaraan de onderzoeksruimten, het onderzoek, de werkvoorschriften en de medewerkers moeten voldoen. Echter, hoe extreem de voorzorgsmaatregelen ook zijn, het is niet volledig uit te sluiten dat er in de onderzoeksketen fouten worden gemaakt. Indien in een specifieke zaak verwisseling of contaminatie23 van een stuk van overtuiging of van een (bemonstering van) een spoor zou hebben plaatsgevonden, blijkt dit doorgaans uit de andere feiten en omstandigheden die in de zaak bekend zijn of dient dit nader te worden onderzocht. De bevindingen van forensisch onderzoek moeten immers worden beschouwd in de context van de zaak. Wanneer er bijvoorbeeld redenen zijn om te veronderstellen dat de match van het DNA-profiel van een persoon met het DNA-profiel van het spoor (het resultaat van het onderzoek op bronniveau) het gevolg is van contaminatie, is het van groot belang dat dit aan de deskundige wordt gemeld, zodat er een grondige evaluatie van het uitgevoerde onderzoek kan plaatsvinden en eventueel aanvullend onderzoek of een contra-expertise wordt uitgevoerd. Daarnaast zal een beschouwing van de resultaten en conclusies van het forensisch biologisch onderzoek op activiteitniveau hierover mogelijk meer duidelijkheid kunnen verschaffen. Hierbij kan het zinvol zijn de bevindingen van het forensisch biologisch onderzoek te beschouwen in het licht van ten minste één hypothesepaar op activiteitniveau. Bijvoorbeeld: hypothese I (aanklager): ‘het celmateriaal op de bivakmuts – waarvan het DNA-profiel matcht met dat van het verdachte – is hierop terechtgekomen door het dragen van de bivakmuts door de verdachte’; hypothese II (verdediging): ‘het celmateriaal op de bivakmuts – waarvan het DNA-profiel matcht met dat van het verdachte – is hierop terechtgekomen doordat de bivakmuts in contact is geweest met de jas van de verdachte’. Bij het onderzoek of er daadwerkelijk contaminatie heeft plaatsgevonden, wordt in eerste instantie onderzocht of de mogelijkheid bestaat dat de bivakmuts en de jas met elkaar in aanraking zijn geweest. Bijvoorbeeld ergens in de periode tussen onderzoek plaats delict tot en met het onderzoek in het laboratorium. Is dit het geval dan wordt onderzocht in welke mate het sporenbeeld past bij de verschillende hypothesen op activiteitniveau. Alle informatie over het desbetreffende onderzoekstraject (van plaats delict tot en met het onderzoekslaboratorium), de bevindingen van het forensisch biologisch onderzoek en de contextinformatie over de 23. Contaminatie (in de context van forensisch DNA-onderzoek) is al dan niet bewuste overdracht van biologisch materiaal (cellen/DNA van een persoon of spoor) op/in een (ander) spoor of sporendrager (stuk van overtuiging). 84 Expertise en Recht 2011-3 Menu 47 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek zaak die betrekking heeft op mogelijke handelingen en activiteiten waardoor celmateriaal kan zijn overgedragen, worden meegenomen in de beschouwing. Casus hondenriem Op een avond wordt een vrouw in een park door een man aangevallen en tegen de grond gewerkt. De man ligt bovenop haar en probeert haar te verkrachten. Verbeek, die zijn hond uitlaat, hoort geschreeuw om hulp. Hij spoedt zich naar de plaats delict. Hij ziet wat gaande is en onderneemt actie. Hij ontkoppelt de hondenriem van zijn hond. Met de ene hand pakt hij stevig het handvat van de hondenriem beet en met de andere hand het deel van de hondenriem op armlengte van het handvat. Verbeek benadert de belager van achteren, legt de hondenriem om zijn keel en trekt hem met veel kracht van de vrouw af. De dader weet los te komen en rent weg. De hondenriem wordt direct na het delict naar het forensisch laboratorium gebracht met de opdracht dat deel te bemonsteren dat in contact is geweest met de keel van de dader. Deze bemonstering levert een DNA-profiel op van een onbekende man. Daarnaast zijn er nog enkele zwak aanwezige DNA-kenmerken zichtbaar. Deze komen overeen met de desbetreffende DNA-kenmerken van het DNA-profiel van Verbeek. Het verkregen DNA-profiel van de onbekende man wordt opgenomen in de DNA-databank, maar levert geen match op. Het onderzoek in de zaak loopt vast, totdat ruim twee jaar later het DNAprofiel van Draaisma in de DNA-databank wordt opgenomen dat matcht met het DNA-profiel van de bemonstering van de hondenriem. De officier denkt hiermee de dader op een presenteerblaadje aangereikt te hebben gekregen, maar de verdediging van Draaisma stelt dat het DNA niet tijdens het delict daar is terechtgekomen, maar doordat Draaisma ooit de hondenriem van Verbeek heeft vastgepakt. Verdachte Draaisma zegt wel eens in het park te komen en dan wel eens honden te aaien. Aan de deskundige wordt gevraagd of hij een uitspraak kan doen met betrekking tot de twee verschillende hypothesen op activiteitniveau: hypothese I (aanklager): ‘het celmateriaal op de hondenriem is van Draaisma en is daarop terechtgekomen via intensief contact met zijn keel tijdens het delict’; hypothese II (verdediging): ‘het celmateriaal op de hondenriem is van Draaisma en is daarop terechtgekomen via intensief contact met zijn handen tijdens het aaien van de hond enige tijd voor het delict’. De deskundige leidt de volgende feiten af uit het forensisch biologisch onderzoek: • De hondenriem is bemonsterd, specifiek op die plaatsen die volgens de verklaringen van Verbeek en het slachtoffer in contact zijn geweest met de dader. Expertise en Recht 2011-3 • De bemonstering van de hondenriem levert een volledig DNA-(hoofd)profiel op met pieken van hoge intensiteit, hetgeen betekent dat het toebehoort aan een relatief grote hoeveelheid celmateriaal van één persoon. • Daarnaast zijn er enkele zwak aanwezige DNAkenmerken zichtbaar in het DNA-profiel van de bemonstering van de hondenriem die toebehoren aan een relatief zeer kleine hoeveelheid celmateriaal van een andere persoon. • Het volledige DNA-hoofdprofiel matcht met het DNA-profiel van verdachte Draaisma. • De zwak aanwezige DNA-kenmerken komen overeen met de desbetreffende DNA-kenmerken van het DNA-profiel van getuige Verbeek. De deskundige is van oordeel dat ‘de bevindingen van het forensisch biologisch onderzoek waarschijnlijker zijn wanneer hypothese I juist is dan wanneer hypothese II juist is’ en motiveert dit als volgt: • Van getuige Verbeek, de frequent gebruiker van de hondenriem, is op zijn hoogst een relatief kleine hoeveelheid celmateriaal op de hondenriem aanwezig (aangenomen dat de zwak aanwezige DNAkenmerken daadwerkelijk aan hem toebehoren). Hieruit kan worden geconcludeerd dat de relatief grote hoeveelheid celmateriaal op de hondenriem daar terecht kan zijn gekomen door een veel krachtiger, niet alledaagse, handeling. • Het frequent gebruik van de hondenriem, in weer en wind, heeft een negatieve invloed op de hoeveelheid en de kwaliteit van het hierop aanwezig celmateriaal. Het aantreffen van een relatief grote hoeveelheid celmateriaal is daardoor beter verklaarbaar als dit daarop recentelijk is terechtgekomen dan als het daarop al enige tijd aanwezig is. • Het wegtrekken van de dader is de laatste handeling die met de hondenriem is uitgevoerd en ging bovendien met veel kracht gepaard. Dit wordt niet weersproken door de verdediging. Volgens hypothese II heeft de verdachte, die iemand anders is dan de dader, enige tijd daarvoor de hondenriem vastgehad tijdens het aaien van de hond. Onder deze hypothese is het te verwachten dat er meer celmateriaal van de dader dan van de verdachte wordt waargenomen. Het ontbreken van een DNAprofiel van een onbekende andere man is onder deze hypothese moeilijk te verklaren. Dat zou immers betekenen dat, hoewel er zeer intensief contact is geweest tijdens het ontzetten van het slachtoffer, er geen celmateriaal van de dader op de hondenriem is waar te nemen. • Bovendien zal het laatste intensieve contact, naar verwachting, reeds aanwezig celmateriaal van de hondenriem (deels) verwijderen. Het is daardoor niet waarschijnlijk dat al enige tijd aanwezig celmateriaal als gevolg van eerder aaien van de hond nog steeds zo prominent op de hondenriem aanwezig is. 85 Menu 48 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek Voorwaarden waarschijnlijkheidsuitspraak op activiteitniveau Een waarschijnlijkheidsuitspraak op activiteitniveau kan degene die hiertoe opdracht geeft (doorgaans de politie, het Openbaar Ministerie, de advocatuur of de rechter) helpen een inschatting te maken van de bewijswaarde van de resultaten van het forensisch onderzoek in de context van de zaak. Dit is met name van belang als weliswaar niet wordt betwist van wie het aangetroffen celmateriaal afkomstig is, maar onduidelijk is wanneer en/of hoe dit celmateriaal op het stuk van overtuiging is terechtgekomen (zoals in de bovenstaande casus van de hondenriem). Om een waarschijnlijkheidsuitspraak op activiteitniveau te kunnen doen, moet de deskundige naast de verkregen informatie van het vergelijkend DNA-onderzoek ook een inschatting kunnen maken van andere factoren, zoals hoe in die specifieke situatie celmateriaal kan zijn overgedragen. Alvorens de deskundige een waarschijnlijkheidsuitspraak op activiteitniveau kan doen, moet zijn voldaan aan drie belangrijke voorwaarden: minimaal één duidelijk omschreven paar hypothesen, relevante contextinformatie over de zaak en een zo volledig mogelijk sporenbeeld. Minimaal één duidelijk omschreven paar hypothesen De deskundige moet beschikken over ten minste één duidelijk omschreven paar hypothesen. Indien van belang kunnen ook meerdere hypotheseparen worden beschouwd. Hierbij staan telkens de delictgerelateerdheid van het spoor en het hiervan verkregen DNAprofiel centraal. Doorgaans zal de ene hypothese zijn dat het spoor is overgedragen tijdens het delict en de andere hypothese dat het spoor is overgedragen tijdens een handeling of activiteit die niets met het delict te maken heeft. Idealiter krijgt de deskundige de ene hypothese (hypothese I) voorgelegd door de aanklager en de andere hypothese (hypothese II) door de verdediging en is hij zelf op geen enkele wijze betrokken bij het opstellen van deze hypothesen. Op basis van de onderzoeksresultaten en de voorgelegde hypothesen maakt de deskundige een onafhankelijke afweging.24 Relevante contextinformatie over de zaak De deskundige moet beschikken over relevante contextinformatie over de zaak. Het betreft díe informatie die van belang is voor de deskundige om in te kunnen schatten in hoeverre verschillende factoren invloed hebben op de waarschijnlijkheid van de onderzoeksresultaten in het licht van de gestelde hypothesen. Zo volledig mogelijk biologische sporenbeeld Om een waarschijnlijkheidsuitspraak op activiteitniveau te kunnen doen, is het van belang dat de deskundige een goed beeld heeft van de aanwezige biologische sporen. Dit kan betekenen dat een onderzoeksresultaat dat is verkregen bij een onderzoek gericht op bronniveau niet voldoende is om een uitspraak te kunnen doen op activiteitniveau. In dergelijke gevallen is aanvullend onderzoek noodzakelijk. Indien niet aan de drie bovenstaande voorwaarden wordt voldaan, is het voor de deskundige doorgaans niet mogelijk de bewijswaarde van de resultaten van het forensisch biologisch onderzoek in een waarschijnlijkheidsuitspraak op activiteitniveau te kwalificeren. De deskundige zal bij de opdrachtgever aangeven welke informatie nog nodig is om een waarschijnlijkheidsuitspraak op activiteitniveau mogelijk te maken. Samenvatting praktische handvatten De toenemende mogelijkheden en complexiteit van forensisch DNA-onderzoek brengen met zich dat juristen voldoende op de hoogte dienen te zijn van de essenties van deze forensische expertise om het uitgevoerde DNA-onderzoek en de gerapporteerde resultaten en conclusies te doorgronden. De in dit artikel beschreven leidraad biedt de jurist hiertoe een aantal praktische handvatten. Aan de hand hiervan kan de jurist toetsen of hij het deskundigenrapport heeft begrepen en of het DNA-onderzoek is uitgevoerd overeenkomstig de internationaal gebruikte richtlijnen. De handvatten zijn hieronder samengevat. (1) Forensisch DNA-onderzoek in vier opeenvolgende fasen Forensisch autosomaal DNA-onderzoek vindt plaats in vier opeenvolgende fasen: Fase 1. Analyseren van de verkregen DNA-profielen: het bepalen van de DNA-kenmerken; Fase 2. Interpreteren van de verkregen DNA-profielen: het kwalificeren van het DNA-profiel; Fase 3. Vergelijkend DNA-onderzoek en vaststellen van de bewijswaarde van de resultaten en conclusie; Fase 4. Beschouwen van de bevindingen van het forensisch biologisch onderzoek in samenhang met de overige feiten en omstandigheden in de strafzaak. Fase 4 is met name voorbehouden aan de jurist. In het geval het onderzoek op activiteitniveau betreft kan de jurist de DNA-deskundige daarbij betrekken. 24. Alvorens de bevindingen van forensisch onderzoek te laten beschouwen in het licht van een hypothesepaar op activiteitniveau maakt de rechter of rechtercommissaris eerst een inschatting in hoeverre de voorgestelde situaties zich in werkelijkheid kunnen hebben voorgedaan (de zogenoemde a-priori kans). Dit is met name van belang in het geval er meer dan twee hypothesen op activiteitniveau worden voorgesteld (en dus meerdere hypotheseparen kunnen worden beschouwd). Wanneer een voorgestelde hypothese onvoldoende geconcretiseerd is en/of als zeer onwaarschijnlijk wordt beoordeeld, kan de rechter of rechter-commissaris besluiten de desbetreffende hypothese buiten beschouwing te laten. 86 Expertise en Recht 2011-3 Menu 49 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek (2) DNA-analyse en interpretatie per spoor afzonderlijk Binnen de internationale wetenschappelijke gemeenschap van forensisch DNA-deskundigen is een belangrijk basisprincipe dat voor elk te onderzoeken spoor het bepalen van de aard van het celmateriaal (het type of soort cellen), de DNA-analyse en de interpretatie van het verkregen DNA-profiel afzonderlijk worden uitgevoerd, los van het bepalen van de aard van het celmateriaal en de analyse en interpretatie van DNAonderzoek van andere sporen. Analyseresultaten van verschillende sporen mogen niet bij elkaar worden gevoegd om die als één samengesteld, gecombineerd DNA-profiel te vergelijken met andere DNA-profielen. Het betreft immers onderzoek op bronniveau. Pas bij onderzoek op activiteitniveau en delictniveau worden resultaten en conclusies van onderzoek van de verschillende sporen gezamenlijk beschouwd. (3) DNA-onderzoek minimale biologische sporen vereist consensusmethode Minimale biologische sporen kunnen zeer weinig DNA bevatten en hierdoor resulteert het standaard DNAonderzoek van deze sporen meestal in onvolledige DNA-profielen waarin pieken zo zwak aanwezig kunnen zijn dat ze niet eenduidig aan DNA-kenmerken zijn toe te schrijven. Om in dergelijke gevallen een informatiever DNA-profiel te verkrijgen worden in de regel aanvullende DNA-analyses uitgevoerd. In grote lijnen zijn er dan twee opties: de uitgevoerde DNAanalyse wordt twee keer, eventueel drie keer op dezelfde (standaard) manier herhaald, of LCN DNAanalyse wordt ingezet en twee keer, eventueel drie keer herhaald. Op basis hiervan wordt vastgesteld of een waargenomen piek reproduceerbaar is en een DNA-kenmerk representeert. Pieken die ten minste twee keer worden waargenomen in de drie of vier DNA-analyses kunnen worden beschouwd als betrouwbare DNA-kenmerken van de celdonor(en) van het spoor. De op deze manier vastgestelde combinatie van DNA-kenmerken van het spoor vormt het consensus DNA-profiel en wordt betrokken bij het vergelijkend DNA-onderzoek. Niet-reproduceerbare pieken kunnen niet zonder meer als DNA-kenmerken worden gekwalificeerd en niet zonder meer worden betrokken bij vergelijkend DNA-onderzoek. Het vaststellen van een consensus DNA-profiel is een vereiste wanneer aanvullende DNA-analyses zijn uitgevoerd. DNA-profielen van personen de uitkomst van het later uit te voeren vergelijkend DNA-onderzoek beïnvloedt. Pas nadat van het DNA-profiel van het spoor de (reproduceerbaar aanwezige) DNA-kenmerken, het aantal celdonoren en de mogelijk aanwezige complicerende neveneffecten zijn vastgesteld, vindt het vergelijkend DNA-onderzoek met de DNA-profielen van personen plaats. (5) Vergelijkend DNA-onderzoek: overeenkomsten en verschillen De deskundige dient het DNA-(meng)profiel in zijn totaliteit in ogenschouw te nemen. Het in zijn totaliteit beschouwen van het DNA-profiel is een belangrijke waarborg die voorkomt dat tijdens het vergelijkend DNA-onderzoek een enkel DNA-kenmerk afzonderlijk, los van de andere DNA-kenmerken in het DNA-profiel, wordt verklaard. Het vergelijkend DNA-onderzoek neemt niet alleen overeenkomsten, maar ook verschillen tussen de DNA-profielen in aanmerking. (6) Resultaat vergelijkend DNA-onderzoek: vier categorieën Het resultaat van vergelijkend DNA-onderzoek van het DNA-profiel van een persoon met het DNA-profiel van een spoor is onder te brengen in een van de vier categorieën: categorie A: Uitsluiting, categorie B: Match met statistische berekening, categorie C: Match zonder statistische berekening en categorie D: Geen uitsluiting of match. Categorie D is onderverdeeld in subcategorie D1: Niet uit te sluiten en subcategorie D2: Geen uitspraak. (4) Vergelijkend DNA-onderzoek pas nadat interpretatie DNA-profielen is afgerond Stapsgewijs DNA-onderzoek, waarbij de vier fasen ach- (7) Hypothesen op activiteitniveau Uiteindelijk beschouwt de jurist de bevindingen van het DNA-onderzoek in samenhang met alle feiten en omstandigheden in de strafzaak. Hij kan hierbij de DNA-deskundige betrekken. Dit betreft dan vraagstukken met betrekking tot de ‘delictgerelateerdheid’ van het spoor en het hiervan verkregen DNA-profiel. Het is mogelijk dat de deskundige een waarschijnlijkheidsuitspraak kan doen in het licht van hypothesen op activiteitniveau. Hiervoor moet echter wel zijn voldaan aan drie belangrijke voorwaarden: minimaal één duidelijk omschreven paar hypothesen op activiteitniveau, relevante contextinformatie van de zaak en een zo volledig mogelijk sporenbeeld. Omdat wetenschappelijk gezien doorgaans geen enkele mogelijkheid absoluut is uit te sluiten dragen vragen aan de deskundige als ‘Kunt u uitsluiten dat…?’ of ‘Is het mogelijk dat…?’ niet bij aan de waarheidsvinding. Dergelijke vragen kunnen leiden tot misvattingen en onjuiste conclusies. tereenvolgens worden doorlopen, geeft de beste waarborg voor een zo objectief mogelijk onderzoek. Op deze manier wordt informatie over DNA-profielen van personen buiten beschouwing gelaten bij het analyseren en interpreteren van de DNA-(meng)profielen van de sporen en wordt voorkomen dat kennis van de Specifieke vragen bij DNA-onderzoek van minimale biologische sporen Met name wanneer het DNA-onderzoek van minimale biologische sporen betreft is het van belang dat de jurist de antwoorden op de volgende vragen kent: Expertise en Recht 2011-3 87 Menu 50 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek – Betreft het onderzochte spoor een minimaal biologisch spoor? – Is de DNA-analyse herhaald om vast te stellen of waargenomen pieken in het DNA-profiel reproduceerbaar zijn en derhalve daadwerkelijk DNAkenmerken representeren? – Is de DNA-analyse twee of drie keer herhaald (in totaal drie of vier keer uitgevoerd), of is van deze procedure afgeweken? Indien van deze procedure is afgeweken wat is de reden daarvoor? – Is gebruikgemaakt van LCN DNA-analyse? – Is er op basis van het herhaald DNA-onderzoek een consensus DNA-profiel opgesteld? – Is om een DNA-kenmerk in het consensus DNAprofiel op te nemen het criterium van ‘ten minste twee keer de desbetreffende piek waarnemen in de drie of vier DNA-analyses’ gehanteerd? – Is het vergelijkend DNA-onderzoek pas uitgevoerd nadat de interpretatie van het DNA-profiel is afgerond, dus nadat van het DNA-profiel de (reproduceerbaar aanwezige) DNA-kenmerken, het aantal celdonoren en de mogelijke complicerende neveneffecten zijn vastgesteld? – Onder welke categorie (A, B, C, D1 of D2) is het resultaat van vergelijkend DNA-onderzoek van het DNA-profiel van een persoon met het DNA-profiel van een spoor onder te brengen? – Indien een deskundige wordt verzocht een waarschijnlijkheidsuitspraak te doen over hoe het DNA op een object of op een persoon is terechtgekomen, is dan voldaan aan de noodzakelijke voorwaarden: ten minste twee hypothesen op activiteitniveau, relevante contextinformatie en een zo volledig mogelijk sporenbeeld? Uitgebreide informatie Voor meer gedetailleerde informatie over (on)volledige enkelvoudige DNA-profielen en DNA-mengprofielen, het vergelijkend DNA-onderzoek, matchende DNAprofielen, de verschillende methoden voor statistische berekening, onderzoek van minimale biologische sporen, LCN DNA-analyse en omgaan met de kans op fouten, zie de uitgave ‘De Essenties van forensisch biologisch onderzoek; Humane biologische sporen en DNA’ (ISBN: 978 90 77320 82 2). Voor meer informatie over onbevooroordeeld DNAonderzoek, de vier opeenvolgende fasen van het forensisch DNA-onderzoek, de verschillende categorieën waarin de resultaten en conclusies van het forensisch DNA-onderzoek, en daarmee de bewijswaarden, zijn onder te verdelen en het beschouwen van de bevindingen van het onderzoek in de context van de zaak, zie de uitgave ‘Forensisch DNA-onderzoek in de (strafrecht)praktijk’ (ISBN: 978 90 81020 83 1). 88 Schema opeenvolgende fasen forensisch DNA-onderzoek Fase 1. Analyseren • Isoleren en kwantificeren van het DNA uit een spoor of referentiemonster; • Kopiëren DNA van de te onderzoeken loci; • Detecteren van het gekopieerde DNA van de te onderzoeken loci; • Bepalen van de DNA-kenmerken van de loci. Fase 2. Interpreteren Het kwalificeren van het DNA-profiel: beschouwen van het DNA-profiel als geheel en de samenhang van de verschillende DNA-kenmerken. • Bevat het spoor waarvan het DNA-profiel is verkregen een relatief grote of een relatief kleine hoeveelheid DNA? Is er sprake van een DNA-profiel van een minimaal biologisch spoor? • Is het een volledig of onvolledig DNA-profiel? • Is testen op reproduceerbaarheid van pieken en het vaststellen van een consensus DNA-profiel aan de orde? Twee opties: – de uitgevoerde DNA-analyse twee keer, eventueel drie keer op dezelfde manier herhalen en op basis hiervan een consensus DNA-profiel vaststellen; – LCN (Low Copy Number) DNA-analyse en dit twee keer, eventueel drie keer herhalen en op basis hiervan een consensus LCN DNA-profiel vaststellen. • Betreft het een enkelvoudig DNA-profiel (één persoon)? – Is het enkelvoudige DNA-profiel van een man of een vrouw? – Hoe zeldzaam is het enkelvoudige DNA-profiel? De zeldzaamheidswaarde wordt uitgedrukt in de berekende frequentie van voorkomen. • Betreft het een DNA-mengprofiel (meer dan één persoon)? – Van hoeveel personen is celmateriaal (DNA) in de desbetreffende bemonstering aanwezig? – Betreft het DNA van mannen en/of vrouwen? – Hoe verhouden de bijgedragen hoeveelheden celmateriaal van de verschillende personen zich tot elkaar? – Is uit het DNA-mengprofiel een enkelvoudig DNA-(hoofd)profiel af te leiden? Hoe zeldzaam is het afgeleide DNA-(hoofd)profiel? Dit wordt uitgedrukt in de berekende frequentie van voorkomen. – Is uit het DNA-mengprofiel een DNA-nevenprofiel af te leiden? Hoe groot is de kans dat het DNA-profiel van een willekeurig gekozen persoon matcht met het afgeleide DNA-nevenprofiel? Expertise en Recht 2011-3 Menu 51 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek – Is uit het DNA-mengprofiel geen enkelvoudig DNA-profiel af te leiden? Is voor het DNA-mengprofiel te berekenen hoe groot de kans is dat een willekeurig gekozen persoon hiermee matcht (‘inclusiekans’)? • Is het resultaat van het DNA-onderzoek geschikt voor vergelijkend DNA-onderzoek? In het geval geen of onvoldoende informatief en persoonsonderscheidend DNA-profiel: geen vergelijkend DNA-onderzoek. Fase 3. Vergelijken en bewijswaarde (Bronniveau) Vergelijkend DNA-onderzoek en de bewijswaarde van de resultaten en conclusie. Resultaat vergelijkend DNA-onderzoek: • Categorie A: Uitsluiting – De uitsluiting als celdonor is absoluut. Het betreft geen kansuitspraak, geen statistische berekening. • Categorie B: Match met statistische berekening – Berekende frequentie bij (afgeleide) enkelvoudige DNA-mengprofielen. – Inclusiekans of likelihood ratio-methode bij DNA-mengprofielen. • Categorie C: Match zonder statistische berekening – Verbale waarschijnlijkheidsuitspraak betreffende de onderzoeksresultaten in het licht van hypothesen op bronniveau (indien mogelijk en relevant). • Categorie D: Geen uitsluiting of match Subcategorie D1: Niet uit te sluiten – Verbale waarschijnlijkheidsuitspraak betreffende de onderzoeksresultaten in het licht van hypothesen op bronniveau (indien mogelijk en relevant). Subcategorie D2: Geen uitspraak Fase 4. Beschouwen in de context (Activiteitniveau) Beschouwen van de bevindingen van het forensisch biologisch onderzoek in het licht van de zaak, mede aan de hand van andere feiten en/of omstandigheden. • Verbale waarschijnlijkheidsuitspraak in het licht van hypothesen op activiteitniveau (indien mogelijk en relevant). Bijlage Onderscheid DNA-profielen In onderstaand overzicht zijn in grote lijnen de te onderscheiden DNA-profielen en de consequenties in geval van een match/overeenkomst weergegeven. Enkelvoudige DNA-profielen I. Volledig, enkelvoudig DNA-profiel Het DNA-profiel is afkomstig van één persoon en van alle onderzochte loci zijn de DNA-kenmerken vastgesteld. Een match van het DNA-profiel van een persoon met het volledige, enkelvoudige DNA-profiel van een spoor is statistisch te onderbouwen. Hierbij wordt berekend hoe groot de kans is dat het DNA-profiel van een willekeurig gekozen persoon matcht met het volledige, enkelvoudige DNA-profiel. Met de huidige DNAanalysesystemen is deze kans altijd kleiner dan één op een miljard. II. Onvolledig, enkelvoudig DNA-profiel Het DNA-profiel is afkomstig van één persoon, maar niet van alle onderzochte loci zijn de DNA-kenmerken vastgesteld. Een match van het DNA-profiel van een persoon met het onvolledige, enkelvoudige DNAprofiel van een spoor is statistisch te onderbouwen. Hierbij wordt berekend hoe groot de kans is dat het DNA-profiel van een willekeurig gekozen persoon matcht met het onvolledige, enkelvoudige DNA-profiel. Deze kans is afhankelijk van het aantal loci waarvan de DNA-kenmerken zijn vastgesteld en de zeldzaamheid van deze DNA-kenmerken. Hoe meer DNAkenmerken zijn vastgesteld, des te kleiner de kans dat het DNA-profiel van een willekeurig gekozen persoon matcht met het onvolledige DNA-profiel. III. Ogenschijnlijk enkelvoudig DNA-profiel Het DNA-profiel is zeer wel mogelijk afkomstig van één persoon. Op geen van de onderzochte loci zijn meer dan twee DNA-kenmerken vastgesteld, maar vanwege de geringe intensiteit van het DNA-profiel is onvoldoende duidelijk of deze DNA-kenmerken daadwerkelijk allemaal toebehoren aan één persoon. Een match van het DNA-profiel van een persoon met het ogenschijnlijk enkelvoudige DNA-profiel van een spoor is daarom niet statistisch te onderbouwen. DNA-mengprofielen van twee personen Het DNA-mengprofiel geeft geen aanwijzing dat de DNA-kenmerken afkomstig zijn van meer dan twee personen. IV. DNA-mengprofiel van twee personen, waarvan één persoon bekend verondersteld wordt In sommige gevallen kan de aanname worden gedaan dat het celmateriaal van een bepaalde persoon in het spoor aanwezig is. Denk hierbij bijvoorbeeld aan celmateriaal van de persoon wiens lichaam is bemonsterd, zoals bij (inwendige) bemonsteringen bij onderzoek van zedenzaken. Op basis van deze aanname zijn de DNA-kenmerken van de andere celdonor van Expertise en Recht 2011-3 89 Menu 52 Leidraad en praktische handvatten voor de jurist bij het doorgronden van conclusies forensisch DNA-onderzoek het spoor af te leiden. Een match van het DNA-profiel van een persoon met deze afgeleide DNA-kenmerken is statistisch te onderbouwen. Hierbij wordt berekend hoe groot de kans is dat het DNA-profiel van een willekeurig gekozen persoon matcht met deze afgeleide DNA-kenmerken. V. DNA-mengprofiel van twee personen waaruit een enkelvoudig DNA-hoofdprofiel en een DNA-nevenprofiel zijn af te leiden Op grond van de hoogten van de pieken in het DNAmengprofiel (relatief hoge pieken en relatief lage pieken) is het DNA-mengprofiel te ontleden in een DNAhoofdprofiel (van relatief hoge pieken) en een DNAnevenprofiel (van relatief lage pieken). Hieruit kan worden geconcludeerd dat de bemonstering relatief veel celmateriaal bevat van persoon 1 (gekoppeld aan het DNA-hoofdprofiel) en relatief weinig celmateriaal bevat van persoon 2 (gekoppeld aan het DNAnevenprofiel). Een match van het DNA-profiel van een persoon met het DNA-hoofdprofiel en een match van het DNA-profiel van een persoon met het DNA-nevenprofiel zijn statistisch te onderbouwen. Voor zowel het DNA-hoofdprofiel als voor het DNA-nevenprofiel is te berekenen hoe groot de kans is dat het DNA-profiel van een willekeurig gekozen persoon hiermee matcht. VI. DNA-mengprofiel van twee personen, waaruit geen enkelvoudig DNA-(hoofd)profiel en DNA-nevenprofiel zijn af te leiden In dit geval kan noch de aanname worden gedaan dat celmateriaal van een bepaalde persoon in het spoor aanwezig is, noch is het mogelijk op basis van piekhoogten een DNA-hoofdprofiel en DNA-nevenprofiel af te leiden. Een match van het DNA-profiel van een persoon met een dergelijk DNA-mengprofiel van twee personen is statistisch te onderbouwen. Er zijn twee methoden om de bewijswaarde statistisch te onderbouwen: de inclusiekans en de likelihood ratiomethode. DNA-mengprofielen van minimaal twee personen Van deze DNA-mengprofielen kan niet exact worden vastgesteld van hoeveel personen het celmateriaal in de desbetreffende bemonstering afkomstig is. Afhankelijk van het aantal DNA-kenmerken dat op de verschillende loci in het DNA-mengprofiel wordt waargenomen, wordt gerapporteerd dat het celmateriaal in de desbetreffende bemonstering afkomstig is van minimaal twee personen, minimaal drie personen, minimaal vier personen, etc. VII. DNA-mengprofiel van minimaal twee personen waaruit een enkelvoudig DNA-hoofdprofiel (en eventueel een DNA-nevenprofiel) is af te leiden Op grond van de hoogten van de pieken kan een DNAhoofdprofiel en in sommige gevallen ook een DNAnevenprofiel* worden afgeleid. Een match van het DNA-profiel van een persoon met het DNA-hoofdprofiel of het DNA-nevenprofiel is statistisch te onderbouwen (zie V). Een match van het DNA-profiel van een persoon met de resterende DNA-kenmerken kan doorgaans niet statistisch worden onderbouwd, tenzij de aanname kan worden gedaan dat (van de desbetreffende loci) alle DNA-kenmerken van alle celdonoren in het DNA-mengprofiel zijn vastgesteld (dan gebeurt de statistische onderbouwing met de inclusiekans of de likelihood ratio-methode).25 * Dit zou kunnen gelden voor DNA-mengprofielen van minimaal drie of meer personen. VIII. DNA-mengprofiel van minimaal drie personen waaruit een DNA-hoofdmengprofiel van twee personen is af te leiden Op grond van de hoogten van de pieken kan een DNAhoofdmengprofiel van twee personen worden afgeleid. Hieruit kan worden geconcludeerd dat de bemonstering relatief veel celmateriaal van twee personen bevat. Een match van het DNA-profiel van een persoon met het DNA-hoofdmengprofiel is statistisch te onderbouwen (zie VI). Een match van het DNA-profiel van een persoon met de resterende DNA-kenmerken kan doorgaans niet statistisch worden onderbouwd, tenzij de aanname kan worden gedaan dat (van de desbetreffende loci) alle DNA-kenmerken van alle celdonoren in het DNA-mengprofiel zijn vastgesteld (dan gebeurt de statistische onderbouwing met de inclusiekans of de likelihood ratio-methode).25 IX. DNA-mengprofiel van minimaal twee personen waaruit geen DNA-profiel(en) kunnen worden afgeleid Op grond van de hoogten van de pieken kunnen geen DNA-profielen van individuele celdonoren worden afgeleid. Een match van het DNA-profiel van een persoon met een dergelijk DNA-mengprofiel kan doorgaans niet statistisch worden onderbouwd, tenzij de aanname kan worden gedaan dat (van de desbetreffende loci) alle DNA-kenmerken van alle celdonoren in het DNA-mengprofiel zijn vastgesteld (dan gebeurt de statistische onderbouwing met de inclusiekans of de likelihood ratio-methode).25 NB In sommige situaties kan de aanname worden gedaan dat het celmateriaal van een bepaalde persoon in het spoor aanwezig is. 25. In dergelijke gevallen is weliswaar niet exact vast te stellen van hoeveel personen het celmateriaal in het desbetreffende spoor afkomstig is, wel kan de aanname worden gedaan dat (van de desbetreffende loci) alle DNA-kenmerken van alle celdonoren in het DNA-mengprofiel zijn vastgesteld. Met andere woorden, al de DNA-kenmerken (van de desbetreffende loci) van het spoor zijn vastgesteld, maar hoeveel personen het betreft is niet eenduidig vast te stellen. 90 Expertise en Recht 2011-3 Menu 53 Forensisch DNA‐verwantschapsonderzoek, Nederlands Forensisch Instituut, p. 1‐7 Menu 54 https://dnadatabank.forensischinstituut.nl/wet_en_regelgeving/forensisch_dna_verwantschapsonderzoek/#paragraph4 Forensisch DNA-verwantschapsonderzoek Inleiding Het DNA van verwanten Forensisch DNA-verwantschapsonderzoek Aanvullend DNA-onderzoek Andere vormen van forensisch DNA-verwantschapsonderzoek Actief en passief forensisch DNA-verwantschapsonderzoek Randvoorwaarden en beperkingen Meer informatie over Forensisch DNA-verwantschapsonderzoek Inleiding Bij DNA-verwantschapsonderzoek wordt door middel van het vergelijken van DNAprofielen nagegaan of personen aan elkaar verwant kunnen zijn. Civiel DNAverwantschapsonderzoek gebeurt al heel lang, bijvoorbeeld vaderschapsonderzoek om alimentatiegeschillen te beslechten. Ook het NFI doet DNA-verwantschapsonderzoek voor de Immigratie- en Naturalisatiedienst (IND) in het kader van gezinsherenigingsverzoeken. De IND wil dan controleren of het de eigen kinderen van de aanvrager zijn die mee naar Nederland komen. Ook bij het vermiste personenonderzoek dat het NFI voor het KLPD uitvoert, wordt DNA-verwantschapsonderzoek al toegepast. Door de in de hoofdstuk 1 aangehaalde wet is het ook mogelijk om DNAverwantschapsonderzoek te gebruiken voor opsporing en vervolging in strafzaken. In dit hoofdstuk wordt uitgelegd hoe DNA-verwantschapsonderzoek werkt en op welke manier het kan worden toegepast. Het DNA van verwanten Kinderen krijgen hun DNA van hun ouders. De helft van de ene ouder en de helft van de andere ouder. Figuur 1 legt dit uit aan de hand van de DNA-profielen van een vader, een moeder en een kind. Van de drie maal twee DNAkenmerken van het kind is er telkens één bij de vader terug te vinden en één bij de moeder. Het DNA van mensen is opgeslagen in 23 paar chromosomen, 22 paar zogenaamde autosomale chromosomen en één paar geslachtschromen die met X en Y worden aangeduid. Vrouwen hebben twee X-chromosomen en mannen hebben een X- en een Ychromosoom. Bovenstaande DNA-profielen bestaan uit autosomale DNA-kenmerken. Welke van beide autosomale DNAkenmerken een kind van een ouder erft, is toeval. Doordat bij het overerven van autosomale DNA-kenmerken slechts vier mogelijke Menu 55 combinaties mogelijk zijn1, hebben broers en zussen gemiddeld meer DNA-kenmerken met elkaar gemeen dan willekeurige personen. In figuur 2 is te zien dat uitgaande van DNA-profielen die uit 20 DNAkenmerken bestaan, willekeurige personen gemiddeld zes tot zeven DNA-kenmerken met elkaar gemeen hebben en broers en zussen dertien tot veertien. Van dit gegeven wordt gebruik gemaakt om personen te vinden die broer of zus van elkaar zouden kunnen zijn. Naast DNA dat een kind van zijn beide ouders erft, is er ook DNA dat een kind maar van één ouder krijgt. Dat zijn het Y-chromosomale DNA en het mitchondriale DNA. Y-chromosomaal DNA ligt op het Y-chromosoom en erft daardoor in principe42 onveranderd over van vader op zoon. Mitochondriaal DNA bevindt zich in de mitochondriën, onderdelen van een cel die voor de energievoorziening zorgen. Mitochondriën komen wél voor in eicellen, maar niet in de koppen van spermacellen. Bevruchte eicellen bevatten daarom alleen mitochondriën van de moeder en mitochondriaal DNA erft daarom in principe onveranderd over van moeder op kind. In de figuren 3a en 3b is te zien hoe mitochondriaal DNA en hoe Y-chromosomaal DNA overerft in een stamboom. Via Y-chromosomaal DNA-onderzoek kan worden nagegaan of personen in de mannelijke lijn aan elkaar verwant zijn. En via mitochondriaal DNA-onderzoek of personen in de vrouwelijke lijn aan elkaar verwant zijn. Figuur 1: DNA-profielen van een vader, een moeder en hun kind Vader: AB, moeder: CD, mogelijke kinderen: AC,AD, BC, BD. Bij de vorming van geslachtscellen ontstaan er heel af en toe (frequentie ± 1 op 10.000) mutaties in het Y-chromosomale of mitochondriale DNA waardoor er toch verschillen kunnen ontstaan tussen het Y-chromosomale DNA van vaders en zonen of het mitochondriale DNA van moeders en hun kinderen. 1 2 Menu 56 Figuur 2: Aantal overeenkomende DNA-kenmerken bij willekeurige personen en bij broers en zussen Forensisch DNA-verwantschapsonderzoek Door de eerder genoemde wet is het mogelijk om DNA-verwantschapsonderzoek te gebruiken om ernstige misdrijven op te lossen. Door actief te zoeken naar mogelijke bloedverwanten van de eigenaar van een spoor, vindt de politie wellicht nieuwe aanwijzingen voor wie de dader zou kunnen zijn. Als via een zoekactie in de DNAdatabank bijvoorbeeld een mogelijke broer van de eigenaar van een spoor gevonden wordt, kan de politie gaan onderzoeken of de gevonden persoon inderdaad een broer heeft die de eigenaar van het spoor zou kunnen zijn. Bijvoorbeeld doordat deze broer tijdens het vooronderzoek wel in beeld is geweest, maar niet als verdachte is (of kon worden) aangemerkt. Ook bij grootschalig DNA-onderzoek kan forensisch DNA-verwantschapsonderzoek nuttig zijn. Doordat deelname aan grootschalig DNA-onderzoek vrijwillig is, kan het voorkomen dat de eigenaar van een spoor niet geneigd is om mee te doen aan een dergelijk onderzoek. Door een grootschalig Y-chromosomaal DNA-onderzoek worden niet alleen matches gevonden met de eigenaar van een spoor zelf, maar ook met personen die in de mannelijke lijn aan hem verwant zijn. Via deze personen kan de politie door middel van tactisch onderzoek de echte eigenaar van het spoor proberen te vinden. Bijvoorbeeld door te zoeken naar mensen met dezelfde achternaam, omdat die in Nederland meestal ook via de mannelijke lijn wordt doorgegeven. Omdat de gezochte persoon meestal een man is, heeft grootschalig mitochondriaal DNA-onderzoek naar verwantschap in de vrouwelijke lijn meestal geen zin. Menu 57 Aanvullend DNA-onderzoek Doordat bij autosomaal forensisch DNA-verwantschapsonderzoek gezocht wordt naar DNA-profielen die niet volledig maar slechts gedeeltelijk met elkaar overeenkomen, kan dit ook bij toeval gebeuren. Dan lijken de gevonden DNA-profielen van verwante personen afkomstig te zijn, maar zijn dat niet. Afhankelijk van de zeldzaamheid van de DNA-profielkenmerken waarmee het NFI zoekt, kan een zoekactie in de DNA-databank duizenden mogelijke verwanten opleveren. Het is niet mogelijk – en uit privacy oogpunt ook niet wenselijk – om de politie naar zulke grote hoeveelheden personen tactisch onderzoek te laten doen. Daarom zal het NFI in de meeste gevallen aanvullend DNAonderzoek uitvoeren om zoveel mogelijk personen uit te sluiten van de mogelijke verwantenlijst waar de politie mee aan het werk moet. Zo kan het NFI méér autosomale DNA-kenmerken van het spoor bepalen van de gevonden mogelijke verwanten. Daardoor gaat de zeldzaamheid van de matchende DNA-kenmerken omhoog en zullen er vals positieve mogelijke verwanten worden uitgesloten. Bij mogelijke verwanten in de mannelijke lijn kan Y-chromosomaal DNA-onderzoek worden gedaan. Als mogelijke verwanten een ander Y-chromosomaal DNA-profiel dan het spoor hebben, vallen ze af als mogelijke verwant. Het aanvullende DNA-onderzoek om het aantal mogelijke verwanten te reduceren tot een ’shortlist’ voor de politie, kost tijd en is arbeidsintensief maar voorkomt dat personen in vervolgonderzoek door de politie onnodig in hun privacy worden aangetast. Figuur 3a: Overerving van mitochondriaal DNA Menu 58 Figuur 3b: Overerving van Y-chromosomaal DNA Andere vormen van forensisch DNA-verwantschapsonderzoek Andere vormen van forensisch DNA-verwantsonderzoek zijn bijvoorbeeld: Vergelijkend DNA-onderzoek aan foetaal materiaal dat is verkregen bij een abortus van een slachtoffer dat zwanger is geraakt na een verkrachting. Door het DNA-profiel van de foetus te vergelijken met de DNA-profielen van het slachtoffer en een verdachte kan aannemelijk worden gemaakt dat de verdachte de vader is van de foetus en dus ook verantwoordelijk kan zijn voor de verkrachting. Van een vondeling of het stoffelijk overschot van een baby kan via DNAverwantschapsonderzoek worden vastgesteld wie de ouders zijn. Terwijl bij de eerder besproken werkwijzen met behulp van DNA-profielen van in de onderzochte zaak onschuldige verwanten5 geprobeerd wordt tot een verdachte te komen, kan bij deze vormen van forensisch DNAverwantschapsonderzoek de verwante verdachte in de zaak zijn. Actief en passief forensisch DNA-verwantschapsonderzoek Wanneer bewust en actief gezocht wordt naar verwanten van een verdachte, spreekt men van actief forensisch DNA-verwantschapsonderzoek. Hiervoor gelden strenge randvoorwaarden. Als een DNA-deskundige bij toeval op een mogelijke verwantschap stuit, spreken we van passief forensisch DNA-verwantschapsonderzoek. Dit kan bijvoorbeeld gebeuren als een DNA-deskundige de DNA-profielen van een spoor en een verkrachtingsslachtoffer met elkaar vergelijkt en ziet dat beide profielen sterk met elkaar overeen komen. De DNA-deskundige mag dit soort waarnemingen ook opnemen in de rapportage. Menu 59 Randvoorwaarden en beperkingen Forensisch DNA-verwantschapsonderzoek is een nieuw opsporingsmiddel, maar geen wondermiddel. De politie kan de echte eigenaar van een spoor alleen vinden als er een verwant van die persoon in de DNA-databank zit. Actief forensisch DNA-verwantschapsonderzoek mag alleen worden toegepast bij misdrijven waarop een gevangenisstraf van acht jaar of meer staat, en een beperkt aantal ernstige gewelds- en zedenmisdrijven, die ten minste met zes jaar gevangenisstraf worden bedreigd. Voor grootschalige onderzoeken of DNAdatabankbevragingen is toestemming van het College van procureursgeneraal vereist en voor DNA-databankbevragingen bovendien een machtiging van een rechter-commissaris. Technisch gezien is een forensisch DNA-verwantschapsonderzoek alleen mogelijk wanneer er een volledig of voldoende informatief DNA-profiel van een duidelijk daderspoor beschikbaar is én er voldoende celmateriaal aanwezig is voor vervolgonderzoek. -------------------------------------------------------------------------------------- Veel meer informatie over (forensisch) DNA-verwantschapsonderzoek is te vinden in het 34 pagina’s tellende hoofdstuk 10 van het boek: De essenties van forensisch biologisch onderzoek. Humane biologische sporen en DNA (2009) A.J. Meulenbroek et al. Uitgeverij Paris; ISBN: 97890 77320 82 2; NUR: 923/824. Meer informatie over Forensisch DNA-verwantschapsonderzoek Finding Criminals through DNA of their relatives Auteur: F.R. Bieber, C.H. Brenner and D. Laser Bron: Science 2 june 2006, Vol. 312, nr 5778, p 1315-1316 DNA Partial Match Policy (05-10-2012 | pdf-document, 48 KB) Auteur: Edmund G. Brown Jr. Attorney General Bron: Information Bulletin 2008-BFS-01 California Department of Justice DNA-verwantschapsonderzoek. Familie van de verdachte? Auteur: M.M. Prinsen Bron: Strafblad 2008, 242-250 Menu 60 Searching the Family Tree for Suspects: Ethical and Implementation Issues in the Familial Searching of DNA Databases Auteur: David Lazer Bron: Taubman Center Policy Briefs March 2008 SWGDAM Recommendations to the FBI Auteur: Scientific Working Group on DNA Analysis Methods Ad Hoc Committee on Partial Matches Bron: www.fbi.gov Use of DNA profiles for investigation using a simulated national DNA database: Part II. Statistical and ethical considerations on familial searching Auteur: T. Hicks et al Bron: Forensic Science International: Genetics Volume 4, Issue 5 , Pages 316-322, October 2010 Forensic utilization of familial searches in DNA databases Auteur: Cassandra J. Gershaw et al Bron: FSI Genetics (in press) It’s all relative(s): Familial Searching in the Netherlands (05-10-2012 | pdf-document, 0.64 MB) Auteur: C. van Kooten et al Bron: Poster nr 9 presented at the 21st International Symposium on Human Identification. October 10–14, 2010, San Antonio, Texas, USA Searching for first-degree familial relationships in California's offender DNA database: Validation of a likelihood ratio-based approach Auteur: Steven P. Myerset al. Bron: Forensic Science International: Genetics Volume 5, Issue 5 , Pages 493-500, November 2011 Policy implications for familial searching Auteur: Kim et al Bron: Investigative Genetics 2011, 2: 22 Menu