Door statistici veroordeeld? Aart F. de Vos Lucy de B is tot levenslang veroordeeld. Statistische argumenten speelden hierbij een rol, zij het dat de invloed hiervan in de media overschat is. Er stierven veel mensen rond de tijdstippen dat zij dienst had. Toevallig? De geraadpleegde statisticus, Henk Elffers, herhaalde tijdens het nu dienende hoger beroep zijn eerdere verklaring dat de kans 1 op de 342 miljoen was. Ik citeer uit het artikel “statistici geloven niet in toeval” uit de Haagse courant van 30 januari jongsleden: “"De kans dat er negen dodelijke incidenten plaatshadden in het JKZ in de diensttijd van de verdachte op basis van toeval, is nihil, (…) het was geen toeval. Wat het wel was, weet ik niet. Daar kan ik als statisticus niets over zeggen. Het bewijs is up to you". Uit het verdere verslag bleek dat de rechter grote moeite had met dit antwoord, maar dat men er niet echt uit kwam. Vele getuigen zijn daarna gehoord die het hebben over omstandigheden, aannemelijkheden, merkwaardigheden, onwaarschijnlijkheden en onloochenbaar sterke samenhangen. De rechtbank moet dit alles samenvoegen en tot een wijs eindoordeel komen. Een zware taak, zeker gegeven het juridisch begrippenapparaat dat wel zeer veel elementen die met waarschijnlijkheden te maken hebben omvat maar bij het combineren daarvan de kwantificering en de waarschijnlijkheidsrekening node mist. De cruciale vraag is natuurlijk: hoe groot is de kans dat Lucy de B moorden heeft gepleegd? De meeste leken zullen denken dat Elffers die vraag heeft beantwoord, en dat het dus praktisch gesproken zeker is. Dit is een misverstand. Elffers heeft die vraag niet beantwoord. Elffers is een klassiek statisticus, en klassieke statistici doen geen uitspraken over kansen wat er aan de hand is maar alleen over hoe onwaarschijnlijk dingen zijn als er niets aan de hand zou zijn. Er is echter nog een andere tak van statistiek: de Bayesiaanse. Ik behoor tot dat andere kamp. En ik heb ook zitten rekenen. Met het volgende verbijsterende resultaat: Als de informatie die Elffers gebruikt heeft om tot zijn 1 op 342 miljoen te komen de enige informatie zou zijn waarop Lucy de B veroordeeld was, zou er volgens mij ongeveer 75% kans zijn dat dit ten onrechte geschiedde. Over dit grote contrast gaat dit artikel. Het is geen aanklacht tegen Elffers, die zich in de rechtbank uiterst bescheiden opstelde bij de interpretatie van zijn uitkomst en ook geen pleidooi om Lucy de B vrij te spreken want de rechtbank hanteert voornamelijk andere argumenten, zij het helaas zonder eenduidige kansuitspraken terwijl er niets met absolute zekerheid vaststaat. Bayesiaanse statistiek Mijn berekeningen zijn dus gebaseerd op de alternatieve statistiek, de Bayesiaanse, vernoemd naar Thomas Bayes, de eerste die schreef over de ''omgekeerde kansen''. Dat was in 1763. Echt belangrijk werd zijn vondst pas na 1960, vooral door het werk van Leonard Savage, die bewees dat je bij beslissen onder onzekerheid niet om de vraag heen kunt welke kansen de mogelijke toestanden van de waarheid hebben. (in ons geval de toestanden ''schuldig'' en ''niet schuldig''). Bayes leerde hoe je over dat soort kansen kan leren uit data. Over de vorm van die berekeningen zijn de geleerden het eens, dat is pure waarschijnlijkheidsrekening. Er is echter één probleem: je moet bedenken welke kansen je aan de toestanden zou hebben gegeven voordat je je data gezien had (de prior). En vaak zijn dat subjectieve kansen. En als je weinig data hebt is de invloed van die subjectieve kansen op je eindoordeel groot. Een reden voor veel klassieke statistici om zich tegen deze benadering te verzetten. Zeker in Nederland, waar statistiek vooral bedreven wordt door wiskundigen, mensen die erin getraind worden vraagstukken op te lossen zonder zich af te vragen wat ze met de werkelijkheid te maken hebben. Na een fanatieke strijd over grondslagen van decennia (zie mijn stuk “de godsdienstoorlog der statistici” op http://staff.feweb.vu.nl/avos/default.htm) zijn de partijen wat nader tot elkaar gekomen. Met één uitzondering: de klassieke toets. Bayesianen hebben fundamentele bezwaren tegen klassieke toetsen. En Elffers’ uitspraak heeft de vorm van een klassieke toets. Hier spitst het grondslagendebat zich dus toe. Het geval Lucy Klomp In navolging van Elffers die zijn wijze van berekenen in het Nederlands Juristenblad heeft toegelicht aan de hand van een fictief geval (dat ik ook heb doorgerekend om tot totaal verschillende conclusies te komen) wil ik het hebben over het fictieve geval Lucy Klomp. Lucy Klomp is een verpleegster die 11 sterfgevallen heeft meegemaakt in een periode waarin gemiddeld slechts “één geval voorkomt, maar waar geen verdere aanwijzingen tegen zijn te vinden. Elffers zou in de rechtbank ook in dit geval een extreem kleine kans op toeval rapporteren, 1 op de 100 miljoen ongeveer. Dit is het geval waarvan ik beweer dat een veroordeling een kans van ongeveer 75% heeft ten onrechte te zijn. De berekening hiervan gaat niet met kansen, maar met “odds”, een onvertaalbaar woord, dat in Nederland niet leeft. Odds van 3 om 7 betekenen een kans van 3/10 dat het wel zo is en 7/10 dat het niet zo is. Voor een eenvoudige Bayesiaanse berekening heb je twee elementen nodig. De “prior odds” en de aannemelijkheidsverhouding. Als de kans op 11 doden 1 op 100 miljoen is wanneer Lucy Klomp onschuldig is, en 1 op 20 wanneer zij schuldig is dan is de aannemelijkheidsverhouding voor onschuldig tegen schuldig 1 om 5 miljoen. De prior odds komen van de kans dat een willekeurige verpleegster moorden pleegt. Die schat ik op 1 om 400.000. Er zijn veertigduizend verpleegkundigen in ziekenhuizen in Nederland, dus dat zou betekenen dat er eens per 10 jaar een verplegende moorden pleegt. Ik hoop dat dat een overschatting is. De stelling van Bayes zegt nu dat de odds in geval van 11 doden 400.000 om 5 miljoen worden. Je moet gewoon de prior odds vermenigvuldigen met de aannemelijkheidsverhouding. Dus 4 om 50. Dus een kans van 7,5% dat zij onschuldig is. De uitleg kan vrij simpel: in 200 jaar is er 1 moordlustige verpleegkundige waarbij 11 sterfgevallen (al of niet vermoord) voorkomen, maar de kans dat een onschuldige verpleegster dit overkomt is 40.000*200/100.000.000=8%. De klassieke toets kijkt niet naar de prior, en het moge duidelijk zijn dat het verschil in grootteorde tussen klassieke en Bayesiaanse uitkomsten hier vooral aan de prior ligt. Maar ook dat die prior helemaal niet zo subjectief is. Door aanvullend statistisch onderzoek kan hij bovendien nader gepreciseerd worden. Het mooiste aspect van een Bayesiaanse analyse is dat je steeds informatie kunt toevoegen. Van prior odds kom je via data (11 sterfgevallen) op posterior odds, en die zijn weer prior odds voor de volgende stap. Stel je zoekt verdachte aanwijzingen, maar je vindt ze niet, dan is dat vreemd als er zoveel moorden hebben plaatsgevonden. Je dacht toch dat er bij zoveel moorden wel 50% kans was dat je iets zou vinden. Dan is er weer sprake van een aannemelijkheidsverhouding: de kans dat je niets vindt is als er niets aan de hand is 100%, anders 50%, een factor 2. De regel van Bayes wordt weer toegepast en de odds gaan naar 8 om 50. Ruim 13% kans dat een veroordeling ten onrechte is. En als de verdachte niet bekent is dat ook aannemelijker als zij onschuldig is. De odds gaan naar 16 om 50. En de klapper komt nog. Het uitgangspunt was een kans op 11 doden van 1 op 100 miljoen. Dat cijfer is berekend ervan uitgaande dat de kans op een sterfgeval bij een verpleegster bekend is, terwijl in werkelijkheid zo’n kans geschat moet worden en er ook veel onzekerheid is over de vraag of die kans voor alle verplegenden dezelfde is. Variaties in vaardigheden en omstandigheden zijn regel. De Bayesiaanse methodiek biedt de mogelijkheid al deze onzekerheden mee te nemen in de analyse en het standaard resultaat is dat de kans op extreme gebeurtenissen enorm toeneemt. Dat is logisch: de kans dat er een andere verklaring is dan moord stijgt ook met het aantal sterfgevallen. Ik denk, op basis van ervaring, dat een Bayesiaanse analyse van Elffers’data (die ik helaas niet heb), uit zou komen op een kans dat er onder normale omstandigheden 11 doden vallen van minstens 1 op 10 miljoen. Tien maal zo groot dus. Dan gaan de odds naar 160 om 50 en is Lucy Klomp waarschijnlijk onschuldig. Dit is de 75% kans op onschuld die ik in het begin genoemd heb. Vrijwel alle feiten die in een rechtzaak naar voren komen kunnen op deze manier in de analyse verwekt worden. Ieder feit dat een andere aannemelijkheid heeft onder de hypothese schuldig dan onder de hypothese onschuldig draagt bij. Waarbij wellicht is opgevallen dat het uitsluitend om kansen die betrekking hebben op wat de facto gebeurd is, nooit op wat had kunnen gebeuren. Een klassieke toets heeft het altijd over de kans op 11 of meer sterfgevallen. Dat of meer is volgens Bayesianen irrelevant. Dat is vooral van belang onder de hypothese “schuldig”: omdat er veel onzekerheid bestaat over de mate van moordlust van een schuldige is de kans op precies 11 doden niet zo heel groot (een kleine 5% in mijn berekeningen). Dus ook nader onderzoek op dat punt kan de odds wijzigen. Het moge duidelijk zijn dat het niet echt eenvoudig is om tot uitspraken te komen als er geen overtuigend bewijs is. Het beroemdste voorbeeld waar veel Bayesiaans aan gerekend is, is een moord in 1956 in Californie, gepleegd door een zwarte man met een blanke vrouw in een gele Cadillac. Een stel dat aan deze beschrijving voldeed werd voor de rechter gesleept, en vele statistische analyses volgden. Ik heb zelf veel aan dit voorbeeld gerekend, en ervaren hoe moeilijk maar ook verrassend en bevredigend het is om steeds nieuwe elementen toe te voegen. Aan een beroemd ander geval is zelfs een heel boek gewijd: ''a Probabilistic Analysis of the Sacco and Vanzetti Evidence'', in 1996 gepubliceerd door Jay Kadane, hoogleraar aan Carnegie Mellon en een van de meest vooraanstaande Bayesianen. Wie meer wil weten raadplege zijn cv op zijn website http://lib.stat.cmu.edu/~kadane. Alleen al op het terrein ''Statistics and the Law'' heeft hij meer dan dertig publicaties op zijn naam staan, naast honderden andere artikelen. In Amerika is dit inmiddels een goed ontwikkeld vakgebied. Conclusie? Ik heb lang nagedacht wat de conclusie van dit verhaal is, en heb mijn mening enige malen moeten herzien. En de misschien verrassende conclusie is er een die ik al op een aantal terreinen heb moeten trekken: het handelen van alle partijen is zo gek nog niet, alleen hun rationalisatie is wat wonderlijk. Elffers maakt rare berekeningen maar formuleert de conclusies zo in de rechtbank dat het intuïtief duidelijk wordt dat hij niet het antwoord geeft waar de rechtbank naar zoekt. De rechter maakt vonnissen die klinken in termen van waarschijnlijkheden maar waar ik geen brood van kan bakken. Maar als ik zie wat er gebeurt krijg ik het gevoel dat het veel meer lijkt op wat optimaal is dan ik gegeven de rationalisaties voor mogelijk zou houden. De verklaring is simpel: daden zijn gebaseerd op een proces gebaseerd op evolutie, rechtvaardigingen zijn er op geplakt en gebaseerd op onderwijs. Naar mijn mening is de Bayesiaanse methode de enige mogelijkheid om beslissingen onder onzekerheid om daden en rationalisatie in evenwicht te brengen. En kan dat zeer vruchtbaar zijn. Maar de winst is in eerste instantie veel kleiner dan men denkt. Wat de rechtbank in de zaak Lucy de B doet is verrassend rationeel. De 11 sterfgevallen blijken op zich niet overtuigend te zijn maar wel genoeg om de prior odds van 1 op 40.000 te veranderen in odds van 16 om 5, kortom een grootteorde waarin het nodig is aanvullende informatie te vergaren alvorens te oordelen. Precies wat de rechtbank doet. Ik heb, toen ik mijn berekeningen maakte, op momenten gedacht: ik moet mij tot de rechtbank wenden. Misschien krijg ik dan de kans om de zaak Lucy de B. geheel door te rekenen. Dat zou nieuwe inzichten kunnen opleveren. In dit geval is er veel meer informatie dan hier is gebruikt, zoals gifsporen bij patientjes. Ook hier geldt waarschijnlijk dat een Bayesiaanse analyse die rekening houdt met alle onzekerheden laat zien dat uitspraken van experts die iets zeggen als “het is uitgesloten dat er een andere verklaring is dan de toediening van gif door Lucy de B” met een korreltje zout genomen moeten worden. Experts zijn meestal mensen die hun zekerheden overschatten. Aan de andere kant kan belastende informatie ook opbouwen. Tien onafhankelijke feiten die twee maal zo waarschijnlijk zijn onder de hypothese schuld veranderen de odds met een factor 1000. Maar volgens mij redeneert de rechtbank min of meer zo. In een onbegrijpelijke taal, niet na te gaan voor waarschijnlijkheidsrekenaars, maar gesanctioneerd door evolutie. We hebben maar weinig gevallen van veroordelingen die ten onrechte bleken in Nederland. Als je alles in termen van kansberekening zou doen, zijn de debatten tussen aanklagers en advocaten die het gevolg zijn, niet te overzien. En gegeven hun gebrekkige kennis van kansrekening ook vooralsnog onwenselijk. Zij hebben hun geheimtaal die meestal tot redelijke conclusies leidde. En de kans dat Lucy de B schuldig is past daar niet echt in. Bovendien is er in Nederland geen wet die in termen van kansen op een terechte beslissing definieert wat “wettig en overtuigend bewijs” is. Is dat 95%? Of 99%? Rechters zullen volhouden dat het 99,99% is. Maar rechters zijn experts.