Nederlands Tweeling Register koppelen met Achmea 1 Nederlands Tweeling Register Aantallen in de 2 cohorten: adolescenten (1986-1994) kinderen (april 1998-2011) n= 3904 n= 27045 Overzicht zorggebruik voor geselecteerd cohorten medicijngebruik, ziekenhuisopnames, huisartsbezoeken Koppelbestand NAW kind/adolescenten Naam, initialen en geboortedatum moeder (kinderen) Meerdere records per persoon door verhuizingen ID-nr, cohort, familie-nr, datum adres, nog actief(datum), geboorteland 2 Achmea Health Data Base 2 databases: Achmea Health Database (AHD) : 4,4 miljoen verzekerden (vanaf 2006) AGIS database: 1 miljoen verzekerden (vanaf 2000) Opstartproblemen Koppelbestand: bestand met verzekerden AHD Selectie op geboortejaar: 1,6 miljoen records Alle bewerkingen met privacy gevoelige data alleen bij ACHMEA : koppelgegevens blijven daar op een hard disk (encryptie) Alle controles voor de validatie ook uitgevoerd bij Achmea Op eigen laptops, geen toegang tot Achmea netwerk 3 Data sets (% ingevuld) NTR AHD 100,00 1 achternaam 100,00 2 voornamen 37,09 3 roepnaam 99,91 16,51 4 voorletters 99,99 100,00* 5 geboortedatum 100,00 100,00 6 geslacht 100,00* 100,00 7 huisnummer 100,00 100,00 8 woonplaats 100,00 99,99 9 postcode 6 100,00 100,00 * 100 % door afronding 4 Koppelen Onbekend percentage initialen in NTR geïmputeerd (roepnaam) Initialen en geslacht belangrijk om tweelingen te kunnen identificeren: 298 tweelingen (596 personen) binnen NTR niet te onderscheiden op initialen, en geslacht Tweelingen in AHD kruislings ingevoerd: “Robin” met initalen “B”, en “Bo” met initialen “R” Probabilistische (Jaro Winkler) en deterministische koppelingen uitgevoerd: ongeveer 25% van de NTR personen kunnen koppelen Voor tweelingen waarvan 1 persoon met zekerheid gekoppeld was, polisnummer geïdentificeerd om andere helft tweeling te bevestigen 5 Stand van zaken Validatie uitgevoerd voor eigen koppeling Mondriaan koppeling volgt nog in mei/juni Lijst met huidige koppelingen naar Achmea voor extractie van de zorggegevens uit de AHD Volgende week start NTR met inhoudelijke validatie? 6 7 Nederlands Tweeling Register koppelen met Achmea Resultaten Categorie Characteristics Pairs(dupl) links Agree on all identifiers 2689 (0) more likely links Mostly missing firstname, only one person of twin has given permission 79 (0) Mostly missing firstname, twins have different sex or different initial 3939 (0) Mostly missing firstname, twins have same sex and initial 40 (12) Mostly missing firstname, and postal code and housenumber do not agree 1261 (76) (uncertain) more likely links (distinguisable) more likely links (indistinguisable) possibly links possibly links (conflicting identifiers) Agree on surname, DOB, sex, but conflicting firstname and initial 24 (0) 9