A national infrastructure for linkage of biobanks to medical

advertisement
Nederlands Tweeling Register
koppelen met Achmea
1
Nederlands Tweeling Register
 Aantallen in de 2 cohorten:
 adolescenten (1986-1994)
 kinderen (april 1998-2011)
n= 3904
n= 27045
 Overzicht zorggebruik voor geselecteerd cohorten
 medicijngebruik, ziekenhuisopnames, huisartsbezoeken
 Koppelbestand




NAW kind/adolescenten
Naam, initialen en geboortedatum moeder (kinderen)
Meerdere records per persoon door verhuizingen
ID-nr, cohort, familie-nr, datum adres, nog actief(datum), geboorteland
2
Achmea Health Data Base
 2 databases:
 Achmea Health Database (AHD) : 4,4 miljoen verzekerden (vanaf 2006)
 AGIS database: 1 miljoen verzekerden (vanaf 2000)
 Opstartproblemen
 Koppelbestand: bestand met verzekerden AHD
 Selectie op geboortejaar: 1,6 miljoen records
 Alle bewerkingen met privacy gevoelige data alleen bij ACHMEA :
koppelgegevens blijven daar op een hard disk (encryptie)
 Alle controles voor de validatie ook uitgevoerd bij Achmea
 Op eigen laptops, geen toegang tot Achmea netwerk
3
Data sets (% ingevuld)
NTR
AHD
100,00
1
achternaam
100,00
2
voornamen
37,09
3
roepnaam
99,91
16,51
4
voorletters
99,99
100,00*
5
geboortedatum
100,00
100,00
6
geslacht
100,00*
100,00
7
huisnummer
100,00
100,00
8
woonplaats
100,00
99,99
9
postcode 6
100,00
100,00
* 100 % door afronding
4
Koppelen
 Onbekend percentage initialen in NTR geïmputeerd (roepnaam)
 Initialen en geslacht belangrijk om tweelingen te kunnen identificeren:
 298 tweelingen (596 personen) binnen NTR niet te onderscheiden op initialen,
en geslacht
 Tweelingen in AHD kruislings ingevoerd:
“Robin” met initalen “B”, en “Bo” met initialen “R”
 Probabilistische (Jaro Winkler) en deterministische koppelingen
uitgevoerd: ongeveer 25% van de NTR personen kunnen koppelen
 Voor tweelingen waarvan 1 persoon met zekerheid gekoppeld was,
polisnummer geïdentificeerd om andere helft tweeling te bevestigen
5
Stand van zaken
 Validatie uitgevoerd voor eigen koppeling
 Mondriaan koppeling volgt nog in mei/juni
 Lijst met huidige koppelingen naar Achmea voor extractie van de
zorggegevens uit de AHD
 Volgende week start NTR met inhoudelijke validatie?
6
7
Nederlands Tweeling Register
koppelen met Achmea
Resultaten
Categorie
Characteristics
Pairs(dupl)
links
Agree on all identifiers
2689 (0)
more likely links
Mostly missing firstname, only one
person of twin has given permission
79 (0)
Mostly missing firstname, twins have
different sex or different initial
3939 (0)
Mostly missing firstname, twins have
same sex and initial
40 (12)
Mostly missing firstname, and postal
code and housenumber do not agree
1261 (76)
(uncertain)
more likely links
(distinguisable)
more likely links
(indistinguisable)
possibly links
possibly links
(conflicting identifiers)
Agree on surname, DOB, sex, but
conflicting firstname and initial
24 (0)
9
Download