2014-het-automatisch-coderen-van-doodsoorzaken-art

advertisement
Webartikel 2014
Het automatisch coderen
van doodsoorzaken
Een nieuwe werkwijze bij de
doodsoorzakenstatistiek
Peter Harteloh
Onno van Hilten
Jan Kardaun
12-12-2014 gepubliceerd op cbs.nl
CBS | Het automatisch coderen van doodsoorzaken 1
Samenvatting
Met ingang van het statistiekjaar 2013 gebruikt het Centraal Bureau voor de Statistiek
(CBS) IRIS, een softwarepakket voor het coderen en/of selecteren van de onderliggende
doodsoorzaak, bij de productie van de doodsoorzakenstatistiek. Het programma is in staat
ongeveer 61 procent van de aangeboden sterfgevallen met een natuurlijke doodsoorzaak
volautomatisch, dat wil zeggen, zonder menselijke tussenkomst te verwerken. Van de
overige records kan IRIS een groot gedeelte na tussenkomst van een codeur alsnog van
een onderliggende doodsoorzaak voorzien. Uiteindelijk is in 2013 ongeveer 93 procent
van de sterfgevallen met een natuurlijke doodsoorzaak door IRIS van een onderliggende
doodsoorzaak voorzien. IRIS is nog niet geschikt voor de verwerking van niet-natuurlijke
doodsoorzaken, evenals maternale of perinatale sterfgevallen (incl. doodgeborenen). Deze
worden als voorheen handmatig gecodeerd.
Het automatisch coderen van doodsoorzaken is een breuk met een meer dan honderd
jaar oude traditie, waarin de onderliggende doodsoorzaak werd bepaald middels directe
beoordeling van het doodsoorzakenformulier door een codeur. Automatische codering
brengt een betere internationale vergelijkbaarheid en reproduceerbaarheid van de
gegevens met zich mee. Ook worden nu alle doodsoorzaken op het doodsoorzakenformulier
gecodeerd waardoor de onderzoeksmogelijkheden toenemen (zie ook Valleron et al., 2000).
Wanneer we het jaar 2012 en 2013 naar de Statline indeling voor de maandcijfers met elkaar
vergelijken, zien we de volgend verschuivingen:
−− Nieuwvormingen (C00–D48)   –1,1 procent
−− Kwaadaardige nieuwvormingen van luchtpijp en long (C33–C34)  –0,4 procent
−− Kwaadaardige nieuwvormingen van de borst (C50)  –1,5 procent
−− Psychische stoornissen & ziekten van zenuwstelsel en zintuigen (F00–H95)
+21,3 procent
−− Ziekten van hart en vaatstelsel (I00–I99)  +0,2 procent
−− Acuut hartinfarct (I21–I22)  –8,2 procent
−− Hersenvaatstelsel (I60–I69)
+11,0 procent
−− Ziekten van de ademhalingsorganen (J00–J99)
–15,3 procent
De verschillen tussen 2012 en 2013 worden veroorzaakt door een combinatie van
epidemiologische ontwikkelingen enerzijds en de introductie van het automatisch coderen
anderzijds. Bij de volgende ziekten/ziektegroepen is een significant effect van deze nieuwe
methode waarneembaar:
−− sterfte aan psychische stoornissen en ziekten van het zenuwstelsel of zintuigen
(voornamelijk door een toename van dementie en de ziekte van Alzheimer als
onderliggende doodsoorzaak);
−− sterfte aan ziekten van het hersenvaatstelsel (voornamelijk door een toename van late
gevolgen van het Cerebrovasculair Accident (CVA) als onderliggende doodsoorzaak);
−− sterfte aan ziekten van de ademhalingsorganen (voornamelijk door een afname van
longontsteking als onderliggende doodsoorzaak).
CBS | Het automatisch coderen van doodsoorzaken 2
Voor de sterfte aan het totaal van nieuwvormingen, longkanker, borstkanker, het totaal van
hart- en vaatziekten en het acuut hartinfarct is het gevolg van een overgang op automatisch
coderen (vooralsnog) niet te onderscheiden van epidemiologische ontwikkelingen.1)
De waargenomen verschuivingen in de statistiek worden veroorzaakt door:
1. Andere selectie van de onderliggende doodsoorzaak. Het selecteren van de
onderliggende doodsoorzaak is gebaseerd op selectieprincipes die door de WHO zijn
vastgesteld (Deel 2, ICD-10). Bij de toepassing van die regels in de praktijk moeten er
keuzes worden gemaakt op basis van medisch-inhoudelijke argumenten. Een aantal
landen (waaronder Nederland) heeft bij handmatig coderen in de loop der tijd eigen
keuzes gemaakt. Bij de overgang op automatisch coderen worden deze lokaal gemaakte
keuzes bij codering en selectie van de onderliggende doodsoorzaak verlaten ten faveure
van de IRIS programmatuur.
2. Introductie van de ICD-10 updates. Elk jaar stelt de WHO updates van de ICD-10
classificatie vast (zie: http://www.who.int/classifications/icd/updates/Official_WHO_
updates_combined_1996_2012). Deze updates weerspiegelen veranderde of nieuwe
inzichten in het coderen en selecteren van een onderliggende doodsoorzaak, of zijn
bedoeld om nieuwe ziektes een plaats te geven in de classificatie. Vanuit het oogpunt
van statistiek betekent elke aanpassing van de gehanteerde classificatie een mogelijke
breuk in de tijdreeks van doodsoorzaken. Daarom is door het CBS in het verleden
besloten om vanaf de ingebruikname van de ICD-10 in 1996 de updates niet door te
voeren in de Nederlandse doodsoorzakenstatistiek. De IRIS-software maakt echter altijd
gebruik van de meest actuele versie van de ICD-10, inclusief de updates. De overstap op
IRIS betekent daarom ook dat alle ICD-10 updates sinds 1996, en dat zijn er honderden,
in één keer verwerkt zijn in de cijfers van het jaar 2013. Vele daarvan hebben geen
noemenswaardig effect op de statistiek, maar zoals we zullen zien, is een aantal updates
verantwoordelijk voor grote verschuivingen in de doodsoorzakenstatistiek.
3. Andere interpretatie (lezing) van het doodsoorzakenformulier. Bij selectie van de
onderliggende doodsoorzaak is IRIS buitengewoon gevoelig voor een correct ingevuld
doodsoorzakenformulier (zie ook Lu, 2003; 2005). Bij handmatig coderen werden
ogenschijnlijke invulfouten, zoals een verkeerde volgorde of onterecht plaatsing van een
term op deel 1 of 2 van het formulier (zie bijlage 2), hersteld. IRIS kan dit niet. Daarbij
is het soms niet duidelijk wat de invuller bedoelt, bijvoorbeeld met het vermelden van
‘dementie’ op deel 2 van het doodsoorzakenformulier. Deze vermelding veroorzaakt
een grote verschuiving in de selectie van de onderliggende doodsoorzaak, terwijl de
causale rol van de (ongekwalificeerde) dementie bij het overlijden niet duidelijk is. Nader
onderzoek onder de invullers van het doodsoorzakenformulier is nodig.
1. Inleiding
Het Centraal Bureau van de Statistiek (CBS) is met ingang van het statistiekjaar 2013
overgegaan op het automatisch coderen van doodsoorzakenformulieren (zie ook Birch,
1)
De waargenomen afname van de sterfte aan het acuut hartinfarct is een artefact, gerelateerd aan de
vergeleken jaren. De sterfte aan het acuut hartinfarct nam in 2012 minder snel af dan in de voorgaande jaren.
In 2013 is dat niet het geval en is de waargenomen sterfte aan het acuut hartinfarct conform de ontwikkeling
die deze doormaakt in de tijd.
CBS | Het automatisch coderen van doodsoorzaken 3
1993). Hiervoor wordt IRIS gebruikt, een softwarepakket voor het automatisch verwerken
van doodsoorzakenformulieren (versie 4.2.0; release februari 2013). De ontwikkeling van
IRIS is ondersteund door EUROSTAT (het statistiekbureau van de Europese Unie) en het
beheer van de software is in handen van het IRIS instituut, sinds 2011 gehuisvest bij het
‘Deutsches Institut für Medizinische Dokumentation und Information’ (DIMDI) te Keulen.
IRIS maakt gebruik van tabellen voor het selecteren van een onderliggende doodsoorzaak,
die al sinds 1967 worden ontwikkeld en beheerd door het National Centre for Health
Statistics (NCHS) te Washington (Israel, 1972, 1990). IRIS wordt inmiddels door 12 landen
gebruikt bij de productie van de doodsoorzakenstatistiek en als internationale standaard
voor het coderen van doodsoorzaken beschouwd (EC, 1998).2) Bij het gebruik van IRIS vindt
ten eerste codering van de medische termen op een doodsoorzakenformulier plaats met
behulp van een woordenboek dat medische termen vertaalt in een ICD-10 code, en ten
tweede vindt er een selectie van de onderliggende doodsoorzaak plaats wanneer er op een
doodsoorzakenformulier meer dan één doodsoorzaak wordt vermeld (75 procent van de
gevallen) aan de hand van ICD-10 selectieregels (Johansson, 1996).3)
De introductie van het automatisch coderen van doodsoorzaken door het CBS is een radicale
breuk met een meer dan 100 jaar oude traditie waarbij de doodsoorzaak van een overledene
door een codeur handmatig werd gecodeerd. Automatische codering van doodsoorzaken
heeft een aantal voor- en nadelen (zie bijlage 1). Internationale vergelijkbaarheid en een betere
reproduceerbaarheid (bijvoorbeeld van tijdreeksen) van de cijfers, alsmede een toename van
consistentie (verminderde inter- en intra codeurvariatie), inzichtelijkheid en begrijpelijkheid
van de selectie van de onderliggende doodsoorzaak zijn belangrijke motieven voor het in
gebruik nemen van IRIS. Het gebruik van IRIS is beperkt tot de natuurlijke doodsoorzaken.
Voor het verwerken van de niet-natuurlijke doodsoorzaken en de maternale of perinatale
sterfgevallen (incl. doodgeborenen) is IRIS nog niet geschikt. Deze worden als voorheen
handmatig verwerkt.
De introductie van het automatisch coderen brengt (eenmalige) verschuivingen in de
statistiek met zich mee en wel om twee redenen:
1. Het selecteren van de onderliggende doodsoorzaak is gebaseerd op de toepassing van
een complex stelsel van door de WHO vastgestelde selectieprincipes (deel 2 ICD-10;
WHO, 1992). Bij de toepassing van die regels in de praktijk moeten er keuzes gemaakt
worden op basis van medisch-inhoudelijke argumenten. Daarbij heeft een aantal landen
(waaronder Nederland) bij handmatig coderen eigen keuzes gemaakt. De IRIS-software
volgt de selectieprincipes van de ICD-10. Hierdoor kan een verschil ontstaan in de
selectie van de onderliggende doodsoorzaak.
2. Elk jaar vaardigt de WHO updates van de ICD-10-classificatie. De updates weerspiegelen
veranderde of nieuwe inzichten in het coderen en selecteren van een onderliggende
doodsoorzaak, of zijn bedoeld om nieuwe ziektes een plaats te geven in de classificatie.
Vanuit het oogpunt van statistiek betekent elke aanpassing van de gehanteerde
classificatie een mogelijke breuk in de tijdreeks, hoe klein ook. Daarom is door het CBS
in het verleden besloten om, vanaf de ingebruikname van de ICD-10 in 1996, de updates
2)
3)
Te weten (tussen haakjes: vanaf statistiekjaar): België (2012), Canada (2013), Cyprus (2012), Denemarken
(2011), Duitsland (vier deelstaten, 2011), Engeland & Wales (2014), Frankrijk (2011), Hongarije (2011), Italië
(2011), Luxemburg (2011), Noorwegen (2011), Zweden (2012). Canada, de Verenigde Staten (al sinds de
jaren zeventig) en acht Zuid-Amerikaanse landen gebruiken ACME/MMDS, het systeem voor coderen van
doodsoorzaken dat de kern van IRIS vormt.
Voor een natuurlijke dood is de onderliggende doodsoorzaak gedefinieerd als: de ziekte of aandoening die een
reeks van (morbide) gebeurtenissen in gang heeft gezet die rechtstreeks leidt tot de dood (ICD-10, deel2, p31).
De doodsoorzakenstatistiek is gebaseerd op een tabulatie van onderliggende doodsoorzaken.
CBS | Het automatisch coderen van doodsoorzaken 4
niet door te voeren in de Nederlandse doodsoorzakenstatistiek. De IRIS-software maakt
echter altijd gebruik van de meest actuele versie van de ICD-10, inclusief de updates.
De overstap op IRIS betekent daarom ook dat alle ICD-updates sinds 1996 in één keer
verwerkt zijn in de cijfers van het jaar 2013.
Deze rapportage geeft een beeld van de verschillen tussen de statistiekjaren 2012
(handmatig gecodeerd) en 2013 (automatisch gecodeerd) en de mogelijke verklaringen
voor deze verschillen. Daarbij hanteren we de indeling naar doodsoorzakengroepen
zoals die wordt gebruikt bij de publicatie van de maandcijfers op Statline. We proberen
epidemiologische factoren te onderscheiden van de introductie van het automatisch
coderen om zo het gevolg van de nieuwe werkwijze op de doodsoorzakenstatistiek zichtbaar
te maken.
2. Het coderen van doodsoorzaken
In Nederland werden doodsoorzakenformulieren tot en met het statistiekjaar 2012
handmatig gecodeerd door codeurs onder supervisie van de medisch ambtenaar van
het CBS. Een codeur las het doodsoorzakenformulier en codeerde de onderliggende
doodsoorzaak. Daarbij was het mogelijk naast de onderliggende of primaire doodsoorzaak
drie ziekten of aandoeningen aan te geven die aan het overlijden bijdroegen. Deze
secundaire doodsoorzaken vormden een selectie van de op het formulier vermelde ziekten
of aandoeningen. Bij codering van het doodsoorzakenformulier werd gebruik gemaakt van
de ICD-10, de daarbij behorende codeerregels, en een handleiding met aanvullende (lokale)
regels. Bij complexe gevallen was er onderling overleg of werd de eindbeslissing genomen
door de medisch ambtenaar van het CBS. Bij onduidelijkheid of onvolledigheid werd in
principe navraag gedaan bij de invuller van het doodsoorzakenformulier. Met deze meer dan
100 jaar oude traditie werd gebroken door de introductie van IRIS, een software pakket voor
het automatisch coderen van doodsoorzakenformulieren.
Het statistiekjaar 2013 is automatisch gecodeerd met behulp van IRIS. Het programma
maakt gebruik van een woordenboek dat medische termen vertaalt in ICD-10 codes en
van een groot aantal beslistabellen om codes volgens ICD-10-regels te modificeren of de
onderliggende doodsoorzaak te selecteren. Het woordenboek is opgesteld onder leiding
van de medisch ambtenaar van het CBS. Daarbij is gebruik gemaakt van aantekeningen
die de CBS codeurs gebruikten bij het handmatig coderen, internationale voorbeelden en
het Nederlandstalige woordenboek dat de collega’s van de Vlaamse gemeenschap hebben
opgesteld. De beslistabellen die IRIS gebruikt voor het coderen en selecteren van de
onderliggende doodsoorzaak zijn sinds de jaren zestig in ontwikkeling onder auspiciën van
de WHO Mortality Reference Group. Deze bevatten de meest recente ICD-10 updates en
vormen de standaard voor het coderen van doodsoorzaken. Daarnaast heeft het CBS zelf
programmatuur ontwikkeld om de grote variëteit aan (handgeschreven) medische termen
op een doodsoorzakenformulier om te zetten in standaarduitdrukkingen die vervolgens
CBS | Het automatisch coderen van doodsoorzaken 5
middels het woordenboek van een ICD-10 code worden voorzien.4) Ook is er gebruik
gemaakt van de mogelijkheid die IRIS heeft om een term afhankelijk van de aangegeven
tijdsduur een andere code te geven (‘vlaggen’). Hiermee kan bijvoorbeeld het verschil
tussen acuut en chronisch in de ICD-10 code tot uitdrukking worden gebracht. Met het
opstellen van het woordenboek, het hanteren van reguliere expressies en vlaggen en de
keuzen die daarbij worden gemaakt, komt een lokale opvatting over het coderen ook in de
automatische verwerking van doodsoorzaken tot uitdrukking maar veel minder sterk dan in
het verleden het geval was.
IRIS is bedoeld voor het coderen van de doodsoorzaak bij personen met een natuurlijk
overlijden. Voor het coderen van niet-natuurlijke doodsoorzaken, maternale of perinatale
sterfgevallen (incl. doodgeborenen) zijn de IRIS beslistabellen nog niet geschikt (Pavillon &
Johansson, 2001). Codering van deze gevallen geschiedt als voorheen handmatig. Daarbij
wordt IRIS wel gebruikt om de uitvoer te verzorgen. Suggesties voor codering van medische
termen (dat wil zeggen het woordenboek) zijn daarbij beschikbaar. De selectie van de
onderliggende doodsoorzaak en/of het primair letsel zal echter door de codeur geschieden.
Bij de automatische verwerking van een doodsoorzakenformulier worden de volgende
stappen genomen:
1. De handgeschreven tekst van de invuller wordt overgetypt en ingevoerd (zo letterlijk
mogelijk dat wil zeggen inclusief spelfouten, waardoor originele invoer behouden blijft
en toegankelijk is).
2. Medische termen op het doodsoorzakenformulier worden automatisch omgezet in
standaardtermen (door de zogenaamde reguliere expressies)4).
3. Op basis van termen vindt een voorselectie plaats van formulieren die eerst door een
codeur worden beoordeeld alvorens deze door IRIS worden verwerkt.
4. Verwerking door IRIS in twee stappen:
a. De standaardtermen op het doodsoorzakenformulier worden met behulp van een
woordenboek door IRIS omgezet in ICD-10 codes (codering).
b. IRIS bepaalt op basis van de IDC-10 selectieregels welke code op het
doodsoorzakenformulier de onderliggende doodsoorzaak is (selectie).
5. Handmatige (na)controle van de codering, gericht op codes waarmee IRIS niet goed om
kan gaan.
Bij deze procedure vindt eerst koppeling van het doodsoorzakenformulier aan de
Basisregistratie Personen (BRP) plaats, zodat bij de codering de juiste leeftijd en geslacht
worden gebruikt.
Van de sterfgevallen met een natuurlijk overlijden codeert IRIS in ongeveer 61 procent van
de gevallen de onderliggende doodsoorzaak volledig automatisch, dat wil zeggen zonder
menselijk ingrijpen, volgens de stappen 1 tot en met 4. Het formulier is dan gecodeerd
en van een onderliggende doodsoorzaak voorzien. Formulieren die om een of andere
reden een stap niet goed doorlopen, worden apart gezet en aangeboden voor handmatige
verwerking. De codeur corrigeert dan onder meer schrijffouten op het formulier, herstelt
invoerproblemen, codeert medische termen die niet in het woordenboek aanwezig zijn,
4)
Zogenaamde reguliere expressies (Regex). Zo wordt bijvoorbeeld ‘hartinfarct’ op vele manieren geschreven,
variërende van ‘hartinf’ tot ‘hi’, of uitgedrukt middels een synoniem ‘myocardinfarct’. Al deze termen (inclusief
spelfouten) worden middels reguliere expressies omgezet in ‘hartinfarct’. Deze standaard term staat in het
woordenboek en is aan een ICD-10 code gekoppeld. De reguliere expressies brengen een sterke reductie van de
omvang van het woordenboek met zich mee, hetgeen de beheersbaarheid bevordert.
CBS | Het automatisch coderen van doodsoorzaken 6
en past selectie van de onderliggende doodsoorzaak aan in situaties die IRIS (nog) niet
aankan. Uiteindelijk blijkt IRIS dan in 93 procent van de sterfgevallen met een natuurlijke
doodsoorzaak de onderliggende doodsoorzaak te kunnen bepalen. In slechts 7 procent
van de gevallen wordt de onderliggende doodsoorzaak nog handmatig bepaald. De codeur
overruled dan de programmatuur of beslist in geval van twijfel.5)
De kwaliteit van de automatisch verwerking van de doodsoorzakenformulieren wordt op
twee manieren gewaarborgd. Zo wordt er een lijst met termen gehanteerd die we gebruiken
bij een selectie van gevallen waar IRIS mogelijk foutief mee omgaat, bijvoorbeeld ‘tumor’,
‘operatie’ of ‘metastase’.6) Doodsoorzakenformulieren met deze termen worden eerst door
de codeur gezien (voorselectie). De codeur kan dan besluiten het formulier zelf te coderen
of dit door IRIS te laten doen en zo nodig de codering van het formulier door IRIS direct
te corrigeren. Zo wordt voorkomen dat formulieren automatisch door IRIS heengaan en
foutief worden gecodeerd zonder dat deze aan het oog van de codeur verschijnen. Ook is er
in de loop van 2013 een lijst met ICD-10 codes aangelegd die IRIS mogelijk foutief codeert,
bijvoorbeeld bij codecombinaties of bij selectie van de onderliggende doodsoorzaak (zie ook
Lu 2003, 2005). Het bestand is na de automatische verwerking aan de hand van deze lijst
door de codeurs nagelopen en de codering is zo nodig handmatig gecorrigeerd (nacontrole).
Het aldus verkregen bestand met onderliggende doodsoorzaken wordt gebruikt voor
tabulatie van de doodsoorzakenstatistiek.
3. Verschuivingen in de
doodsoorzakenstatistiek
Bij de introductie van het automatisch coderen zijn (forse) verschuivingen in de
doodsoorzakenstatistiek waarneembaar. Hiervoor zijn twee soort verklaringen:
1. een andere uitkomst van het selectieproces bij het bepalen van de onderliggende
doodsoorzaak; 2. epidemiologische factoren. Selectie van de onderliggende doodsoorzaak
vindt plaats wanneer er op een doodsoorzaakformulier meer dan één doodsoorzaak
staat vermeld. Stel er staat ‘hartinfarct’ op veld 1a en ‘longontsteking’ op veld 1b van het
doodsoorzakenformulier (zie bijlage 2). Een codeur koos dan bij handmatig coderen het
hartinfarct als onderliggende doodsoorzaak, omdat er geen expliciet verband (bijvoorbeeld
hypoxie of extreme stressfactoren) tussen de longontsteking en het hartinfarct vermeld
staat. IRIS volgt in een dergelijk geval echter de invuller en wijst de longontsteking als
onderliggende doodsoorzaak aan. Aan het doodsoorzakenformulier en de daarop vermelde
termen verandert niets, maar de doodsoorzakenstatistiek, gebaseerd op tabulatie van de
onderliggende doodsoorzaken, verandert wel. Een waargenomen verschuiving kan ook
worden veroorzaakt door epidemiologische factoren als (griep)epidemieën; de invloed van
5)
6)
IRIS zet (ongeveer 2,5 procent van de ) gevallen met een mogelijk causaal verband apart en vraagt de codeur
handmatig een beslissing te nemen.
Bijvoorbeeld: een tumor met metastase mag als maligniteit worden gecodeerd. IRIS codeert de tumor en kan
in deze situatie niet altijd de juiste maligniteit coderen. Of: het CBS selecteert een gemetastaseerde maligniteit
op deel 2 van het formulier als onderliggende doodsoorzaak. IRIS doet dit niet op basis van het al of niet
gemetastaseerd zijn, maar alleen als de maligniteit al de bovenstaande doodsoorzaken kan verklaren.
CBS | Het automatisch coderen van doodsoorzaken 7
behandeling, medische technologie, preventie of demografische veranderingen. Bij een
vergelijking van de jaren 2012 en 2013 moeten derhalve epidemiologische factoren worden
onderscheiden van de verandering in methode, ofwel, het automatisch coderen met behulp
van IRIS.7)
De epidemiologische factoren worden zichtbaar in trendcijfers. Daarom is een
trendanalyse verricht op de doodsoorzakencijfers van de jaren 1996-2012 (zie hoofdstuk
5). Hieruit volgt een voorspelling van de doodsoorzaakspecifieke sterfte voor het jaar
2013. De sterfte 2013-2018, verwacht op basis van de trendmatige ontwikkeling van
de sterftecijfers (donkerblauwe lijn), kan nu worden vergeleken met de waargenomen
sterfte aan de desbetreffende doodsoorzaak in 2013 (lichtblauw stipje). Wijkt de
waargenomen doodsoorzaakspecifieke sterfte in 2013 niet significant af van de verwachte
doodsoorzaakspecifieke sterfte, dan is een effect van de overgang op automatisch coderen
niet te onderscheiden van een epidemiologische ontwikkeling. Een effect van de overgang
op automatisch coderen is in een dergelijke situatie echter niet uitgesloten. Dit blijkt uit
een andere bron, namelijk een eerder door het CBS uitgevoerde bridge (dual) coding
studie (zie bijlage 3) (McKenzie et al., 2001). Op het statistiekjaar 2009 is een onderzoek
uitgevoerd, waarbij een(zelfde) doodsoorzakenformulier zowel handmatig als automatisch
is gecodeerd. Voor het automatisch verwerkte gedeelte van dit jaar kan dan de code voor
de onderliggende doodsoorzaak (op gevalsniveau) worden vergeleken en een eventueel
verschil tussen handmatig en automatisch coderen (ceteris paribus) worden toegeschreven
aan een verschil in methode (kolom 4 in tabel 3.1.1).8)
Op basis van de bridgecoding studie kan de sterfte voor het jaar 2013 worden berekend als
er niet op automatisch coderen was overgegaan (oranje stipje in de figuren 5.0.1–5.0.8).
Dit stelt ons in staat een significant effect van de overgang op automatisch coderen
te identificeren. Als de waargenomen sterfte aan een bepaalde doodsoorzaak in 2013
(lichtblauw stipje in de figuren 5.0.1–5.0.8) namelijk buiten de op basis van de trendmatige
ontwikkeling verwachte doodsoorzaakspecifieke sterfte is gelegen, en de sterfte als er niet
was overgegaan op automatisch coderen (oranje stipje in de figuren 5.0.1–5.0.8) binnen de
op basis van de trendmatige ontwikkeling verwachte doodsoorzaakspecifieke sterfte ligt,
is er sprake van een significant effect van de introductie van het automatisch coderen op de
doodsoorzakenstatistiek en zal hiervoor een verklaring moeten worden gezocht.
Hoewel het coderen van de doodsoorzaken zowel handmatig als automatisch volgens de
regels en aanwijzingen van de ICD-10 geschiedt, brengt het interpreteren van deze regels
verschillen met zich mee die in de doodsoorzakenstatistiek zichtbaar worden.9) Deze
zijn nader onderzocht door een handmatige beoordeling van de door IRIS gecodeerde
doodsoorzakenformulieren. Bij een afname van frequentie in sterfte (bijvoorbeeld bij
kwaadaardige nieuwvormingen) zijn in de eerste drie maanden van 2013 alle formulieren
nagekeken waarop de desbetreffende ziekte of aandoening is vermeld, maar deze door
IRIS niet als onderliggende doodsoorzaak is aangewezen. Op deze manier kan een andere
7)
8)
9)
Demografische verschillen zijn bij een vergelijking van 2013 en 2012 dermate klein dat deze buiten
beschouwing kunnen blijven.
Alleen voor het volautomatisch gecodeerde gedeelte van het jaar 2009 (66 procent) en daardoor onderhevig
aan een selectie van onbekende aard.
Onder meer door het hanteren van de ICD-10 updates. De complexiteit van het introduceren gaat het
handmatig coderen te boven. Zo is er geen aanpassing van de index en worden mogelijke trendbreuken
niet onderzocht. Daarom heeft het CBS sinds het de ICD-10 in 1996 is gaan gebruiken geen updates
toegepast. Met de introductie van IRIS worden ook de WHO jaarlijkse ICD-10 updates in de Nederlandse
doodsoorzakenstatistiek geïntroduceerd. Deze zijn verwerkt in de beslistabellen van IRIS.
CBS | Het automatisch coderen van doodsoorzaken 8
selectie worden opgespoord die een gedeelte van de waargenomen verschuiving in sterfte
verklaart.
De tabel 3.1.1 geeft een beeld van de verschuiving in doodsoorzaken. Het jaar 2012
(handmatig gecodeerd) is vergeleken met het jaar 2013 (met behulp van IRIS gecodeerd).
De verwachte verschuivingen zijn enerzijds gebaseerd op de bridgecoding studie waarin
handmatige codering is vergeleken met automatische codering van dezelfde records
(dubbel coderen, zie kolom vier) en anderzijds op de ontwikkeling van de cijfers in de tijd (zie
kolom vijf).
Tabel 3.1.1 Verschil tussen doodsoorzaken in 2012 en 20131)
2012
2013
Procentuele verandering 2013–2012
Handmatig
gecodeerd
Automatisch
gecodeerd
Aantal
Verwacht
o.b.v. Bridge
coding study
Verwacht
o.b.v. trend
1996–2012
%­
Nieuwvormingen (C00-D48)
44 661
44 156
−1­,1
−0­,4
+2­,7
Kwaadaardige nieuwvormingen van luchtpijp en long (C33-C34)
10 322
10 277
−0­,4
−1­,7
+2­,0
3 230
3 182
−1­,5
−0­,9
+2­,3
Overige nieuwvormingen
31 109
30 697
−1­,3
Psychische stoornissen & ziekten van zenuwstelsel en zintuigen (F00-H95)
14 171
17 188
+21­,3
+27­,1
+3­,5
Ziekten van hart en vaatstelsel (I00-I99)
38 371
38 463
+0­,2
+2­,1
+0­,4
Kwaadaardige nieuwvormingen van de borst (C50)
Acuut hartinfarct (I21–22)
6 195
5 690
−8­,2
−1­,8
−2­,5
8 472
9 400
+11­,0
+11­,2
+1­,4
Hartvaatziekten overig
23 704
23 373
−1­,4
Ziekten van de ademhalingsorganen (J00-J99)
14 477
12 269
−15­,3
−22­,2
+0­,4
Overig
29 133
29 169
+0­,1
Totaal
140 813
141 245
+0­,3
Hersenvaatstelsel (I60-I69)
­1)
Waargenomen
In de tabel 3.1.1 is de Statline indeling van de maandcijfers voor doodsoorzaken gehanteerd. Op Statline worden deze niet uitgesplitst naar leeftijd of
geslacht.
Bij de introductie van het automatisch coderen van doodsoorzaken is een verschuiving
waarneembaar in de sterfte aan psychische ziekten en aandoeningen van zenuwstelsel of
zintuigen (+21,3 procent) (voornamelijk door een toename in de sterfte aan dementie en
de ziekte van Alzheimer), ziekten van het hersenvaatstelsel (+11,0 procent) (voornamelijk
door een toename in de sterfte aan late gevolgen van het Cerebrovasculair Accident
(CVA)), longkanker (–0,4 procent), het totaal aantal nieuwvormingen (–1,1 procent),
borstkanker (–1,5 procent), het acuut hartinfarct (–8,2 procent) (door vergelijking van een
trend overeenkomstige waarde in 2013 met de minder dan gebruikelijk gedaalde waarde
van 2012) en ziekten van de ademhalingsorganen (–15,3 procent) (voornamelijk door een
afname van de sterfte aan longontsteking).
CBS | Het automatisch coderen van doodsoorzaken 9
4. Interpretatie van de
verschuivingen in de
doodsoorzakenstatistiek
In deze paragraaf gaan we nader in op de waargenomen verschuivingen. Dit wordt gedaan
aan de hand van de figuren die zijn opgenomen in hoofdstuk 5. Aan het begin van hoofdstuk
5 wordt toegelicht hoe de figuren geïnterpreteerd kunnen worden. Daarbij proberen we het
verschil in voorkomen van een doodsoorzaak in de tijd (trend) of epidemische verheffingen
door bijvoorbeeld een griep-epidemie of hittegolf te onderscheiden van de introductie van
het automatisch coderen (methode effect).
4.1 Totaal nieuwvormingen (C00–D48)
De sterfte aan de kwaadaardige en goedaardige nieuwvormingen neemt in 2013 met
1,1 procent af ten opzichte van het jaar 2012. Op basis van de bridgecoding studie wordt een
afname met 0,4 procent verwacht als gevolg van de overstap op automatisch coderen. De
waargenomen sterfte aan nieuwvormingen (lichtblauw stipje) en de sterfte als er niet was
overgegaan op automatisch coderen (oranje stipje) wijken significant af van het gemiddelde
van de tijdreeks 1996–2012 (zie figuur 5.0.1). Er lijkt sprake van een uitbijter in het verloop
van de tijdreeks. Het effect van de introductie van het automatisch coderen is niet te
onderscheiden van epidemiologische ontwikkelingen.10)
Kwaadaardig nieuwvormingen van long en luchtpijp (C33–C34)
De sterfte aan maligniteiten van long en luchtpijp neemt in het jaar 2013 af met 0,4 procent
ten opzichte van het jaar 2012. Op basis van de bridgecoding studie wordt een afname met
1,7 procent verwacht als gevolg van de overstap op automatisch coderen. De waargenomen
sterfte aan nieuwvormingen van long en luchtpijp (lichtblauw stipje) en de sterfte als er niet
was overgegaan op automatisch coderen (oranje stipje) wijken niet significant af van het
gemiddelde van de tijdreeks 1996–2012 (zie figuur 5.0.2). Er is derhalve geen duidelijk effect
van de introductie van het automatisch coderen op de sterfte aan de maligniteiten van long
en luchtpijp waarneembaar.11)
10)
11)
Dat wil zeggen op ICD-10 hoofdstukniveau is er geen trendbreuk waarneembaar. Binnen het hoofdstuk zijn er in de
bridgecoding studie wel verschuivingen waarneembaar. In 2013 is er geen informatie ingewonnen over de aard van
een tumor. Wanneer de arts ‘tumor’ op het formulier schreef, is de diagnose daardoor niet gespecificeerd (D code).
Dit gaat ten koste van de kwaadaardige nieuwvormingen van de hersenen, longen, darmen en blaas
(C code). Ook is er een uitstroom van gevallen (ongeveer 2,5 procent) die door automatisch coderen een
onderliggende doodsoorzaak in een ander ICD-10 hoofdstuk toegewezen krijgen. Deze uitstroom wordt
echter gecompenseerd door een nagenoeg even grote instroom van gevallen die handmatig niet, maar bij
automatisch coderen wel een nieuwvorming als onderliggende doodsoorzaak toegewezen krijgen.
Bij bridgecoding blijkt er echter wel een uitstroom van gevallen (ongeveer 3,5 procent) die bij automatisch
coderen een andere onderliggende doodsoorzaak toegewezen krijgen (voornamelijk COPD, longtumor en het
acuut hartinfarct in plaats van longkanker). Bij kwalitatieve analyse van dergelijke doodsoorzakenformulieren
valt op dat er verschuiving plaatsvindt naar ‘COPD’ doordat deze term vóór of boven longkanker op het
B formulier genoteerd is. Strikt genomen is de selectie van IRIS nu juist. COPD kan niet uit longkanker ontstaan.
Het is echter de vraag of de invuller van het doodsoorzakenformulier hier daadwerkelijk COPD bedoeld, dan
wel een vorm van benauwdheid en/of hoesten ten gevolge van de longkanker. De uitstroom wordt gedeeltelijk
gecompenseerd door een instroom van gevallen die handmatig niet, maar bij automatisch coderen wel
longkanker als onderliggende doodsoorzaak toegewezen krijgen (voornamelijk van longontsteking naar
longkanker).
CBS | Het automatisch coderen van doodsoorzaken 10
Kwaadaardig nieuwvormingen van de borst (C50)
De sterfte aan kwaadaardige nieuwvormingen van de borst vertoont in het jaar 2013 een
afname van 1,5 procent ten opzichte van het jaar 2012. Op basis van de bridgecoding studie
wordt een afname met 0,9 procent verwacht als gevolg van de overstap op automatisch
coderen. De waargenomen sterfte aan borstkanker (lichtblauw stipje) en de sterfte aan
borstkanker als er niet was overgegaan op automatisch coderen (oranje stipje) wijken niet
significant af van het gemiddelde van de tijdreeks 1996–2012 (zie figuur 5.0.3). Er is derhalve
geen duidelijk effect van de introductie van het automatisch coderen op de sterfte aan
borstkanker waarneembaar.12)
4.2 Psychische stoornissen en ziekten van het zenuwstelsel (F00–H95)
De sterfte aan psychische stoornissen en ziekten van het zenuwstelsel vertoont in het
jaar 2013 een toename van 21,3 procent ten opzichte van het jaar 2012. Op basis van
de bridgecoding studie wordt een toename van maar liefst 27,1 procent verwacht als
gevolg van de overstap op automatisch coderen. De waargenomen sterfte aan psychische
stoornissen en ziekten van het zenuwstelsel (lichtblauw stipje) wijkt significant af van het
gemiddelde van de tijdreeks 1996–2012, hetgeen zonder de overstap op het automatisch
coderen (oranje stipje) niet het geval zou zijn geweest (zie figuur 5.0.4). Er is sprake van
een significant effect van de introductie van het automatisch coderen op de sterfte aan
psychische stoornissen en ziekten van het zenuwstelsel.13) Deze kan worden toegeschreven
aan een sterke stijging van dementie (incl. de ziekte van Alzheimer) als onderliggende
doodsoorzaak.
De introductie van het automatisch coderen heeft een groot gevolg voor de sterfte aan
psychische stoornissen en ziekten van het zenuwstelsel. Dit kan worden verklaard door:
1. Verschil in selectie van dementie als onderliggende doodsoorzaak. Een toename
in sterfte aan dementie of de ziekte van Alzheimer is grotendeels verantwoordelijk
voor de sterke toename in sterfte aan psychische stoornissen en ziekten van het
zenuwstelsel. Wanneer wordt uitgegaan van het voorkomen van de term ‘dementie’ op
een doodsoorzakenformulier is in de bridgecoding studie het verschil tussen handmatig
en automatisch coderen slechts 3 procent. Aangenomen dat het voorkomen van deze
term in korte tijd niet noemenswaardig is veranderd, betekent het dat een ander
selectieprincipe het waargenomen verschil moet verklaren.
12)
13)
Bij bridgecoding blijkt echter wel een uitstroom van gevallen (ongeveer 4,5 procent) die bij automatisch
coderen een andere onderliggende doodsoorzaak toegewezen krijgen (voornamelijk hartfalen en sepsis in
plaats van borstkanker). Deze uitstroom wordt gedeeltelijk gecompenseerd door een instroom van gevallen die
handmatig niet, maar bij automatisch coderen wel borstkanker als onderliggende doodsoorzaak toegewezen
krijgen (voornamelijk afkomstig van longontsteking).
Bij bridgecoding worden bijna alle gevallen (96 procent) die voorheen handmatig aan deze groep
doodsoorzaken worden toegewezen er ook bij automatisch coderen in terug gevonden. Er is echter een grote
instroom van gevallen (bijna 25 procent toename ten opzichte van het totaal in 2012) die bij automatisch
coderen wel, maar bij handmatig coderen niet een onderliggende doodsoorzaak in deze groep toegewezen
krijgen (voornamelijk van longontsteking, luchtweg- of urineweginfecties naar dementie).
CBS | Het automatisch coderen van doodsoorzaken 11
2. Verschil in opvatting over causale verbanden. Anders dan bij handmatig coderen
het geval was, legt IRIS een direct causaal verband tussen longontsteking en
urineweginfecties enerzijds en dementie of de ziekte van Parkinson anderzijds.
Dit is het gevolg van updates van de ICD-10 uit 2005 en 2007.14) Dementie en de
ziekte van Parkinson zijn toegevoegd aan een lijst met ziekten of aandoeningen
die via verzwakking, immobiliteit of slikstoornissen andere aandoeningen als
longontsteking veroorzaken en daardoor tot de dood leiden. Dit betekent dat dementie
of de ziekte van Parkinson vermeld op deel 2 van het doodsoorzakenformulier als
onderliggende doodsoorzaak wordt aangewezen bij vermelding van longontsteking
of urineweginfecties op deel 1 van het doodsoorzakenformulier (zie bijlage 2). De
veronderstelling dat er een verband kan worden gelegd dat de arts niet opschreef
ligt hieraan ten grondslag. Bij handmatig coderen werd deze veronderstelling niet
gehanteerd en werd afgegaan op een expliciet uitgeschreven verband alvorens dementie
of de ziekte van Parkinson onderliggende doodsoorzaak werd genoemd.
3. Een toename van de sterfte aan alcoholgebruik of drugsverslaving (F10-19). Deze
groep ziekten/aandoeningen wordt door IRIS ongeveer twee keer zo vaak als
onderliggende doodsoorzaak aangewezen dan bij handmatig coderen het geval was.
Vooral de sterfte aan alcoholgebruik (F10) is toegenomen. Alcoholgebruik wordt
onderliggende doodsoorzaak ten gunste van bijvoorbeeld hartinfarct of maligniteiten,
zelfs wanneer deze laatste op deel 2 van het doodsoorzakenformulier vermeld staan.
Bij handmatig coderen werd dit niet gedaan, omdat de frequentie van alcohol als
onderliggende doodsoorzaak dan te afhankelijk zou worden van het vermelden van
alcohol op het doodsoorzakenformulier en de intrinsieke variabiliteit die dit laatste
met zich meebrengt. De waargenomen verschuiving is dan ook voornamelijk een
gevolg van een aanpassing aan de internationale opvattingen over het selecteren van
alcoholgebruik als onderliggende doodsoorzaak die de introductie van IRIS met zich
meebrengt.
4. Tekortkoming in de IRIS beslistabel. Bijvoorbeeld: bij longontsteking op deel 1 en COPD
en dementie naast elkaar op deel 2 van het doodsoorzakenformulier (zie bijlage 2),
kiest IRIS voor dementie, terwijl op inhoudelijke gronden een verband tussen de
longontsteking en COPD hier meer voor de hand ligt. Het direct causaal verband tussen
longontsteking en COPD ontbreekt echter in de beslistabellen van IRIS waardoor de
selectie hier ten koste gaat van de daadwerkelijke doodsoorzaak.
Concluderend: de waargenomen verschuiving in sterfte aan psychische stoornissen
en ziekten van het zenuwstelsel is grotendeels het gevolg van een aanpassing aan
internationale codeerafspraken die de introductie van het automatisch coderen met zich
meebrengt.
14)
Rule 3 (update ICD-10, 2007): ‘Assumed direct consequences of another condition: Secondary or unspecified
anaemia, malnutrition, marasmus or cachexia may be assumed to be a consequence of any malignant
neoplasm, paralytic disease, gastrointestinal haemorrhage, or disease which limits the ability to care for
oneself, including dementia and degenerative diseases of the nervous system.’ Op basis van een ‘direct
consequence’ (rule 3) mag een ziekte of aandoening genoteerd op deel 2 van het doodsoorzakenformulier als
onderliggende doodsoorzaak worden aangewezen indien deze een op deel 1 genoteerde ziekte of aandoening
kan veroorzaken.
CBS | Het automatisch coderen van doodsoorzaken 12
4.3 Ziekten van het hartvaatstelsel (I00–I99)
De sterfte aan ziekten van het hart- en vaatstelsel vertoont in het jaar 2013 een toename
van 0,2 procent ten opzichte van het jaar 2012. Op basis van de bridgecodingstudie wordt
een toename met 2,1 procent verwacht als gevolg van de overstap op automatisch coderen.
De waargenomen sterfte aan ziekten van het hartvaatstelsel (lichtblauw stipje) en de sterfte
aan ziekten van het hartvaatstelsel als er niet was overgegaan op automatisch coderen
(oranje stipje) wijken niet significant af van het gemiddelde van de tijdreeks 1996–2012
(zie figuur 5.0.5). Er is geen duidelijk effect van de introductie van het automatisch coderen
waarneembaar.15)
Acuut hartinfarct (I21–I22)
De sterfte aan het acuut hartinfarct vertoont in het jaar 2013 een afname van 8,2 procent
ten opzichte van het jaar 2012. Op basis van de bridgecoding studie wordt een afname met
1,8 procent verwacht als gevolg van de overstap op automatisch coderen. De waargenomen
sterfte aan het acuut hartinfarct (lichtblauw stipje) en de sterfte aan het acuut hartinfarct
als er niet was overgegaan op automatisch coderen (oranje stipje) wijken niet significant af
van het gemiddelde van de tijdreeks 1996–2012 (zie figuur 5.0.6). Er is geen duidelijk effect
van de introductie van het automatisch coderen op de sterfte aan het acuut hartinfarct
waarneembaar.16)
Hersenvaatstelsel (I60–I69)
De sterfte aan ziekten van het hersenvaatstelsel vertoont in het jaar 2013 een toename van
11,0 procent ten opzichte van het jaar 2012. Op basis van de bridgecoding studie wordt een
toename met 11,2 procent verwacht als gevolg van de overstap op automatisch coderen. De
waargenomen sterfte aan ziekten van het hersenvaatstelsel (lichtblauw stipje) wijkt in 2013
significant af van het gemiddelde van de tijdreeks 1996–2012, hetgeen zonder de overstap
op het automatisch coderen (oranje stipje) niet het geval zou zijn geweest (zie figuur 5.0.7).
De overstap op automatisch coderen lijkt derhalve verantwoordelijk voor de waargenomen
verschuiving in sterfte aan ziekten van het hersenvaatstelsel.
De sterke toename van de sterfte aan een Cerebrovasculair Accident (CVA) (4 procent voor
het ongespecificeerd CVA en maar liefst drie maal zo veel laat gevolg ofwel oud CVA in 2013
dan in 2012) is te verklaren doordat IRIS een direct verband legt tussen doodsoorzaken op
deel 1 (voornamelijk longontsteking en urineweginfecties) en een CVA op deel 2 van het
doodsoorzakenformulier (zie bijlage 2). Bij handmatig coderen werd het vermelden van
een CVA op 2 doorgaans als bijkomende doodsoorzaak gezien (zeker bij een oud of laat
gevolg van het CVA) en werd dit niet in de causale keten als onderliggende doodsoorzaak
opgenomen. Bij automatisch coderen wordt in 25 procent van de gevallen waarbij het CVA
als bijkomstige ziekte op deel 2 van het doodsoorzakenformulier wordt vermeld, het CVA
15)
16)
Dat wil zeggen op hoofdstukniveau is er geen trendbreuk waarneembaar. Binnen de hoofdgroep zijn er
in de bridge coding studie wel verschuivingen waarneembaar. Er is een uitstroom van gevallen (ongeveer
7 procent, voornamelijk naar COPD, longontsteking en diabetes) die door automatisch coderen een
onderliggende doodsoorzaak in een ander ICD-10 hoofdstuk toegewezen krijgen. Deze uitstroom wordt
echter gecompenseerd door een instroom van gevallen (voornamelijk afkomstig van COPD, longontsteking,
luchtweginfecties en urineweginfecties) die handmatig niet, maar bij automatisch coderen wel een
hartvaatziekte als onderliggende doodsoorzaak toegewezen krijgen.
Bij bridgecoding blijkt een uitstroom van gevallen (ongeveer 10 procent) die bij automatisch coderen een
andere onderliggende doodsoorzaak toegewezen krijgen (voornamelijk late gevolgen van hartinfarct, COPD en
longontsteking in plaats van het acuut hartinfarct). Deze uitstroom wordt grotendeels gecompenseerd door een
instroom van gevallen (9 procent, gelijkmatig verdeeld over (vele) andere doodsoorzaken) die handmatig niet, maar
bij automatisch coderen wel het acuut hartinfarct als onderliggende doodsoorzaak toegewezen krijgt.
CBS | Het automatisch coderen van doodsoorzaken 13
toch aangemerkt als onderliggende doodsoorzaak. In absolute aantallen is dit percentage
nagenoeg gelijk aan de toename van het CVA in 2013. De waargenomen verschuiving is
hier dus een aanpassing aan een wat discutabele internationale codeergewoonte, die door
het CBS in de daartoe aangewezen overlegorganen (IRIS User Group en WHO-Mortality
Reference Group) aan zal worden gekaart.17)
4.4 Ziekten van de ademhalingsorganen (J00–J99)
De sterfte aan ziekten van de ademhalingsorganen vertoont in het jaar 2013 een afname van
15,3 procent ten opzichte van het jaar 2012. Op basis van de bridgecoding studie wordt een
afname van 22,2 procent verwacht als gevolg van de overstap op automatisch coderen. De
waargenomen sterfte (lichtblauw stipje) wijkt in 2013 significant af van het gemiddelde van
de tijdreeks 1996–2012, hetgeen zonder de overstap op het automatisch coderen (oranje
stipje) niet het geval zou zijn geweest (zie figuur 5.0.8). De overstap op automatisch coderen
lijkt derhalve verantwoordelijk voor de waargenomen verschuiving in sterfte aan ziekten van
de ademhalingsorganen.
De waargenomen verschuiving is grotendeels het gevolg van een andere selectie van
longontsteking als onderliggende doodsoorzaak. IRIS beschouwt een longontsteking op
grond van een aanwijzing van de WHO (update januari 2006) bijna altijd als het gevolg van
een andere ziekte. Het effect van deze update is groot. In de bridgecoding studie blijkt de
sterfte aan longontstekingen ten gevolge van het automatisch coderen bijna gehalveerd
door de selectie van een andere onderliggende doodsoorzaak. Met name is er een
verschuiving van longontsteking naar dementie, de late gevolgen van een Cerebrovasculair
Accident (CVA), hartfalen en sepsis waar te nemen. Ook de sterfte aan COPD neemt af
(15 procent).
5. Trendanalyse van
doodsoorzaken 1996–2018
De figuren 5.0.1–5.0.8 tonen voor de doodsoorzakengoepen uit het vorige hoofdstuk het
aantal overledenen per jaar voor de jaren 1996 tot en met 2013.18) Het betreft ruwe, niet
gestandaardiseerde aantallen die we gebruiken om het verwachte aantal sterfgevallen
in een bepaalde groep doodsoorzaken in 2013–2018 te voorspellen. De geobserveerde
aantallen 1996–2012 zijn verbonden door een lichtblauwe lijn. De gemodelleerde trend
17)
18)
De WHO Mortality Reference Group is van mening dat het vermelden van een ziekte of aandoening op
deel 2 van het doodsoorzakenformulier betekent dat deze een rol moet hebben gespeeld bij het overlijden.
Strikt genomen is dit juist. Zo luidt de instructie van het doodsoorzakenformulier. Echter, de praktijk leert
dat de invullend arts nog al eens ziekten of aandoeningen uit de ziektegeschiedenis of probleemlijst van de
overledene vermeldt, ook als deze geen rol bij het overlijden hebben gespeeld.
Dat wil zeggen, vanaf de introductie van de ICD-10 in 1996. Voor het voorspellen van de verwachte waarde
in 2013 is het niet nodig de tijdreeks te standaardiseren voor een veranderende bevolkingssamenstelling. We
gebruiken daarvoor ruwe aantallen. Uit de weergegeven tijdreeksen kunnen uiteraard geen conclusies worden
getrokken over een feitelijke stijging of daling van een groep doodsoorzaken in de loop der tijd. Deze zijn
slechts bedoeld om de overgang 2012–2013 in perspectief te plaatsen.
CBS | Het automatisch coderen van doodsoorzaken 14
is weergegeven als een donkerblauwe lijn. Het waargenomen aantal in 2013 is afgebeeld
als een lichtblauw stipje. Een benadering van de sterfte die we in 2013 zouden hebben
gevonden als er niet was overgegaan op automatisch coderen is afgebeeld als een
oranje stipje. De donkerblauwe lijn geeft een voorspelling van de sterfte 2013–2018,
geëxtrapoleerd op basis van de gemodelleerde trend 1996–2012.
Bij interpretatie van een figuur spelen de volgende overwegingen een rol:
1. Het betreft telkens het totaal van het aantal overledenen in het aangegeven jaar. Er
is geen standaardisatie toegepast, omdat de reeksen ‘slechts’ worden gebruikt om de
sterfte in 2013 te voorspellen, zodat de verwachte sterfte kan worden vergeleken met de
waargenomen sterfte.
2. Om naast de waargenomen waarden (1996–2012, lichtblauwe lijn) en van 2013
(lichtblauw stipje) iets tot uiting te brengen van de trend en de spreiding, is van de
verschillende groepen doodsoorzaken een regressiemodel berekend en getekend.
Er werden maximaal drie buigpunten toegelaten. Een regressiemodel is gekozen op
basis van de verklaarde variantie (R2) en significantie van de kwadratische en derde
machtstermen (buigpunten). De verklaarde variantie (R2) is: 0,99 voor modellering
van de sterfte aan kwaadaardige of goedaardige nieuwvormingen (figuur 5.0.1); 0,98
voor modellering van de sterfte aan kwaadaardige nieuwvormingen van luchtpijp of
long (figuur 5.0.2); 0,85 voor modellering van de sterfte aan borstkanker (figuur 5.0.3);
0,96 voor modellering van de sterfte aan psychische stoornissen en ziekten van het
zenuwstelsel (figuur 5.0.4); 0,99 voor modellering van de sterfte aan ziekten van het
hart- en vaatstelsel (figuur 5.0.5); 1,00 voor modellering van de sterfte aan het acuut
hartinfarct (figuur 5.0.6); 0,98 voor modellering van de sterfte aan ziekten van het
hersenvaatstelsel (figuur 5.0.7); en 0,22 voor modellering van de sterfte aan ziekten van
de ademhalingsorganen (figuur 5.0.8). Een model met een R2 van 0,85 of meer is goede
representatie en voorspeler van de waargenomen aantallen.
3. De regressie lijn, bepaald aan de hand van de jaren 1996–2012, is doorgetrokken voor de
jaren 2013–2018. Dit is de donkerblauwe lijn. De lijn is gebaseerd op de waarnemingen
vóór 2013. Omdat er een onzekerheid bij het schatten van deze lijn aanwezig is, zijn
lichtgroene (95 procent) betrouwbaarheidsgrenzen van deze regressielijn getekend. Dit
heet een voorspellingsinterval. Als de regressielijn bijna horizontaal loopt kan het zijn
dat de ‘echte’ trend zowel stijgend als dalend uitvalt. De regressielijn is een beschrijving
van een gemiddelde, dat wil zeggen van waarneming van een aantal jaren, en heeft
dus minder onzekerheid dan de waarden van afzonderlijke jaren. Een afzonderlijk
jaar kan een grotere afwijking ten opzichte van de regressielijn tonen, dus buiten het
voorspellingsinterval liggen, en toch bij de reeks horen (met hetzelfde gemiddelde en
dezelfde standaardafwijking).
Voor de mate van afwijkendheid van de afzonderlijke jaren moet het betrouwbaarheids­
interval als criterium genomen worden, dit betrouwbaarheidsinterval is getekend met
een donkergroene lijn. Jaren die buiten dit betrouwbaarheidsinterval vallen worden
geacht niet tot de reeks te behoren, maar “afwijkend te zijn”. Voor het jaar 2013, moet
dus naar het betrouwbaarheidsinterval (donkergroen) gekeken worden.
4. Merk op dat naarmate verder vooruit wordt voorspeld, de nauwkeurigheid van de
voorspelling afneemt. Dit effect is sterker als meer buigpunten worden toegelaten in de
vergelijking; m.a.w. het ‘volgzamer’ aanpassen van de rode lijn aan de waargenomen
jaren, gaat ten koste van de nauwkeurigheid van de toekomstvoorspellingen. Tevens
is te zien dat het voorspellingsinterval (lichtgroene lijn) nadert naar het wijdere
betrouwbaarheidssinterval (donkergroene lijn) naarmate verder vooruit wordt voorspeld.
CBS | Het automatisch coderen van doodsoorzaken 15
5. Het oranje stipje in de figuren is de terugrekening van de waargenomen aantallen uit
2013 naar de verwachte aantallen als er niet zou zijn overgegaan op automatische
codering. Daartoe delen we de waargenomen sterfte in 2013 door de CR uit de
bridgecoding studie. Met andere woorden, het oranje stipje is de sterfte indien we
de waargenomen sterfte in 2013 terugrekenen naar de werkwijze van het handmatig
coderen (2012 en eerder). Naarmate dat aantal dichter bij de donkerblauwe lijn ligt, is
de kans dat een verschuiving 2012–2013 wordt veroorzaakt door de overgang op het
automatisch coderen groter.
6. Bij de afzonderlijke doodsoorzaken valt op:
a. aan de breedte van de intervallen van ziekten van de ademhalingsorganen valt af
te leiden dat hier niet veel aan te voorspellen valt. De R2 van dit model is ook niet
zo groot (0,22). De sterke fluctuaties zijn niet zo geschikt voor benadering met een
lineair model;
b. bij ziekten van het hersenvaatletsels. Als je meer buigpunten toelaat, hebben een
paar naastliggende jaren meer gewicht. Het laatste jaar (2012) trekt de curve dan
a.h.w. omhoog, maar het valt pas met gegevens van 2014 te zeggen of de stijging
zich doorzet.
c. de gemodelleerde trends en de voorspellingen zijn niet bedoeld als een diepgaande
analyse of werkelijke voorspelling. Doel is alleen om te laten zien hoe de verandering
bij de overgang van 2012 naar 2013 zich verhoudt tot het patroon van de afgelopen
jaarveranderingen en om de onzekerheid over de komende jaarlijkse gegevens weer
te geven.
CBS | Het automatisch coderen van doodsoorzaken 16
5.0.1 Aantal overledenen aan kwaadaardige en goedaardige nieuwvormingen (C00–D48)
x 1 000
60
50
40
30
20
10
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 17
5.0.2 Aantal overledenen aan kwaadaardige nieuwvormingen van luchtpijp en long (C33–34)
x 1 000
15
10
5
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 18
5.0.3 Aantal overledenen aan kwaadaardige nieuwvormingen van de borst (C50)
x 1 000
5
4
3
2
1
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 19
5.0.4 Aantal overledenen aan psychische stoornissen en ziekten van zenuwstelsel of zintuigen
(F00–H95)
x 1 000
30
25
20
15
10
5
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 20
5.0.5 Aantal overledenen aan ziekten van het hart- en vaatstelsel (I00–I99)
x 1 000
60
50
40
30
20
10
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 21
5.0.6 Aantal overledenen aan het acuut hartinfarct (I21–I22)
x 1 000
20
15
10
5
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 22
5.0.7 Aantal overledenen aan ziekten van het hersenvaatstelsel (I60–I69)
x 1 000
15
10
5
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 23
5.0.8 Aantal overledenen aan ziekten van de ademhalingsorganen (J00–J99)
x 1 000
30
25
20
15
10
5
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
Geobserveerd
Gemodelleerd
Voorspellingsinterval
Betrouwbaarheidsinterval
Geobserveerd
Teruggerekend
CBS | Het automatisch coderen van doodsoorzaken 24
6. Conclusies
Met ingang van het statistiek jaar 2013 codeert het CBS doodsoorzakenformulieren met
behulp van het softwarepakket IRIS. Van de sterfgevallen met een natuurlijke doodsoorzaak
werden er in het jaar 2013 (uiteindelijk) ongeveer 93 procent automatisch gecodeerd, dat wil
zeggen, de onderliggende doodsoorzaak is door IRIS vastgesteld, eventueel na handmatige
correctie van een tekst of code door een codeur. Dit is een verschil met voorgaande jaren
waarin alle doodsoorzakenformulieren handmatig werden verwerkt.
De introductie van het automatisch coderen brengt (eenmalige) verschuivingen in de
statistiek met zich mee. Bij de volgende ziekten/ziektegroepen is een significant effect van
de introductie van het automatisch coderen waarneembaar:
−− sterfte aan psychische stoornissen en ziekten van het zenuwstelsel of zintuigen
(voornamelijk door een toename aan dementie en de ziekte van Alzheimer als
onderliggende doodsoorzaak);
−− sterfte aan ziekten van het hersenvaatstelsel (voornamelijk door een toename aan late
gevolgen van het Cerebrovasculair Accident (CVA) als onderliggende doodsoorzaak);
−− sterfte aan ziekten van de ademhalingsorganen (voornamelijk door een afname van
longontsteking als onderliggende doodsoorzaak).
Deze verschuivingen worden veroorzaakt door een andere interpretatie van de ICD-10
regels voor het coderen en/of selecteren van de onderliggende doodsoorzaak enerzijds en
een andere interpretatie (lezing) van het doodsoorzakenformulier anderzijds. Mede op basis
van advies van een externe klankbordgroep bestaande uit epidemiologen, onderzoekers,
beleidsmedewerkers bij overheid of beroepsorganisaties, en de Inspectie Gezondheidszorg,
heeft het CBS besloten om: 1. de uitkomsten van IRIS bij het codeer- en selectieproces
vanuit het oogpunt van standaardisatie en (internationale) vergelijkbaarheid te accepteren;
2. de (eenmalige) verschuivingen in statistiek te beschrijven en deze aan de gebruikers van
de doodsoorzakenstatistiek uit te leggen (deze rapportage); 3. gebleken onjuistheid van
coderingen door IRIS in internationaal verband aan te kaarten en te beïnvloeden (dat wil
zeggen via de IRIS User Group en/of de WHO Mortality Reference Group). Dit laatste maakt
dat de gepubliceerde cijfers nog kunnen veranderen ten gevolge van de uitkomst van een
internationaal besluitvormingsproces en derhalve een voorlopig karakter hebben.
Literatuur
Birch D. Automatic coding of causes of death. Population Trends 1993;15: 53–56.
European Community-Eurostat. Coding of causes of death in European Community. Eurostat –
project 96/S final report, 1998.
Israel RA, Templeton MC, Evans MC. New approaches to coding and analysing mortality data.
American Statistical Association 1972: 20–24.
CBS | Het automatisch coderen van doodsoorzaken 25
Israel RA. Automation of mortality data coding and processing in the USA. World Health
Statistics Quarterly 1990; 43: 259–262.
Johansson, LA. MIKADO: PC software for coding of multiple causes of death. Conference of
European Statisticians. Statistical Data Editing vol.2, methods of techniques 1996,
p216–221.
Lu Th. Using ACME software to monitor and improve the quality of death statistics.
J Epidemiology Community Health 2003; 57: 470–73.
Lu Th, Tsau SM, Wu TC. The automated classification of medical entities (ACME) system
objectively assessed the approriateness of underlying cause-of-death certification and
assignment. J Clin Epidemiol 2005; 58: 1277–81.
McKenzie K, Walker S, Tong S. Assessment of the impact of the change from manual to
automated coding on mortality statistics in Autralia. HIMJ 2001.
Pavillon G, Johansson LA. Production of Methods and Tools for Improving Causes of Death
statistics at Codification Level. Luxembourg (Eurostat Secretariat – Unit E3): European
Commission, 2001.
Pisanelli DM, Rossi-Mori A. Converting the representation of medical data: criteria to code
the underlying cause of death. Methods of Information in Medicine 1990; 29: 220–235.
Valleron A-J, Pavillon G, Carrat F. A systematic analysis of all ICD-10 coded death certificates
in France, 2000, with mention of influenza as cause of death. International Congress Series
2004; 1263: 299–303.
WHO. World Health Organisation. International Statistical Classification of Diseases and
Related Health Problems. Tenth Revision. Geneva: WHO, 1992 (vol. 1,2 3).
Bijlage 1 De voor- en nadelen
van het automatisch coderen van
doodsoorzaken
A. Voordelen
−− Toegenomen betrouwbaarheid/consistentie bij het coderen en selecteren van de
onderliggende doodsoorzaak
−− Verbetering van de internationale vergelijkbaarheid van doodsoorzakenstatistieken
−− Selectie van een onderliggende doodsoorzaak is expliciet en gedocumenteerd (per
record/sterfgeval)
−− Gemakkelijke implementatie van ICD-10 updates of revisies
CBS | Het automatisch coderen van doodsoorzaken 26
−− Mogelijkheid tot ‘bridgecoding studies’ om verschuivingen in statistiek te bestuderen en
documenteren bij veranderingen in ICD-10 of woordenboek (gemakkelijker en snel uit te
voeren)
−− Verminderde werkbelasting van menselijke codeurs (twee derde bestand
volautomatisch)
−− Verschuiving in werkzaamheden codeurs: van louter codering naar kwaliteitscontrole
−− Toegenomen snelheid van verwerking
−− Verbetering van data opslag (complete tekst van certificaten plus corresponderende
codes)
−− ‘Multiple cause coding’ (Iedere term op het formulier wordt gecodeerd)
−− Mogelijkheid tot gedetailleerde analyse van certificaten (op tekst of codes)/toename van
kennis over causale mechanismen bij overlijden
−− Aanpassing aan internationale opvattingen over de selectie van een onderliggende
doodsoorzaak (ook als men het er ergens niet mee eens is)
B. Nadelen
−− Traag mechanisme van aanpassing bij fouten of onvolkomenheden in de IRIS
beslistabellen (via het internationale circuit: IRIS User Group en/of WHO Mortality
Reference Group)
−− Verschuiving in statistiek bij introductie automatisch coderen (soms moeilijk
verklaarbaar)
−− Overcodering/ondercodering van doodsoorzaken door gebruik IRIS beslistabellen
−− Grotere afhankelijkheid van correct ingevuld en aangeleverd doodsoorzakenformulier
−− Grotere afhankelijkheid van plaats medische term op doodsoorzakenformulier bij
selectie onderliggende doodsoorzaak
−− Technische afhankelijkheid van bouwers (dat wil zeggen IRIS Core Group/DIMDI)
Bijlage 2 Het doodsoorzaken­
formulier (ook wel B formulier
genoemd)
De doodsoorzakenstatistiek is een tabulatie van onderliggende doodsoorzaken t.b.v.
gezondheidszorgbeleid (bijvoorbeeld preventie). De ICD-10 bevat regels die aanwijzingen
geven over het bepalen van de onderliggende doodsoorzaak. In geval van een natuurlijk
dood is deze gedefinieerd als: de ziekte of aandoening die een reeks van (morbide)
gebeurtenissen in gang heeft gezet die rechtstreeks leidt tot de dood. Bij een correct
ingevuld doodsoorzakenformulier zou de onderste (ingevulde) regel van deel 1 nu de
onderliggende doodsoorzaak bevatten. De ICD-10 regels geven aanwijzingen hoe deze
grondregel te interpreteren ten behoeve van de statistiek (bijvoorbeeld: zo gaat iemand
uiteindelijk altijd dood aan hart- of ademstilstand, maar zijn deze verschijnselen voor de
doodsoorzakenstatistiek vanuit oogpunt van differentiatie niet zo relevant), bij klinische
twijfel (bijvoorbeeld bij de aanwezigheid van meerdere ziekten of aandoeningen als
CBS | Het automatisch coderen van doodsoorzaken 27
mogelijke oorzaak), vanuit oogpunt van standaardisatie (bijvoorbeeld de klinische opvatting
over de doodsoorzaak kan verschillen van de WHO definitie voor de statistiek) of bij een
niet correct ingevuld formulier (bijvoorbeeld ziekten naast in plaats van onder elkaar, in een
hokje, onder 2 in plaats van 1, etc.). Deze regels zijn ingebouwd in de programmatuur van
IRIS. De afhankelijkheid van de plaats van een term op het formulier is daarbij groter dan bij
het handmatig coderen dat wil zeggen de codeur ‘ziet’ een foutieve invulling en corrigeert
deze.
Deel 2 van de ICD-10 bevat de regels voor het selecteren van de onderliggende
doodsoorzaak:
‘The General Principle for selection of the underlying cause of death states that when more
than one condition is entered on the death certificate, the condition entered on the lowest used
line of Part I should be selected, but only if it could have given rise to all the conditions entered
above it. If this is not the case then the following selection rules are applied:
CBS | Het automatisch coderen van doodsoorzaken
28
−− Rule 1. If there is a reported sequence terminating in the condition entered first on the death
certificate, select the originating cause of this sequence.
−− Rule 2. If there is no reported sequence terminating in the condition first entered on the
death certificate, select the first-mentioned condition
−− Rule 3. If the condition selected by the General Principle, Rule1 or Rule 2 is obviously a
direct consequence of another reported condition (whether in Part I or Part II of the death
certificate), select this primary condition.’ (WHO, 1992, vol 2: p36-39)
Wanneer in eenzelfde invulvakje van het doodsoorzakenformulier twee aandoeningen naast
elkaar staan, krijgt de eerst genoemde aandoening op grond van de ICD-10 selectieregel 2
de voorkeur. Echter, wanneer de invuller twee termen in hetzelfde invulvakje onder elkaar
schrijft en daarmee een causaal verband suggereert, worden deze door een technische
beperking (niet mogelijk om harde return te gebruiken bij invoer/termen onder elkaar te
zetten in één vakje) naast elkaar ingevoerd en aan IRIS aangeboden alsof deze naast elkaar
stonden. We hebben dan te maken met een artefact bij de invoer dat kan leiden tot een
toepassing van selectieregel 2. Deze technische beperking zal worden weggenomen als er
kan worden overgegaan op het elektronisch doodsoorzakenformulier, hetgeen nog enkele
jaren zal duren.
Bijlage 3 Bridgecoding studie op
statistiekjaar 2009
Een ‘bridgecoding study’ is een onderzoek waarbij handmatig en automatisch coderen
wordt vergeleken door eenzelfde bestand (jaarbestand 2009) dubbel te coderen (zelfde
record handmatig en automatisch). De belangrijkste bevindingen zijn:
−− IRIS kan 64,9 procent van de doodsoorzakenformulieren volautomatisch coderen en van
een onderliggende doodsoorzaak voorzien. Van de overige doodsoorzakenformulieren
is 27,5 procent afgewezen (bijvoorbeeld op basis van spelfouten), omdat deze niet door
IRIS van een onderliggende doodsoorzaak konden worden voorzien, en kon 7,6 procent
niet worden aangeboden aan IRIS (waaronder niet natuurlijke doodsoorzaken, maternale
sterfte en doodgeborenen).
−− In 78,4 procent van de volautomatisch gecodeerde formulieren is er overeenstemming
tussen IRIS en de codeurs wat betreft onderliggende doodsoorzaak (vier digits). Deze
overeenstemming hangt samen met het detailniveau van de ICD code. Op het drie digit
niveau van CBS Statline publicaties (waaronder de Beldo lijst) is de overeenstemming
84,7 procent en op ICD-10 hoofdstukniveau (één digit) 89,8 procent.
−− De overeenstemming tussen automatisch en handmatig coderen neemt af met een
toenemende leeftijd van de overledene en met een toenemend aantal codes op het
doodsoorzakenformulier. Er is geen significant verschil in overeenstemming tussen
automatisch en handmatig coderen naar geslacht van de overledene.
−− De introductie van het automatisch coderen van doodsoorzaken brengt (eenmalige)
verschuivingen in de statistiek met zich mee. Er is een significante toename van
infectieziekten (waaronder niet gespecificeerde diarree), van de endocriene
aandoeningen (met name door uitdroging), van de psychische aandoeningen (met
CBS | Het automatisch coderen van doodsoorzaken 29
name dementie), van de ziekten van zenuwstelsel en zintuigen (met name door de
ziekte van Alzheimer) als onderliggende doodsoorzaak. Er is een significante afname
van ziekten van de luchtwegen (met name longontstekingen), van ziekten van het
spijsverteringsstelsel (met name niet-infectieuze diarree), van aandoeningen van nieren
of urinewegen (met name urineweginfecties) en van symptomen en slecht omschreven
ziektebeelden (met name ouderdom) als onderliggende doodsoorzaak.
−− De belangrijkste discrepanties tussen handmatig en automatisch coderen treden op
bij het coderen van: longontsteking (J18.9), COPD (J44.9), atriumfibrilleren (I48.0),
Diabetes mellitus (E14.6), hartfalen (I50.9), metastasen (C80.0), hartinfarct (I21.9),
urineweginfectie (N39.0), ziekte van Alzheimer (G30.1) en het CVA (I64).
−− Verklaring voor de waargenomen verschuivingen wordt gevonden in: verschil in
selectieprincipe van de onderliggende doodsoorzaak (J18.9, N39.0), verschil in codering
van het vierde cijfer (I50.9, E14.6), technische beperking van IRIS (vooral bij combinatie
codes als K70.4: alcoholische hepatitis), gebruik van additionele informatie (vrije tekst:
wel bij handmatig coderen, niet bij IRIS) (I46.1), ICD-10 updates (C80.0, J44.9).
De ICD-10 updates (wel gehanteerd door IRIS, niet gehanteerd door het CBS) en een andere
interpretatie van de ICD-10 regels voor selectie van de onderliggende doodsoorzaak zijn
de belangrijkste verklaringsbronnen voor het verschil tussen handmatig en automatisch
coderen. Dit verschil wordt onder meer uitgedrukt door een zogenaamde ‘comparability
ratio’ (CR), gedefinieerd als het voorkomen van een doodsoorzaak bij automatisch coderen
gedeeld door het voorkomen van die doodsoorzaak bij handmatig coderen in hetzelfde
bestand. De CR bedraagt voor:
−− de sterfte aan kwaadaardige of goedaardige nieuwvormingen: 1,00
−− de sterfte aan kwaadaardige nieuwvormingen van luchtpijp of long: 0,98
−− de sterfte aan borstkanker: 0,99
−− de sterfte aan psychische stoornissen en ziekten van het zenuwstelsel: 1,27
−− de sterfte aan ziekten van het hart- en vaatstelsel: 1,02
−− de sterfte aan het acuut hartinfarct: 0,98
−− de sterfte aan ziekten van het hersenvaatstelsel: 1,11
−− de sterfte aan ziekten van de ademhalingsorganen: 0,78.
Met behulp van deze CR’s is het voorkomen van een doodsoorzaak in 2013 (automatisch
gecodeerd) teruggerekend naar het voorkomen van een doodsoorzaak in 2013 als ware deze
handmatig gecodeerd. Een ongewijzigde verandering van voorkomen (CR = 1) betekent niet
dat er geen verschuiving in codering van records is opgetreden. Een instroom van anders
gecodeerde records kan immers worden gemaskeerd door een even grote uitstroom van
anders gecodeerde records. Een CR geeft deze verschuivingen niet weer. Een CR geeft
echter wel het gevolg voor de verwachte verandering in doodsoorzakenstatistiek weer, die
de introductie van het automatisch coderen met zich meebrengt.
CBS | Het automatisch coderen van doodsoorzaken 30
Verklaring van tekens
.
*
**
Gegevens ontbreken
Voorlopig cijfer
Nader voorlopig cijfer
x
Geheim
–
Nihil
–
(Indien voorkomend tussen twee getallen) tot en met
0 (0,0)
Niets (blank)
Het getal is kleiner dan de helft van de gekozen eenheid
Een cijfer kan op logische gronden niet voorkomen
2013–2014
2013 tot en met 2014
2013/2014
Het gemiddelde over de jaren 2013 tot en met 2014
2013/’14
2011/’12–2013/’14
Oogstjaar, boekjaar, schooljaar enz., beginnend in 2013 en eindigend in 2014
Oogstjaar, boekjaar, enz., 2011/’12 tot en met 2013/’14
In geval van afronding kan het voorkomen dat het weergegeven
totaal niet overeenstemt met de som van de getallen.
Colofon
Uitgever
Centraal Bureau voor de Statistiek
Henri Faasdreef 312, 2492 JP Den Haag
www.cbs.nl
Inlichtingen
Tel. 088 570 70 70, fax 070 337 59 94
Via contactformulier: www.cbs.nl/infoservice
© Centraal Bureau voor de Statistiek, Den Haag/Heerlen, 2014.
Verveelvoudigen is toegestaan, mits het CBS als bron wordt vermeld.
CBS | Het automatisch coderen van doodsoorzaken 31
Download