Pilotonderzoek codering doodsoorzaken Caribisch Nederland

Over deze publicatie

De directie Zorg en Jeugd Caribisch Nederland (ZJCN) van het Ministerie van Volksgezondheid, Welzijn en Sport (VWS) wil inventariseren of de doodsoorzakengegevens op Bonaire, Sint Eustatius en Saba (Caribisch Nederland) op structurele wijze kunnen worden ontsloten, om beleid op het gebied van de publieke gezondheid te ondersteunen. Deze pilotstudie is onderdeel daarvan en bevat een eerste verkenning van de beschikbare doodsoorzakendata uit Caribisch Nederland om te inventariseren wat er nodig is voor het genereren van doodsoorzakenstatistieken voor deze populatie en wat mogelijke knelpunten zouden kunnen zijn. Uit de verkennende analyse blijkt dat de data enkele onvolkomenheden kent waarvoor aanbevelingen worden gedaan voor verdere optimalisatie.

1. Inleiding

De directie Zorg en Jeugd Caribisch Nederland (ZJCN) van het Ministerie van Volksgezondheid, Welzijn en Sport (VWS) wil inventariseren of de doodsoorzakengegevens op Bonaire, Sint Eustatius en Saba (Caribisch Nederland) op structurele wijze kunnen worden ontsloten, om beleid op het gebied van de publieke gezondheid te ondersteunen. Bonaire, Sint Eustatius en Saba zijn bijzondere gemeenten van Nederland en de verwerking van de doodsoorzaakgegevens van deze gemeenten valt niet onder de Wet op de Lijkbezorging, maar onder de Wet verklaringen van overlijden BES en de Begrafeniswet BES1).

Het CBS is de enige organisatie in Nederland die over doodsoorzaakgegevens beschikt en wettelijke toestemming heeft om deze te verwerken. Daarom heeft VWS het CBS gevraagd om te onderzoeken of het mogelijk is statistische gegevens te publiceren over de doodsoorzakengegevens van deze bijzondere gemeenten, conform de methodiek die het CBS ook voor de doodsoorzakenstatistiek over Europees Nederland gebruikt.

1) De doodsoorzaakverklaring die hiervoor gebruikt wordt, is het C-formulier in model F (publicatie 1959) wat verschilt van het B-formulier (versie 2022) dat Europees Nederland hanteert.

2. Data en methode

2.1 Data en setting

Ruwe data voor deze pilotstudie zijn verkregen via informatie afkomstig van doodsoorzaakverklaringen uit Caribisch Nederland. De geneeskundige geeft een verklaring van overlijden af en doet daarnaast een afzonderlijke opgave van de doodsoorzaak. Beiden verklaringen worden overgedragen aan de ambtenaar van de burgerlijke stand. De verklaring met daarin de opgave van de doodsoorzaak wordt door de ambtenaar van de burgerlijke stand ongeopend verzonden naar het CBS (Bonaire). Voor deze pilotstudie zijn gegevens uit 758 doodsoorzaakverklaringen over de periode 2014-2023 ontvangen. De informatie die op de ontvangen doodsoorzaakverklaringen was ingevuld is voor de uitvoering van deze studie handmatig overgetypt. Op basis van de overgetypte formulieren zijn data verkregen over overlijdensdatum, geslacht, leeftijd (afgeleid van geboorte- en overlijdensdatum), geboorteland, nationaliteit, woonplaats en de doodsoorzaken. Daarnaast zijn openbaar beschikbare data geraadpleegd over het aantal overlijdens in Caribisch Nederland (StatLine - Caribisch Nederland;overledenen, geslacht, leeftijd en burgerlijke staat (cbs.nl)). 

2.2 Bepaling van de doodsoorzaak

De doodsoorzaak is gecodeerd aan de hand van internationaal opgestelde richtlijnen van de Wereldgezondheidsorganisatie (WHO)2). Met ‘de doodsoorzaak’ wordt de onderliggende doodsoorzaak bedoeld. Het coderen volgens de richtlijnen van de WHO houdt in dat één ziekte of gebeurtenis als onderliggende doodsoorzaak kan worden aangemerkt. De onderliggende doodsoorzaak wordt gedefinieerd als (a) de ziekte of aandoening waarmee de reeks van gebeurtenissen die uiteindelijk het overlijden van de persoon veroorzaakte een aanvang nam of (b) de omstandigheden van het ongeval of geweld dat het letsel waardoor de persoon overleed veroorzaakte. Aan de hand van alle doodsoorzaken en bijkomende aandoeningen die hebben bijgedragen tot de dood, zoals vermeld op de doodsoorzaakverklaringen, is er dus per formulier één onderliggende doodsoorzaak bepaald. Deze doodsoorzaak is geclassificeerd volgens de International Statistical Classification of Diseases and Related Health Problems (ICD) van de World Health Organization (WHO).

In deze pilotstudie is eerst onderzocht in hoeverre de doodsoorzaak gecodeerd kon worden middels het automatische codeerprogramma Iris (BfArM). Deze Iris codeersoftware wordt in meerdere landen gebruikt voor het coderen van doodsoorzaken. Voor Europees Nederland werd in 2014-2023 ruim de helft van de formulieren automatisch gecodeerd. Om de mogelijkheid van automatische codering van doodsoorzaakverklaringen uit Caribisch Nederland te exploreren, zijn de compleet ingevulde formulieren met het automatische codeersysteem verwerkt. Hierna is geteld hoeveel formulieren er daadwerkelijk automatisch verwerkt konden worden. Vervolgens zijn formulieren die niet automatisch gecodeerd konden worden handmatig gecodeerd door medisch codeurs, onder supervisie van de medisch ambtenaar van het CBS. Dit is conform de werkwijze die nu gebruikt wordt voor het produceren van de doodsoorzakenstatistiek voor Europees Nederland. 

2.3 Verkennende analyses  

Er zijn een aantal verkennende en beschrijvende analyses uitgevoerd. Ten eerste zijn het aantal ontvangen doodsoorzaakverklaringen uit Caribisch Nederland en het aantal overlijdens getabelleerd, waarna het aandeel ontbrekende doodsoorzaakformulieren is geschat. Deze analyse is uitgesplitst naar jaartal. Vervolgens zijn de karakteristieken van de studiepopulatie getabelleerd waarbij een inventarisatie is gedaan van de compleetheid van de data. Aantallen kleiner dan vijf zijn aangegeven met ‘<5’. 

Ten tweede zijn de doodsoorzaken in kaart gebracht. Voor elk formulier is er een onderliggende doodsoorzaakcode toegekend op basis van de door de WHO opgestelde ICD-10 codeerregels. Hiertoe zijn compleet ingevulde formulieren deels automatisch en deels handmatig gecodeerd. Er is onderzocht hoeveel formulieren er automatisch gecodeerd konden worden. De uitkomsten zijn getabelleerd. De formulieren die niet automatisch gecodeerd konden worden, zijn geanalyseerd om mogelijke oorzaken van de belemmering bij het automatisch coderen te achterhalen. Deze resultaten zijn vervolgens beschreven en de betreffende formulieren zijn handmatig gecodeerd. Een deel van de formulieren wordt ook in het huidige productieproces voor Europees Nederland altijd handmatig gecodeerd; het gaat hierbij om niet-natuurlijke doodsoorzaken, doodgeborenen, neonatale en perinatale sterfte. Er is zowel een automatisch gecodeerd percentage berekend van formulieren inclusief en exclusief niet-natuurlijke doodsoorzaken, doodgeborenen, neonatale en perinatale sterfte .  

Op basis van de ICD-10 codes zijn doodsoorzaken gegroepeerd en zijn de volgende hoofdgroepen gevormd, gebaseerd op een clustering van de ICD-10 hoofdstukken: nieuwvormingen (ICD-10 codes: C00-C97 en D00-D48), hart- en vaatziekten (ICD-10 codes: I00-I99), psychische stoornissen en ziekten van het zenuwstelsel en zintuigen (ICD-10 codes: F00-F99), ziekten van de ademhalingsorganen (ICD-10 codes: J00-J99), COVID-19 (ICD-10 codes: U071-U072), niet-natuurlijke doodsoorzaken (ICD-10 codes V01-Y89) en overige doodsoorzaken. Deze clustering is aangehouden om toereikende aantallen te waarborgen. Vervolgens is het aandeel overlijdens aan de hoofdgroepen doodsoorzaken berekend.

2.4 Koppeling aan de sterftebestanden

Om de volledigheid en kwaliteit van de data te controleren is er een koppeling uitgevoerd tussen de doodsoorzakenformulieren en de sterfteberichten. De koppeling is uitgevoerd op overlijdensdatum, geboortedatum en geslacht. Omdat de populatie vrij klein is, kon er gekoppeld worden aan de hand van overlijdens- en geboortedatum zonder duplicaten te krijgen. Vervolgens is gekeken naar demografische karakteristieken van de overledenen waarbij de populatie waarvan wel een doodsoorzaakverklaring is ontvangen is vergeleken met de populatie waarvan geen doodsoorzaakverklaring is ontvangen. Specifiek is gekeken naar het geslacht, de leeftijd en in het geval van de wel-gekoppelde formulieren; het geboorteland. Bij de niet-gekoppelde formulieren moest de leeftijd worden uitgerekend o.b.v. de geboortedatum en sterftedatum, de wel-gekoppelde formulieren bevatten de leeftijd uit het sterftebericht. 

2.5 Bridge Coding studie

Om de kwaliteit van de automatische codering te verkennen, is een deel van de automatisch gecodeerde formulieren tevens handmatig gecodeerd waarna vervolgens een bridge coding studie is uitgevoerd. Een bridge coding studie onderzoekt het effect van het gebruik van twee verschillende methoden op dezelfde dataset. Data van doodsoorzaakverklaringen van alle willekeurig geselecteerde jaartallen zijn handmatig en automatisch gecodeerd en de uitkomsten zijn onderling vergeleken. Vervolgens is voor de dataset een ‘Perfect Comparability Ratio’ (PCP) berekend. De PCP is een maat voor de validiteit van het automatisch coderen. Het wordt gedefinieerd als het percentage doodsoorzaakverklaringen met een identieke ICD-10 code (x) wanneer manueel coderen wordt vergeleken met automatisch coderen. De formule om het te berekenen is:

Indien de PCP sterk afwijkt van 100 procent betekent dit dat het automatisch coderen sterk verschilt van manueel coderen, en zal dit dus verder onderzocht moeten worden. 

2) International Classification of Diseases, 10th revision (ICD-10). World Health Organization (WHO). 

3. Resultaten

3.1 Studiepopulatie

Tabel 3.1.1 bevat informatie over het aantal doodsoorzaakverklaringen die beschikbaar waren in vergelijking met gegevens over het aantal overlijdens, uitgesplitst naar jaartal. Het jaartal 2023 (n=34 formulieren) is in deze tabel niet meegenomen, omdat een aanzienlijk deel van de doodsoorzaakverklaringen uit dit jaartal vermoedelijk nog niet ontvangen en verwerkt was en het aantal overlijdens nog niet definitief bekend was voor dit jaar, waardoor geen inzicht verkregen kon worden in de volledigheid van de registratie. Daarnaast zijn 35 formulieren waarvan het jaartal ontbrak niet meegenomen (zie flowchart, figuur 3.1.2). Het percentage ontvangen doodsoorzaakverklaringen van de overledenen varieerde per jaartal. Voor het jaar 2015 was het percentage het laagst; in dat jaar was slechts van één overledene (0,8 procent van alle overledenen) de doodsoorzaakverklaring ontvangen. In 2022 was het percentage ontvangen doodsoorzaakverklaringen het hoogst met 86,2 procent. Voor de overige jaren was van ongeveer 30 tot 70 procent van de overledenen de doodsoorzaakverklaring ontvangen (Tabel 3.1.1). Ter vergelijking, in Europees Nederland worden de cijfers gepubliceerd wanneer minimaal 95 procent van de doodsoorzaakverklaringen ontvangen zijn, om mogelijke vertekening door selectie te beperken. 

3.1.1 Aantal ontvangen doodsoorzaakverklaringen en overlijdens in Caribisch Nederland
JaarAantal doodsoorzaakverklaringenAantal overledenen1)Percentage ontvangen
20144313631,6
201511220,8
2016539953,5
20177313454,5
20186210260,8
20198812570,4
20208714360,8
202111316269,8
202216919686,2

In totaal zijn er 758 formulieren ontvangen. Van 35 formulieren ontbrak de informatie over welk het jaartal het betrof en formulieren uit 2023 (n=34) zijn niet meegenomen in deze analyse, omdat deze data niet vergeleken konden worden met het aantal overlijdens uit 2023 (data nog niet definitief bekend).
1) Bron: StatLine 

Flowchart geïncludeerde gegevens  

Tabel 3.1.3 bevat karakteristieken van de studiepopulatie. In totaal waren er 689 formulieren uit 2014-2022. Bij het analyseren van de karakteristieken van de studiepopulatie, viel op dat er meer doodsoorzaakverklaringen waren van mannen (406) dan van vrouwen (274). Van 9 doodsoorzaak-verklaringen was het geslacht onbekend. De mediane leeftijd (interkwartielafstand) was 76,0 (66,0-84,0). Voor vrouwen was dit 79,0 (68,0-88,0) en voor mannen 74,0 (63,0-82,0). De meeste mensen zaten in de leeftijdscategorie 70 tot 90 jaar en er waren relatief meer vrouwen dan mannen in de leeftijdscategorie van 90 jaar of ouder. Bij ruim 10 procent van de overledenen kon de leeftijd niet worden berekend door missende gegevens. Bijna 88 procent had Bonaire als woonplaats, terwijl ruim de helft was ook geboren in Bonaire.

3.1.3 Karakteristieken van de populatie van de pilotstudie 2014-2022
Totale studiepopulatie (N=689)Vrouw (N=274)Man (N=406)
Leeftijd (jaren)1), mediaan [IQR]76,0 [66,0-84,0]79,0 [68,0-88,0]74,0 [63,0-82,0]
Leeftijdscategorieën1)0 tot 10 jaar8..
Leeftijdscategorieën1)10 tot 20 jaar<5<5<5
Leeftijdscategorieën1)20 tot 30 jaar10..
Leeftijdscategorieën1)30 tot 40 jaar9..
Leeftijdscategorieën1)40 tot 50 jaar25817
Leeftijdscategorieën1)50 tot 60 jaar482127
Leeftijdscategorieën1)60 tot 70 jaar1203882
Leeftijdscategorieën1)70 tot 80 jaar16863104
Leeftijdscategorieën1)80 tot 90 jaar1687493
Leeftijdscategorieën1)90+ 815031
NationaliteitNederlands567231335
NationaliteitAmerikaans29920
NationaliteitOverig2)331118
NationaliteitOnbekend602333
Geboorteplaatsland Bonaire355165189
Geboorteplaatsland Verenigde Staten van Amerika29920
Geboorteplaatsland Curacao 762353
Geboorteplaatsland Nederland742549
Geboorteplaatsland Overig2)742548
Geboorteplaatsland Onbekend812747
WoonplaatsBonaire 605251352
WoonplaatsEuropees Nederland11..
WoonplaatsCuracao 6..
WoonplaatsVerenigde Staten van Amerika19613
WoonplaatsOverig2)6..
WoonplaatsOnbekend421520
Databron: ontvangen doodsoorzaakverklaringen uit Caribisch Nederland. 
Ontbrekende waarden zijn niet geimputeerd. Daardoor tellen niet alle waarden op tot het totaal aantal formulieren.
Getallen kleiner dan 5 zijn aangeduid met '<5'. Waarden zijn weggepunt als een optelsom kan leiden tot onthulling van kleine getallen. 
1) 50 formulieren zijn niet meegenomen in de berekening van leeftijd, omdat de geboortedatum danwel de overlijdensdatum onbekend (of onplausibel) waren.
2) Onder overig valt een grote verscheidenheid aan nationaliteiten en woonplaats/geboorteplaatslanden.

3.2 Koppeling sterfteberichten

In totaal waren er 1219 sterfteberichten waarbij het overlijdensjaar tussen 2014 en 2023 lag. Er waren 637 doodsoorzakenformulieren waarbij dit het geval was en waarbij tevens de geboorte-en sterftedatum bekend was. De koppeling leverde een set van 515 doodsoorzakenformulieren die ook gekoppeld waren aan een sterftebericht, de betekent dat 122 formulieren niet gekoppeld konden worden aan een sterftebericht. In de gekoppelde berichten is de data van het sterftebericht aangehouden, in de niet-gekoppelde formulieren was de data afkomstig van het doodsoorzakenformulier. In beide gevallen was de meerderheid van de overledenen man, 78 bij de niet-gekoppelde formulieren en 297 bij de wel-gekoppelde formulieren. De gekoppelde formulieren bevatte geen missende data wat betreft leeftijd en geboorteland. Bij de niet-gekoppelde formulieren ontbrak bij 3 gevallen het geslacht en bij 11 formulieren de leeftijd. Bij het berekenen van de leeftijd bij de niet-gekoppelde formulieren kwam er 1 leeftijd uit die groter was dan 150, deze leeftijd is wel meegenomen in de tabellen. Bij de gekoppelde populatie lag de mediaan op 76 jaar, terwijl die bij de niet-gekoppelde formulieren op 72 jaar lag. Dit werd ook teruggezien in het aantal overledenen per groep, het grootste aantal overledenen bij de wel-gekoppelde formulieren lag in de groep van personen tussen de 80 en 90 jaar, bij de niet-gekoppelde formulieren was dit in de groep tussen de 70 en 80 jaar. 

Bij de gekoppelde formulieren is ook gekeken naar het geboorteland, het overgrote deel van de personen is geboren in de voormalig Nederlandse Antillen of Bonaire, gevolgd door Nederland en Curaçao. Deze verhouding is gelijk bij mannen en vrouwen. Zie Tabel 3.2.1 en 3.2.2 voor de karakteristieken uitgesplitst naar wel- en niet gekoppelde formulieren.

3.2.1 Karakteristieken van de gekoppelde populatie van de pilotstudie 2014-2022
Totale studiepopulatie (N=515)Vrouw (N=217)Man (N=297)
Leeftijd (jaren), mediaan [IQR]76,0 [67,0-85,0]79,0 [68,3-88,0]75,0 [65,0-83,0]
Leeftijdscategorieën0 tot 10 jaar.<5<5
Leeftijdscategorieën10 tot 20 jaar<5<5<5
Leeftijdscategorieën20 tot 30 jaar6<5.
Leeftijdscategorieën30 tot 40 jaar9<5.
Leeftijdscategorieën40 tot 50 jaar19712
Leeftijdscategorieën50 tot 60 jaar361917
Leeftijdscategorieën60 tot 70 jaar913160
Leeftijdscategorieën70 tot 80 jaar1365284
Leeftijdscategorieën80 tot 90 jaar1456184
Leeftijdscategorieën90+ 674423
GeboortelandBonaire652540
GeboortelandVerenigde Staten van Amerika10<5.
GeboortelandCuracao 23518
GeboortelandNederland562135
GeboortelandNederlandse Antillen315140175
GeboortelandOverig1)462323
GeboortelandOnbekend000
Databron: ontvangen sterfteberichten uit Caribisch Nederland 
Ontbrekende waarden zijn niet geimputeerd. Daardoor tellen niet alle waarden op tot het totaal aantal formulieren.
Getallen kleiner dan 5 zijn aangeduid met '<5'. Waarden zijn weggepunt als een optelsom kan leiden tot onthulling van kleine getallen. 
1) Onder overig valt een grote verscheidenheid aan nationaliteiten en woonplaats/geboorteplaatslanden.
IQR: interkwartielafstand

3.2.2 Karakteristieken van de niet-gekoppelde populatie van de pilotstudie 2014-2022
Totale studiepopulatie (N=122)Vrouw (N=41)Man (N=78)
Leeftijd (jaren), mediaan [IQR]72,0 [61,0-82,0]80,0 [72,0-85,5] 68,0 [58,0-78,0]
Leeftijdscategorieën0 tot 10 jaar<5<5<5
Leeftijdscategorieën10 tot 20 jaar<5<5<5
Leeftijdscategorieën20 tot 30 jaar<5<5<5
Leeftijdscategorieën30 tot 40 jaar<5<5<5
Leeftijdscategorieën40 tot 50 jaar6<5.
Leeftijdscategorieën50 tot 60 jaar10<5.
Leeftijdscategorieën60 tot 70 jaar24519
Leeftijdscategorieën70 tot 80 jaar271016
Leeftijdscategorieën80 tot 90 jaar20127
Leeftijdscategorieën90+ 1688
Databron: ontvangen doodsoorzaakverklaringen uit Caribisch Nederland. 
Ontbrekende waarden zijn niet geimputeerd. Daardoor tellen niet alle waarden op tot het totaal aantal formulieren.
Getallen kleiner dan 5 zijn aangeduid met '<5'. Waarden zijn weggepunt als een optelsom kan leiden tot onthulling van kleine getallen. 
IQR: interkwartielafstand

3.3 Codering doodsoorzaken

Er zijn in totaal 624 formulieren door het automatisch codeersysteem Iris gehaald. Hiervan konden er 264 automatisch gecodeerd worden, terwijl 360 formulieren niet automatisch gecodeerd konden worden. Dit betekent dat van alle geteste formulieren, 42,3 procent automatisch gecodeerd kon worden (Tabel 3.3.1). De formulieren waarbij de arts heeft aangegeven dat het een niet-natuurlijke doodsoorzaak betrof, worden standaard door Iris gemarkeerd en worden niet automatisch maar handmatig gecodeerd. Wanneer deze eruit gefilterd worden dan stijgt het percentage automatisch gecodeerde formulieren naar 48.2 procent (Tabel 3.3.2). Voor het Europese gedeelte van Nederland is dit ongeveer 60 procent.

3.3.1 Aantal automatisch gecodeerde doodsoorzaakverklaringen per jaartal in Caribisch Nederland
JaarAantal formulieren getest in IrisAutomatisch GecodeerdPercentage Automatisch Gecodeerd
2014401127,5
2016511733,3
2017671420,9
2018542648,1
2019863743,0
2020783848,7
2021985253,1
20221506946,0
Totaal62426442,3
Gezien slechts 1 doodsoorzaakverklaring is ontvangen in 2015, is dit jaartal niet meegenomen in deze analyse. 

3.3.2 Aantal automatisch gecodeerde doodsoorzaakverklaringen per jaartal in Caribisch Nederland exclusief niet-natuurlijke doden
JaarAantal formulieren getest in IrisAutomatisch GecodeerdPercentage Automatisch Gecodeerd
2014391128,2
2016441738,6
2017511427,5
2018472655,3
2019773748,1
2020693855,1
2021955254,7
20221306953,1
Totaal55226447,8
Gezien slechts 1 doodsoorzaakverklaring is ontvangen in 2015, is dit jaartal niet meegenomen in deze analyse. 

Alle 360 formulieren die niet automatisch gecodeerd konden worden, zijn alsnog handmatig gecodeerd.  De codeur constateerde dat 35 formulieren een onbekende term bevatten, terwijl 36 formulieren verkeerd gespelde termen bevatten. Op basis van de informatie die op het formulier stond, was de codeur in staat aan  elk formulier een onderliggende doodsoorzaak toe te kennen.

In Tabel 3.3.3 is een overzicht te zien van het aantal automatisch en manueel gecodeerde formulieren per ICD-categorie. De meest voorkomende doodsoorzaken waren nieuwvormingen en hart- en vaatziekten, gevolgd door niet natuurlijke overlijdens. Ziekten van bloed en bloedvormende organen en bepaalde aandoeningen van het immuunsysteem en ziekten van het spijsverteringsstelsel moesten relatief het vaakst manueel gecodeerd worden.

3.3.3 Automatisch en manueel gecodeerde doodsoorzaken naar ICD-10 hoofdstuk
Aantal Aandeel van totaal (%)Automatisch gecodeerdManueel gecodeerd
Infectieziekten en parasitaire aandoeningen (A00-B99)182,938,961,1
Nieuwvormingen (C00-D48)16326,144,855,2
  Maligne Neoplasmata (C00-C97)15124,247,752,3
Ziekten van bloed en bloedvormende organen en bepaalde aandoeningen van het
immuunsysteem (D50-D89)
50,820,080,0
Endocriene ziekten en voedings- en stofwisselingsstoornissen (E00-E90)203,250,050,0
Psychische stoornissen en gedragsstoornissen (F00-F99)355,662,937,1
Ziekten van zenuwstelsel (G00-H95)182,950,050,0
Ziekten van hart en vaatstelsel (I00-I99)15124,246,453,6
Ziekten van ademhalingsstelsel (J00-J99)396,356,443,6
Ziekten van spijsverteringsstelsel (K00-K99)152,420,080,0
Ziekten van huid en subcutis (L00-L99)50,860,040,0
Ziekten van botspierstelsel en bindweefsel (M00-M99)<5...
Ziekten van urogenitaal stelsel (N00-N99)162,650,050,0
Congenitale afwijkingen, Misvormingen en Chromosoomafwijkingen (Q00-Q99)00,00,00,0
Bepaalde aandoeningen die hun oorsprong hebben in perinatale periode (P00-P96)<5...
Symptomen, afwijkende klinische bevindingen en laboratoriumuitslagen, niet elders
geclassificeerd (R00-R99)
315,061,338,7
COVID-19 (U071-U072)254,064,036,0
Niet-natuurlijke doodsoorzaken7812,50,0100,0

Van de 624 doodsoorzaakformulieren, zijn er 72 formulieren door de arts als niet-natuurlijke doodsoorzaak ingevuld. Alle niet-natuurlijke doodsoorzaakformulieren zijn handmatig gecodeerd. Van deze 72 niet-natuurlijke doodsoorzaken, is 68 uiteindelijk ook als niet-natuurlijk gecodeerd tijdens het handmatig coderen en 4 formulieren zijn alsnog als natuurlijke doodsoorzaak gecodeerd door de codeur. Tabel 3.3.4 laat het aantal niet-natuurlijke doodsoorzaken per jaartal zien. Er zijn ook formulieren gevonden die als natuurlijke dood zijn ingevuld door de arts, maar waarbij de codeur de onderliggende doodsoorzaak als niet-natuurlijk heeft gecodeerd. Dit waren in totaal 10 doodsoorzaakformulieren. Totaal zijn er 78 niet-natuurlijke doden gecodeerd. Dit betekent dat na handmatig coderen, uiteindelijk 14.3 procent van de geteste doodsoorzaakformulieren een niet-natuurlijke dood betrof. Tabel 3.3.5 laat een overzicht zien van het aantal niet-natuurlijke doden per ICD-10 categorie. De niet-natuurlijke doden omvatten met name vervoersongevallen, maar ook een groot gedeelte was te wijden aan ongelukken op het water zoals verdrinking of een blootstelling aan druk van omgevingslucht, bijvoorbeeld tijdens duiken (zie ook Tabel 3.3.5). Ongeveer 19 procent van de niet-natuurlijke doden hebben een onvolledig omschreven oorzaak.

3.3.4 Aantal natuurlijke en niet-natuurlijke doden per jaartal in Caribisch Nederland
JaarAantal natuurlijke dodenAantal niet-natuurlijke dodenPercentage niet-natuurlijke doden
201439<5.
201644715,9
2017511631,4
201845920,0
201977911,7
2020681014,7
202195<5.
20221272318,1
Gezien slechts 1 doodsoorzaakverklaring is ontvangen in 2015, is dit jaartal niet meegenomen in deze analyse. 

3.3.5 Aantal Niet-natuurlijke doodsoorzaken per ICD-10 categorie
ICD-10 CategorieAantal Percentage (%) van totaal aantal NND1)
Vervoersongevallen (V01-V99)1620,5
Vallen (W00-W19)79,0
Onopzettelijke Verdrinking en Onderdompeling (W65-W74)1012,8
Overige onopzettelijke belemmeringen van ademhaling (W75-W84)<5.
Blootstelling aan elektrische stroom en straling en aan exterme temperatuur en druk
van omgevingslucht (W85-W99)
810,3
Onopzettelijke vergiftiging door en blootstelling aan schadelijke stoffen (X40-X49)<5.
Onopzettelijke blootstelling aan overige en niet-gespecificeerde factoren (X58-X59)<5.
Opzettelijk zichzelf schade toebrengen (X60-X84)67,7
Geweldpleging (X85-Y09)79,0
Late gevolgen van uitwendige oorzaken van ziekte en sterfte (Y85-Y89)<5.
Onvolledig omschreven oorzaak van sterfte (R99)1519,2
1) Niet-natuurlijke doodsoorzaken.

Tabel 3.3.6 bevat een overzicht van hoofdgroepen doodsoorzaken. Op hoofdgroepniveau waren nieuwvormingen en hart- en vaatziekten de meest voorkomende doodsoorzaken, net als in Europees Nederland. Daarop volgden de overige doodsoorzaken en ziekten van de ademhalingsorganen. 

3.3.6 Doodsoorzaken geclusterd 2014-2022
AantalPercentage van totaal
Nieuwvormingen16326,1
Ziekten van hart- en vaatstelsel 15124,2
Psychische stoornissen en ziekten van zenuwstelsel en zintuigen538,5
Ziekten van de ademhalingsorganen396,3
COVID-19254,0
Niet-natuurlijke doodsoorzaken7812,5
Overige doodsoorzaken11518,4
Totaal624100,0

Zie Toelichting Tabel 8 voor bijbehorende ICD-10 codes.

3.4 Resultaten Bridge Coding Studie

De 264 formulieren die Iris automatisch heeft gecodeerd zijn opnieuw gecodeerd door een medische codeur. Van de 264 formulieren zijn 243 formulieren door de codeur handmatig gecodeerd met exact dezelfde ICD-10 code, tot op de 3 getallen nauwkeurig. Dit resulteerde in een PCP van 92 procent. 

4. Discussie

In deze verkennende analyse is onderzocht of het mogelijk is statistische gegevens te publiceren over de doodsoorzakengegevens van de bijzondere gemeenten in Caribisch Nederland, conform de methodiek die het CBS ook voor de doodsoorzakenstatistiek over Europees Nederland gebruikt. In deze studie laten we zien dat het mogelijk is om:

  • demografische gegevens van overlijdens in Caribisch Nederland te tonen 
  • formulieren handmatig te coderen en dat het automatische codeerprogramma Iris een rol kan spelen in een doodsoorzakenstatistiek over Caribisch Nederland.

Uit de verkennende analyse in deze pilot studie werd gevonden dat 48,2 procent van de geteste formulieren in Iris gecodeerd konden worden. Ondanks dat dit percentage lager is dan het percentage formulieren dat automatisch gecodeerd kan worden in Europees Nederland (ongeveer 60 procent), zijn er wel aanknopingspunten gevonden in deze analyse om dit percentage verder te verhogen. 

Tijdens het analyseren van de ingevulde formulieren viel op dat er relatief veel spelfouten, schrijfvarianten en soms ook onjuiste medische termen ingevuld waren. Bovendien viel op dat sommige doodsoorzaakformulieren waren ingevuld met termen die mogelijk op specifieke locaties en/of door bepaalde groepen zorgverleners vaker gebruikt worden, evenals Engelse termen, wat de automatische verwerking gecompliceerder kan maken.  

In Europees Nederland is ook sprake van een variatie bij de invulling, de afgelopen jaren zijn hiervoor regels ontwikkeld die de automatische verwerking vergemakkelijken, bijvoorbeeld door afkortingen en omdraaiingen automatisch om te zetten. Wanneer gewerkt zou worden aan een verdere optimalisatie van de registratie kan overwogen worden dit ook voor het Caribisch Nederland te verkennen.

Automatisch coderen is een essentieel onderdeel van de doodsoorzakenstatistiek: het vermindert arbeidsintensieve handelingen van medische codeurs en kan registratie van statistiek standaardiseren waardoor het bijdraagt aan goede vergelijkbaarheid in de tijd en met andere landen. In de huidige studie werd ruim 90 procent overeenstemming gevonden tussen automatisch coderen met Iris en handmatig coderen door de codeur. Dit suggereert dat ook in Caribisch Nederland Iris een bruikbaar hulpmiddel kan zijn bij het coderen van de doodsoorzaken.

Tijdens de koppelingsanalyse viel op dat er veel doodsoorzaakformulieren ontbraken. Een hoog percentage van onvolledigheid in ontvangen formulieren kan leiden tot een vertekening. Het is nog onduidelijk wat dit betekent voor de doodsoorzakenstatistiek. Voor toekomstige studies is het belangrijk om inzicht te krijgen waarom bepaalde formulieren ontbreken, en in hoeverre dit leidt tot een selectie bias. Het verder onderzoeken van de koppelmogelijkheden met het bevolkingsregister kan aanknopingspunten bieden. 

In deze analyse viel het relatief hoge percentage van niet-natuurlijke overlijdens als gevolg van ongevallen in het water op. Van de 65 niet-natuurlijke doodsoorzaakformulieren zonder de code R99, waren er 10 gecodeerd als verdrinking en 8 in de categorie ‘blootstelling aan druk van omgevingslucht’ als gevolg van scubadiven, wat betekent dat bijna eenderde van het aantal niet-natuurlijke doden is toe te schrijven aan ongevallen op het water. Dit is een hoger percentage in vergelijking met Europees Nederland, wat mogelijk gerelateerd is aan het aantal duik- en snorkelactiviteiten dat op de eilanden plaatsvindt. Verder viel op dat de waterongevallen niet in het jaar 2021 hebben plaatsgevonden. 

Tenslotte viel tijdens het analyseren van de doodsoorzakenformulieren op dat er geen doodsoorzaakformulieren zijn gevonden met doodgeborenen. 

5. Conclusies en aanbevelingen

Het verwerken en analyseren van de formulieren voor deze pilotstudie was een arbeidsintensief proces. Idealiter kan er op termijn een deels geautomatiseerd productieproces bewerkstelligd worden van waaruit reguliere doodsoorzakenstatistieken voor het Caribisch deel van Nederland kunnen worden vervaardigd. Op basis van de gegevens die voor deze studie zijn ontvangen en verwerkt kunnen nog geen betrouwbare doodsoorzakenstatistieken worden geproduceerd.  

Er zijn echter wel mogelijkheden om hier naartoe te werken: voor het inrichten van het productieproces kunnen in elke fase van de verwerking suggesties worden gedaan om dit proces te optimaliseren. Hieronder volgen voor elk onderdeel van het proces enkele aanbevelingen en overwegingen.

  • Invulling van de formulieren
    • Gesprekken met artsen om invulling nader toe te lichten, en belang van de statistiek te benadrukken conform de WHO-toelichting waarbij logica van invulling van het doodsoorzakenformulier niet altijd overeenkomt met hoe een medisch dossier wordt bijgehouden.
    • Afstemming van de opmaak en inhoud van de formulieren zodat deze zo uniform mogelijk kunnen worden verwerkt, mogelijk is hiervoor wijziging van wet- en regelgeving nodig.
    • Idealiter zou op termijn gekeken kunnen worden naar mogelijkheden voor digitale aanlevering vanuit de systemen die zorgverleners zelf gebruiken voor de patiëntenadministratie.
  • Route en verwerking van de formulieren
    • De route die wordt afgelegd voor ontvangst van formulieren en de tijd die hiermee samenhangt zou geoptimaliseerd kunnen worden.
    • Voor vertoetsing van medische termen is borgen van basiskennis van de relevante medische terminologie noodzakelijk.
    • Inventarisatie van veel voorkomende termen en het maken van een regelbestand en woordenboek voor Iris om de verwerking zo goed mogelijk te kunnen standaardiseren. Hierbij moet rekening gehouden worden met verschillende talen als ook formulieren geheel in het Engels worden ingevuld.
    • Onderzoek mogelijkheden met koppelen aan sterftebestanden om de populatie af te bakenen.
  • Statistische publicatie:
    • Kleine en heterogene populatie in acht nemen en relateer de uitkomsten aan de andere statistische publicaties die voor Caribisch Nederland worden gemaakt.
    • Kies voor tabellering uitsplitsingen met de belangrijkste informatie voor publieke gezondheidsdoeleinden na overleg met de beleidsmakers, onderzoekers en andere gebruikers van de data om zo goed mogelijk bij hun informatiebehoefte aan te sluiten.  Onderzoek mogelijk koppelingen met medische informatie uit andere registraties om een completer beeld te verkrijgen. 

Toelichting Tabel 8: Doodsoorzaken en bijbehorende ICD-10 codes

Nieuwvormingen

Met sterfte aan nieuwvormingen wordt bedoeld het totale aantal overlijdensgevallen aan kwaadaardige nieuwvormingen (kanker) en niet kwaadaardige nieuwvormingen geclassificeerd in C00-C97 en D00-D48 codes van de ICD-10. Het aandeel van kwaadaardige nieuwvormingen (kanker) omvat ongeveer 96 procent.

Ziekten van hart- en vaatstelsel

Met sterfte aan ziekten van hart- en vaatstelsel wordt bedoeld alle overlijdensgevallen geclassificeerd in I00-I99 codes van de ICD-10.

Psychische stoornissen en ziekten van zenuwstelsel en zintuigen

Met sterfte aan psychische stoornissen en ziekten van het zenuwstelsel wordt bedoeld alle overlijdensgevallen geclassificeerd in F00-F99 en G00-H95 codes van de ICD-10.
Psychische stoornissen en gedragsstoornissen. ICD-10 codes: F00-F99

w.o. 
F00 Dementie bij ziekte van Alzheimer
F01 Vasculaire dementie
F02 Dementie bij elders geclassificeerde ziekten
F02 Dementie bij overige elders geclassificeerde ziekten
F03 Niet gespecificeerde dementie

Ziekten van zenuwstelsel. ICD-10 codes: G00-G99
w.o. 
G20 Ziekte van Parkinson
G30 Ziekte van Alzheimer

Ziekten van de ademhalingsorganen

Met sterfte aan ziekten van de ademhalingsorganen wordt bedoeld alle overlijdensgevallen geclassificeerd in J00-J99 codes van de ICD-10.

COVID-19

Met de doodsoorzaak wordt de onderliggende doodsoorzaak bedoeld. De onderliggende doodsoorzaak is (a) de ziekte of aandoening waarmee de reeks van gebeurtenissen die uiteindelijk het overlijden van de persoon veroorzaakte een aanvang nam of (b) de omstandigheden van het ongeval of geweld dat het letsel waardoor de persoon overleed veroorzaakte. De doodsoorzaak wordt gecodeerd volgens internationaal afgesproken ICD-10 codes van de Wereldgezondheidsorganisatie (WHO). 

Voor COVID-19 (Corona Virus ziekte 2019) zijn nieuwe codes uitgegeven.
De classificatie en ICD-10 codering COVID-19 volgens richtlijnen WHO:

  • U07.1 COVID-19, virus geïdentificeerd 
  • U07.2 COVID-19, virus niet geïdentificeerd 
    • Klinisch-epidemiologisch gediagnosticeerde COVID-19 
      • Waarschijnlijk COVID-19 
      • Vermoedelijke COVID-19

Hoewel beide categorieën, U07.1 (COVID-19, virus geïdentificeerd) en U07.2 (COVID-19, virus niet geïdentificeerd), geschikt zijn voor doodsoorzaakcodering, wordt erkend dat in veel landen de laboratoriumbevestiging van COVID-19 níét wordt vermeld op het doodsoorzaakformulier. Bij gebrek aan dit detail wordt aanbevolen, alleen voor gebruik in de doodsoorzaakregistratie, om COVID-19 voorlopig te coderen als U07.1, tenzij dit wordt vermeld als "waarschijnlijk" of "vermoedelijk". In dat geval wordt de doodsoorzaak gecodeerd als U07.2

Definitie overlijden aan COVID-19

Om COVID-19-sterfte goed in kaart te brengen wordt voor statistische doeleinden een overlijden als gevolg van COVID-19 gedefinieerd als een overlijden aan een klinisch compatibele ziekte, in het geval van bevestigde of vermoedelijke/waarschijnlijke COVID-19, tenzij er een duidelijke andere doodsoorzaak is die niet gerelateerd kan zijn aan COVID-19 (bv. lichamelijk letsel door een ongeluk). Er mag geen periode van volledig herstel van COVID-19 zijn tussen ziekte en overlijden.

NND –Niet-natuurlijke doodsoorzaken (ook uitwendige doodsoorzaken)

Hiertoe behoren de overlijdens ten gevolge van ongevallen, zelfdoding, moord en doodslag, gebeurtenissen waarvan opzet onbekend is en overige uitwendige oorzaken van sterfte, codes V01-Y89 van de ICD-10.

Overige doodsoorzaken

Zijn alle doodsoorzaken met uitzondering van nieuwvormingen, ziekten van hart- en vaatstelsel, ziekten van ademhalingsstelsel, psychische stoornissen en ziekten van het zenuwstelsel en zintuigen, COVID-19 en niet-natuurlijke doodsoorzaken. Volgens classificatielijst ICD-10: codes A00-Y89 met uitzondering van codes C00-D48,F00-F99, G00-H95, I00-I99, J00-J99,  U071-U072 en V01-Y89.