Regionale verschillen in sterfte verklaard
Het Planbureau voor de Leefomgeving (PBL) en het CBS hebben in 2011 voor de vierde keer de Regionale bevolkings- en huishoudensprognose met het model PEARL uitgebracht. In deze prognose spelen veronderstellingen over de gemeentelijke sterfte een belangrijke rol. In dit kader is een analyse uitgevoerd naar de verklaring van gemeentelijke verschillen in de levensverwachting aan de hand van een multivariaat regressiemodel.
Van de demografische variabelen is slechts voor de mannen sprake van een significant verband: in gemeenten met een laag percentage gehuwde mannen ligt de levensverwachting lager. Religie (cultuur) heeft een klein positief effect: in gemeenten met een hoog percentage stemmers op de kleine christelijke partijen ligt de levensverwachting van vrouwen iets hoger. In gemeenten met hoge sterftecijfers aan ziekten van het hart- en vaatstelsel en ziekten van het ademhalingsstelsel ligt de levensverwachting lager. Van de sociaal-economische variabelen is met name het percentage mensen met een uitkering van belang. In gemeenten waar dit percentage hoog ligt, is de levensverwachting lager.
1. Inleiding
In Nederland overlijden de laatste jaren gemiddeld rond de 135 duizend mensen. De sterftegevallen zullen de komende decennia nog fors toenemen door de acceleratie van de vergrijzing, vanwege het 'op leeftijd komen' van de naoorlogse babyboom. In de regionale prognose speelt deze groei van de sterfteaantallen een belangrijke rol, maar ook de regionale verschillen in het aantal sterftegevallen. Om dit goed te kunnen voorspellen, wordt in de prognose gekeken naar regionale verschillen in sterftekansen. Hierbij wordt gebruik gemaakt van een samenvattende indicator van leeftijdspecifieke sterftekansen, te weten de levensverwachting bij de geboorte. Deze indicator geeft een indruk van het aantal jaren dat iemand bij geboorte naar verwachting te leven heeft indien de in een bepaald kalenderjaar gemeten leeftijdsspecifieke sterftekansen voor deze persoon gedurende zijn leven van toepassing zijn. In 2009 was de levensverwachting voor mannen 78,5 jaar en voor vrouwen 82,7 jaar.
In de afgelopen vier decennia is de levensverwachting in Nederland aanzienlijk gestegen. Tussen 1970 en 2009 nam de verwachting voor mannen met zo'n 7,7 jaar toe, voor vrouwen met zo'n 6,2 jaar. Voor de mannen geldt een min of meer continue stijging, terwijl de stijging bij de vrouwen na 1985 nog maar vrij gering was. Volgens De Jong (2004) is de stijging van de levensverwachting voor een belangrijk deel het resultaat van een daling van de sterfte door hart- en vaatziekten. Deze daling leverde voor mannen en vrouwen een stijging op van bijna drie jaar. De daling van de sterfte door nieuwvormingen (kanker e.d.), niet-natuurlijke dood en overige doodsoorzaken speelt een veel geringere rol. Het valt te verwachten dat doodsoorzaken niet alleen trends in de tijd kunnen verklaren, maar ook regionale verschillen in de sterfte.
2. Achtergronden bij regionale verschillen in de sterfte
Uit diverse studies (Marmot Review, 2010; Commission on Social Determinants of Health, 2008; Smith et al., 1992) blijkt dat er een relatie bestaat tussen sociaal-economische deprivatie, slechte gezondheid en voortijdige sterfte. Smits et al. (2001) laat zien dat in postcodegebieden met een lage sociaal-economische status de sterftekans beduidend hoger ligt. Anson (2003) laat zien dat in België de (gestandaardiseerde) sterfte in gemeenten met een hoge sociaal-economische status lager ligt. Van der Gaag en De Jong (1997) melden dat in arme regio's in Schotland en het noorden van Frankrijk de sterftekansen hoger liggen.
Het effect van de sociaal-economische status op de sterftekans wordt voor een belangrijk deel veroorzaakt door de leefstijl (Minkler et al., 2006; van der Lucht en Picavet, 2006; Mackenbach et al., 2008). Mensen met een lage sociaal-economische status even vaak ongezonder dan mensen met een hoge status. Hierbij spelen vooral roken, verkeerd eten en alcohol een belangrijke rol. Het roken is een belangrijke oorzaak van diverse kankers. Het rookgedrag is gerelateerd aan sociale status. Mede onder invloed van overheidscampagnes om met roken te stoppen, zijn mensen met een hogere sociaal-economische status vaker gestopt met roken. Het roken is ook een belangrijke verklaring voor het geslachtsverschil in de levensverwachting (Valkonen en Van Poppel, 1997). Mannen zijn eerder gaan roken dan vrouwen zodat de sterfte aan longkanker bij mannen veel hoger was dan bij vrouwen. Het drinken van grote hoeveelheden alcohol kan leiden tot bepaalde typen kanker, leverziekten en ongelukken. In landen waar de alcoholconsumptie hoog is, zoals in de voormalige Sovjet Unie (Dinkel, 1985) en Finland ligt de levensverwachting laag.
Overgewicht (obesitas) is een risicofactor die snel in belang groeit. Obesitas vergroot het risico op diverse ziektes, in het bijzonder diabetes (Prospective Studies Consortium, 2009). Uit de studie van Caselli et al. (2003) komt naar voren dat dieet een belangrijke factor is voor de verklaring van ontwikkelingen in regionale sterfteverschillen. In het noorden van Italië is de sterfte in snel tempo gedaald na het overnemen van het mediterrane dieet (veel vis en olijfolie) uit het zuiden. Ook Pos en Bouwens (2004) leggen een verband tussen leefstijl en doodsoorzaken. Zij laten zien dat de kans op hart- en vaatziekten groter wordt door ongezonde voeding, overgewicht en roken.
Directe operationalisering van leefstijlvariabelen aan de hand van roken, alcoholgebruik en overgewicht is in de analyse van gemeentelijke verschillen in de levensverwachting niet mogelijk, omdat deze gegevens niet op dit niveau beschikbaar, maar slechts op GGD-niveau. Aangezien het aannemelijk is dat er een oorzakelijk verband bestaat tussen leefstijl en doodsoorzaken is, is ervoor gekozen om leefstijl te operationaliseren aan de hand van de belangrijkste doodsoorzaken uit de classificatielijst van de International Classification of Diseases ICD-10 (World Health Organization, 2007).
Naast sociaal-economische status en leefstijl heeft ook burgerlijke staat invloed op de sterftekansen. Het huwelijk heeft vooral gunstige effecten op de levensverwachting van mannen (Zick en Smith, 1991; Rogers, 1995). Uit De Jong (2002) blijkt dat de levensverwachting van 50-jarige gehuwde mannen rond vier jaar hoger ligt dan van ongehuwde mannen. Bij 50-jarige gehuwde vrouwen ligt de levensverwachting rond twee jaar hoger dan van ongehuwde vrouwen. Anson (2003) brengt de hogere levensverwachting van gehuwden in verband met het hebben van sociale bindingen en geeft aan dat mannen hier ‘gevoeliger’ voor zijn.
Volgens Mackenbach et al. (1991) en Mackenbach (1992) kunnen regionale sterfteverschillen in Nederland worden herleid tot verschillen in een drietal sociaal-demografische kenmerken, te weten het gemiddeld inkomen, het percentage inwoners in grote steden en het percentage mensen met een rooms-katholieke achtergrond. Godsdienst heeft geen directe invloed op gezondheid, maar beweegt tot gedragspatronen die indirect van invloed zijn op de gezondheid. Zo komt roken vaker voor onder rooms-katholieken. Het gemiddeld inkomen hangt negatief samen met de sterfte aan maagkanker, ischemische hartziekten en verkeersongevallen. In Italië constateren Caselli et al. (2003) een negatief verband tussen sterfte en het inkomen (bruto nationaal product per hoofd van de bevolking). In het welvarende noorden van Italië ligt de sterfte (aan hart- en vaatziekten en longkanker) echter hoger dan in het minder welvarende zuiden. De achterliggende verklaring wordt gezocht in het feit dat de vervuiling in het noorden groter is. Wilkinson en Pickett (2009) relateren sterfteverschillen tussen landen aan inkomensongelijkheid: hoe meer ongelijkheid, hoe hoger de sterfte.
In de steden ligt de levensverwachting doorgaans onder het landelijke gemiddelde. Ook in de vier grote gemeenten van Nederland is de levensverwachting laag, zowel van mannen als van vrouwen. In Amsterdam, Den Haag en Utrecht ligt de levensverwachting één jaar onder het landelijke gemiddelde en in Rotterdam zelfs ruim anderhalf jaar. Ook op provinciaal niveau zijn er duidelijke verschillen in de levensverwachting zichtbaar. In Zeeland ligt de levensverwachting vrij hoog en in Limburg en Groningen vrij laag. De verhoogde sterfte in Limburg hangt samen met een hoge sterfte aan hart- en vaatziekten, terwijl de lage sterfte in Zeeland samenhangt met lagere sterfte aan hart- en vaatziekten en longkanker (Mackenbach et al., 1991).
3. Methode en analyse
3.1 Levensverwachting als indicator voor regionale verschillen in sterfte
Als indicator van het niveau van de sterfte is gekozen voor de levensverwachting bij geboorte. Deze maat is ongevoelig voor leeftijdsopbouweffecten, waardoor de indicator zowel geschikt is voor het volgen van ontwikkelingen in de tijd, als voor het in kaart brengen van verschillen tussen regio's. Er is niet gekozen voor een 'technische' maat als het indirect gestandaardiseerde bruto sterftecijfer, omdat de levensverwachting intuïtief beter te duiden valt.
Een groot nadeel van het meten van de levensverwachting op regionaal niveau is dat de bevolkingsomvang in sommige regio’s gering is en het aantal sterftegevallen erg laag kan uitvallen (minder dan 50 overledenen). Hierdoor kan de levensverwachting in bepaalde regio's moeilijk worden berekend, mede omdat voor de berekening de sterftekansen op verschillende leeftijden nodig zijn en die kansen door de geringe aantallen overledenen onbetrouwbaar kunnen zijn. Door het toepassen van filtertechnieken kan hiervoor worden gecorrigeerd. Door het filteren van de ruwe data is het dan mogelijk om een vrij betrouwbaar beeld te krijgen van ruimtelijke verschillen in de levensverwachting.
In de analyse is gebruik gemaakt van de levensverwachting van mannen en vrouwen per gemeente in 2009. Met het filteren van de ruwe data zijn de toevalsfluctuaties in de data beperkt en de betrouwbaarheid vergroot. De ruwe data is op drie manieren gefilterd. De eerste stap was het aanpassen van de levensverwachting in gemeenten met minder dan 50 sterfgevallen. Voor deze gemeenten valt de levensverwachting amper betrouwbaar te berekenen. In deze gemeenten is gebruik gemaakt van de levensverwachting van het COROP-gebied waartoe de gemeenten behoren. Er is namelijk een gewogen gemiddelde berekend van de levensverwachting van elke gemeente en van het COROP-gebied op basis van de inwonertallen. Deze stap is gangbaar in de demografie. De tweede stap was het verder aanpassen van de gemeentelijke levensverwachtingen met behulp van een 'ruimtelijk' filter, wederom met het doel de ruimtelijke toevalsfluctuaties te verwijderen in gemeenten met kleine inwoneraantallen. Hiervoor is een lokale variant van empirische Bayes schattingen gebruikt (Bailey en Gatrell, 1995; Waller en Gotway, 2004). In deze methode wordt de levensverwachting van een gemeente veranderd indien de betrouwbaarheid te klein is. In dat geval wordt de levensverwachting aangepast aan een regionale levensverwachting.
In de derde stap is gefilterd voor gemeentelijke uitbijters. Met behulp van een temporeel filter is het mogelijk te corrigeren voor toevalsfluctuaties in de tijd. Hiertoe is gebruik gemaakt van een algoritme dat het voortschrijdend gemiddelde over de tijd iteratief berekent totdat de zogenoemde signaal-ruisverhouding aan bepaalde normen voldoet (Loke, 2011). Deze derde stap wordt uitgevoerd met de gefilterde data uit stap 2 en wel voor de periode 1997–2009. In 2009 waren er 441 gemeenten. Gemeenten die daarvóór door gemeentelijke herindelingen zijn opgeheven, zijn in de jaren dat ze nog bestonden toegevoegd aan de nieuw gevormde gemeenten of aan al bestaande gemeenten waarmee ze zijn gefuseerd. In die jaren is de levensverwachting van de betrokken gemeenten gewogen gemiddeld aan de hand van de inwonertallen.
Merk op dat de data in bovenstaand raamwerk eerst ruimtelijk en dan temporeel wordt gefilterd. Deze volgorde is gekozen omdat de onzekerheid in de ruimte (de populatiegrootte varieert aanzienlijk tussen kleine en grote gemeenten) groter is dan die in de tijd (de populatiegrootte van de gemeente varieert minder sterk over de kalenderjaren). Kaarten 1 tot en met 4 geven een beeld van de regionale verschillen in de levensverwachting voor mannen en vrouwen in 2009 vóór en na de filtering.
De regionale verschillen in de gemeentelijke levensverwachting zijn groot. Voor mannen zijn de hoogste waarden van de gefilterde levensverwachting (rond 81 jaar) te vinden in Voorschoten, Kaag en Braassem, Langedijk, Dronten en Leiderdorp, en de laagste waarden (rond 76 jaar) in Kerkrade, Rucphen, Onderbanken en Tilburg. Voor vrouwen zijn de hoogste waarden (rond 85 jaar) te vinden in de gemeenten Langedijk, Dronten, Lisse, Dongeradeel, Schiermonnikoog, Meerssen en Borsele, en de laagste waarden (rond 80 jaar) in Kerkrade, Brunssum, Menterwolde, Pekela en Heerlen.
1. Levensverwachting voor mannen per gemeente, 2009
2. Gefilterde levensverwachting voor mannen per gemeente, 2009
1. Levensverwachting voor vrouwen per gemeente, 2009
2. Gefilterde levensverwachting voor vrouwen per gemeente, 2009
3.2 Analyse met behulp van multivariate regressie
Voor de verklaring van regionale verschillen in de levensverwachting is een multivariaat regressiemodel opgesteld. De Jong et al. (2005) heeft een model geschat met Ordinary Least Squares (OLS). Wij hebben de voorkeur gegeven aan een weging van het model aan de hand van het aantal personen van 65 jaar en ouder, apart voor mannen en vrouwen. De weging kan automatisch worden uitgevoerd met de optie Weighted Least Squares (WLS). Door deze weging gaan gemeenten met grote inwonertallen (toevalsfluctuatie in data is klein) zwaarder meetellen dan gemeenten met kleinere inwoneraantallen (toevalsfluctuatie in data is groot). Zie ook Strutz (2010). De weging komt de precisie van de modellering ten goede.
Bij de toepassing van het regressiemodel is de gangbare werkwijze gehanteerd (zie Chatterjee en Hadi, 2006). Naast de afhankelijke variabele (de levensverwachting) zijn alle onafhankelijke variabelen (univariaat) gecheckt op normaliteit door inspectie van histogrammen. Alleen het histogram voor de bible belt bleek scheef verdeeld. Per onafhankelijke variabele is met scatterplots gekeken naar de (bivariate) correlatie met de levensverwachting. Op basis hiervan is een voorselectie van verklarende variabelen gemaakt. Vervolgens is de analyse met de geselecteerde variabelen uitgevoerd. Hierna zijn nog diverse variabelen uit het model verwijderd, te weten de variabelen die niet significant bijdragen aan de verklaarde variantie of een, volgens de theorie, verkeerd teken hebben. Ook variabelen met hoge Variance Inflation Factors (VIF’s) zijn verwijderd om problemen met multicollineariteit te voorkomen. Hierdoor resulteerde uiteindelijk een beknopt model met enkel significante variabelen die een plausibel teken hadden voor het effect op de levensverwachting.
Om het resulterende model te valideren, zijn ten slotte de residuen, de verschillen tussen waargenomen en voorspelde waarden, nog bekeken. Zowel bij het model voor mannen als voor vrouwen is er één forse uitbijter: Rozendaal bij de mannen, Abcoude bij de vrouwen. Zonder deze uitbijters zijn de residuen normaal verdeeld. Zowel de Kolmogorov-Smirnov-test als de Shapiro-Wilk-test leverden niet significante waarden op. Daarnaast is met behulp van het globale Moran's I algoritme (zie Griffith, 1987; Mitchell, 2005) getoetst of de residuen ruimtelijk zijn geclusterd. In dat geval zou er sprake zijn van ruimtelijke autocorrelatie. Dit bleek niet het geval te zijn. Er kan dus worden geconcludeerd dat er wordt voldaan aan de algemene regressie-eisen (Chatterjee en Hadi, 2006) en dat de opgestelde globale regressiemodellen geldig zijn.
3.3 Verklarende variabelen voor verschillen in regionale levensverwachting
De verklarende variabelen voor het multivariate regressiemodel kunnen ingedeeld worden in vier categorieën.
1. Demografische variabelen
In het model zijn diverse variabelen opgenomen die betrekking hebben op de burgerlijke staat. Berekend zijn de volgende indicatoren: het percentage personen dat getrouwd is, het percentage personen dat verweduwd is en het percentage personen dat woont in een institutioneel huishouden (verpleeg- of verzorgingshuis). De laatste variabele is geselecteerd in de veronderstelling dat dit via een selectie-effect (het zijn mensen met een zwakke gezondheid die hier wonen) een negatieve invloed zal uitoefenen op de levensverwachting van een bepaalde gemeente.
Van bovengenoemde demografische variabelen is uiteindelijk slechts het percentage gehuwde mannen per gemeente in het regressiemodel opgenomen. In kaart 5 is dit weergeven. Dit percentage is in het algemeen laag in de grotere gemeenten en de regio's die grenzen aan Duitsland en België. In de plattelandsgemeenten in de Randstad en het middengebied van Nederland is het percentage gehuwde mannen doorgaans relatief hoog.
5. Gehuwde mannen in de leeftijdsgroep 65 jaar en ouder per gemeente, 2009
2. Culturele en leefstijlvariabelen
Voor de operationalisering van religie wordt gebruik gemaakt van het percentage stemmers op de Christen Unie (CU) en de Staatkundig Gereformeerde Partij (SGP) bij de Tweede-Kamerverkiezingen van 2006. In ruimtelijk opzicht is dit een operationalisering van de bible belt: een strook gemeenten waar relatief veel gereformeerden en (orthodox) hervormden wonen.
In kaart 6 is het percentage stemmers op deze kleine christelijke partijen weergegeven. De bible belt is opvallend goed zichtbaar als de strook gemeenten die schuin over Nederland loopt van Zeeland tot Overijssel. Ook in het westen van de provincie Groningen en het oosten van Friesland is het percentage stemmers op de twee christelijke partijen relatief hoog.
6. Percentage stemmers op kleine christelijke partijen per gemeente, Tweede-Kamerverkiezingen, 2006
De gebruikte indicator voor leefstijl is de sterfte aan bepaalde doodsoorzaken. Hiervoor is gebruik gemaakt van de sterftecijfers volgens de classificatielijst International Classification of Diseases ICD-10 (codes C00-D48), zie World Health Organization (2007). De volgende doodsoorzaken zijn in de analyse meegenomen:
– ziekten van hart- en vaatstelsel (hartziekten en hersen- en vaatletsel);
– nieuwvormingen (goedaardige of kwaadaardige gezwellen, ook wel met kanker aangeduid);
– ziekten van het ademhalingsstelsel;
– overige doodsoorzaken: alle doodsoorzaken met uitzondering van nieuwvormingen, hart- en vaatziekten, ademhalingsziekten en uitwendige doodsoorzaken.
Uitwendige doodsoorzaken (ongevallen, zelfdoding, moord en doodslag, gebeurtenissen waarvan de opzet onbekend is en overige uitwendige oorzaken van ziekte en sterfte) lijken willekeurig en zijn niet meegenomen in de analyse. Per doodsoorzaak is een procentuele sterftekans bepaald door het aantal overledenen (op alle leeftijden) te relateren aan alle personen van 65 jaar en ouder en vervolgens te vermenigvuldigen met 100. Hierbij is verondersteld dat de meeste overledenen vallen in de leeftijdscategorie 65-plus.
In de kaarten 7 tot en met 10 worden voor vier in het regressiemodel opgenomen doodsoorzaken de sterftekansen getoond. De sterftekans aan ziekten aan het hart- en vaatstelsel loopt uiteen tussen 5 procent en 30 promille. Er is geen duidelijk regionaal patroon zichtbaar. Wel zijn er in Groningen, Friesland en Drenthe en in het zuiden van Limburg relatief veel gemeenten met een hoge score op deze doodsoorzaak. Ook bij de sterfte aan nieuwvorming loopt de regionale sterftekans uiteen van rond 5 en 30 promille. De kaart met de sterftekans aan nieuwvorming is duidelijk afwijkend van de kaart met de sterftekans aan ziekten van het hart- en vaatstelsel. In de Randstadprovincies Noord-Holland, Zuid-Holland en Utrecht, maar ook in Gelderland, Flevoland en Noord-Brabant zijn er nu veel meer gemeenten die hoog scoren. De regionale variatie in de sterftekans aan ziekten van het ademhalingsstelsel is minder sterk dan aan de vorige twee doodsoorzaken: het loopt uiteen van 0 tot 10 promille. De regionale fluctuatie is wederom niet goed te duiden, maar met veel voorbehoud kan gezegd worden dat deze sterftekans wat lager lijkt te liggen in de perifere regio's van Nederland (Friesland, Groningen, Zeeland en Limburg) terwijl in Gelderland, Overijssel en Noord-Brabant relatief veel gemeenten hoog scoren. De sterftekans aan de overige doodsoorzaken loopt uiteen van rond 5 tot 20 promille. Wederom met de nodige reserve kan gezegd worden dat relatief veel gemeenten in Noord- en Zuid-Holland, Utrecht, Friesland en Groningen hoge sterftekansen kennen.
7. Sterftekansen aan hart- en vaatstelsel per gemeente, 2009
8. Sterftekansen aan nieuwvormingen per gemeente, 2009
9. Sterftekansen aan ademhalingsstelsel per gemeente, 2009
10. Sterftekansen aan overige doodsoorzaken per gemeente, 2009
3. Sociaal-economische variabelen
De sociaal-economische status komt uit de literatuur naar voren als een belangrijke verklarende variabele voor sterfteverschillen. Dit lijkt in verband te staan met verschillen in leefstijl tussen verschillende bevolkingsgroepen. Sociaal-economische status is niet rechtstreeks te ontlenen aan de beschikbare data, maar dient afgeleid te worden uit een combinatie van variabelen. In deze analyse is ervoor gekozen om bepaalde economische variabelen te gebruiken als operationalisering van sociaal-economische status. Op basis van de beschikbare data is gekozen voor het percentage personen met een WAO-, WW- of bijstandsuitkering in 2009 en het gemiddeld besteedbaar (persoonlijk) inkomen in het kalenderjaar 2007.
Beide variabelen zijn in het regressiemodel opgenomen. Uit kaart 11 komt naar voren dat het percentage personen met een uitkering uiteenloopt van 5 procent tot 25 procent. In Groningen, Drenthe en Limburg zijn relatief veel gemeenten met een hoog percentage personen met een WAO-, WW- of bijstandsuitkering. Ook in Amsterdam is het percentage personen met een uitkering hoog. Als in een gemeente het percentage personen met een uitkering 10 procentpunt hoger ligt dan in een andere gemeente, dan komt de levensverwachting zowel voor mannen als voor vrouwen rond 1 jaar lager uit. Voor mannen heeft het inkomen ook een significant effect. Blijkens kaart 12 ligt de regionale bandbreedte van het gemiddeld inkomen tussen de klassen 0-15 en 25 en hoger. In gemeenten in de drie Randstadprovincies ligt dit inkomen beduidend hoger dan daarbuiten. Met name in de drie noordelijke provincies ligt het veel lager.
11. Percentage personen met een uitkering per gemeente, 2009
12. Gemiddeld besteedbaar inkomen per gemeente, 2009
4. Geografische variabelen
De indicator voor stedelijkheid is de omgevingsadressendichtheid per vierkante kilometer in 2009. Deze variabele bleek echter geen significant effect te hebben op regionale verschillen in levensverwachting.
De Jong et al. (2005) hebben regionale variabelen in het multivariate regressiemodel toegevoegd door middel van dummies voor landsdelen, provincies en COROP-regio's. Deze variabelen zijn een indicatie voor structurele verschillen die niet kunnen worden verklaard door de overige variabelen.
Wij hebben gekozen voor een operationalisering op gemeenteniveau die minder grof is. Er worden wederom dummies in het model opgenomen, maar eerst is de ruimtelijke structuur van de dummies op gemeenteniveau onderzocht door een lokale hot-spot-analyse met behulp van het Anselin Moran's I algoritme (Anselin, 1995; Mitchell, 2005). Hierbij wordt een analyse gedaan op de gemeentelijke residuen, berekend van het verschil tussen de waargenomen levensverwachting en de door het regressiemodel voorspelde levensverwachting, waarin nog geen ruimtelijke dummies zijn opgenomen. In gemeenten waar significante waarden met het algoritme worden gevonden, is sprake van een ruimtelijke clustering en moet het regressiemodel worden bijgestuurd. Er is voor gekozen om de gevonden clusters te operationaliseren aan de hand van twee samengestelde dummies: de eerste dummy heeft betrekking op alle gemeenten met lage residuwaarden, de tweede dummy op alle gemeenten met hoge residuwaarden. Door het opnemen van deze samengestelde dummies in het model wordt voldaan aan de algemene regressie-eisen (zie paragraaf 3.2).
4. Uitkomsten van het multivariate model voor gemeentelijke sterfteverschillen
In deze paragraaf wordt het uiteindelijk geselecteerde multivariate model voor de verklaring van gemeentelijke sterfteverschillen beschreven. Door de gevolgde werkwijze zijn binnen de diverse categorieën slechts een beperkt aantal variabelen overgebleven. Het uiteindelijk afgeleide regressiemodel wordt in de staten 1 en 2 gepresenteerd. Er is één model voor mannen en één model voor vrouwen.
In de staten staan zowel de B-waarde als de Bèta-waarde weergegeven. Aan de hand van de B-waarden kan de hoogte van de levensverwachting in een gemeente worden berekend door vermenigvuldiging van de waarde van deze parameters met de hoogte van de betreffende verklarende variabelen, en hier de waarde van de constante bij op te tellen. Bij de Bèta-waarden is er gestandaardiseerd voor verschillen in de standaarddeviatie van de geselecteerde variabelen, zodat de verklaringskracht van de verschillende variabelen onderling kan worden vergeleken.
Het regressiemodel met de overgebleven inhoudelijke variabelen is zowel voor de mannen als voor de vrouwen 71 procent van de variantie in de gemeentelijke levensverwachting te verklaren. Alle variabelen zijn significant op een 1-procent-significantieniveau.
Van de demografische variabelen is bij de mannen het percentage gehuwden als indicator overgebleven. Bij de vrouwen had het percentage gehuwd geen significant effect op de levensverwachting. Dit is in overeenkomst met het in de literatuur geconstateerde grotere effect van burgerlijke staat op mannen. Voor de mannen geldt dat een hoger percentage gehuwden samengaat met een hogere levensverwachting. Indien het percentage gehuwde mannen in een bepaalde gemeente 10 procentpunt hoger ligt dan in andere gemeenten, dan mogen de mannen in de betreffende gemeente rekenen op 0,3 jaren extra levensverwachting. Doordat het percentage gehuwde mannen over het algemeen laag is in de grotere gemeenten en in de ‘periferie’ (zie kaart 5), betekent dit dat de levensverwachting daar wat gedrukt wordt.
Ook voor de culturele en leefstijlindicatoren zijn de opgenomen variabelen voor mannen en vrouwen verschillend. Voor vrouwen ligt in de bible-belt-gemeenten de levensverwachting iets hoger, terwijl voor mannen hier geen effect van uitgaat. Indien het percentage stemmers op CU en SGP in een bepaalde gemeente 10 procentpunt hoger ligt dan in andere gemeenten, dan mogen vrouwen in deze gemeente rekenen op 0,1 jaar extra levensverwachting.
De variabelen die betrekking hebben op de doodsoorzaken zijn niet gelijk voor mannen en vrouwen. Bij mannen kwamen slechts twee doodsoorzaken als significant uit de bus, te weten sterfte aan ziekten van het hart- en vaatstelsel en sterfte aan ziekten van het ademhalingsstelsel. Bij vrouwen waren deze twee doodsoorzaken ook significant, maar er werden tevens twee extra doodsoorzaken in het model opgenomen, te weten sterfte aan nieuwvormingen en sterfte aan overige doodsoorzaken.
De verklarende kracht van de sterftekans aan ziekten van het hart- en vaatstelsel was, gezien zowel de B-waarde als de Bèta-waarde, voor mannen duidelijk hoger dan voor vrouwen. Indien in een bepaalde gemeente de sterfte aan deze doodsoorzaak 1 procentpunt hoger ligt dan in een andere gemeente dan betekent dit voor mannen een verlies van 0,8 levensjaren tegen 0,5 jaren voor vrouwen. Voor de sterftekans aan ziekten van het ademhalingsstelsel was de verklaringskracht voor mannen en vrouwen ongeveer gelijk. Hier gaat een verhoging van de sterftekans aan deze doodsoorzaak met 1 procentpunt zowel voor mannen als vrouwen samen met een verlaging van de levensverwachting van rond 1 jaar. Voor vrouwen geldt bovendien dat een verhoging van de sterfte in een gemeente met 1 procentpunt voor zowel de nieuwvormingen als de overige doodsoorzaken gepaard gaat met een verlies van rond een half levensjaar.
Van de sociaal-economische variabelen zijn voor mannen het gemiddeld besteedbaar inkomen en het percentage personen met een uitkering geselecteerd. Voor vrouwen bleek het inkomen geen significante invloed te hebben. Op grond van de Bèta-waarde heeft de variabele percentage personen met een uitkering van alle variabelen de grootste verklarende waarde, zowel voor mannen als voor vrouwen. In gemeenten waar het gemiddeld inkomen 10 duizend euro hoger ligt, is de levensverwachting van mannen bijna een jaar hoger.
In het regressiemodel zijn ten slotte nog twee regionale dummies opgenomen: één voor gemeenten met een 'onverwacht' hoge en één voor gemeenten met een 'onverwacht' lage levensverwachting. Uit de kaarten 13 en 14 komt naar voren dat het gaat om niet meer dan een twintigtal gemeenten met een lage levensverwachting, en rond vijftien gemeenten met een hoge levensverwachting. In deze gemeenten ligt de levensverwachting rond een jaar hoger en lager dan verwacht op basis van de andere verklarende variabelen.
13. Gemeenten met een onverwacht hoge of lage levensverwachting, mannen
14. Gemeenten met een onverwacht hoge of lage levensverwachting, vrouwen
5. Conclusie
In dit artikel is voor mannen en vrouwen een verklarend model geschat dat gemeentelijke verschillen in de levensverwachting in verband brengt met diverse achtergrondvariabelen per gemeente. In een multivariaat regressiemodel is de gemeentelijke levensverwachting gerelateerd aan vier groepen verklarende variabelen, te weten demografische, culturele/leefstijl, sociaal-economische en geografische. Het verklarend model was in staat rond 70 procent van de regionale variatie in de levensverwachting te verklaren, zowel voor mannen als vrouwen. In De Jong et al. (2005) was dit rond 50 procent. Hierbij dient wel te worden opgemerkt dat bij de toepassing van het regressiemodel de variabelen per gemeente gewogen zijn met het aantal personen van 65 jaar en ouder.
De belangrijkste verklarende kracht ging uit van de sociaal-economische variabelen. Deze zijn geoperationaliseerd als het percentage personen met een WAO-, WW- of bijstandsuitkering per gemeente en het gemiddeld besteedbaar inkomen. Deze twee variabelen geven een indicatie van de sociaal-economische status, waarvan uit de literatuur is gebleken dat dit een belangrijk effect heeft op de levensverwachting. De uitkomsten van het regressiemodel bevestigen dit effect en geven aan dat het percentage personen met een uitkering een belangrijk deel van de regionale verschillen in levensverwachting kan verklaren. Voor mannen had het gemiddeld besteedbaar inkomen ook een significant effect, voor vrouwen niet. Met name in Groningen, Drenthe en Limburg zijn relatief veel gemeenten met hoge percentages personen met een uitkering. Dit heeft een drukkend effect op de levensverwachting in deze gemeenten.
Ook de culturele en leefstijlvariabelen bleken belangrijk, zoals verwacht. Cultuur en leefstijl zijn geoperationaliseerd door het percentage stemmers op de kleine christelijke partijen, en door de sterfte aan diverse doodsoorzaken. Deze doodsoorzaken verwijzen naar aspecten van de leefstijl als roken, (verkeerd) eten en (alcohol) drinken. Zowel voor mannen als vrouwen blijken de sterfte aan ziekten van het hart- en vaatstelsel en ziekten van het ademhalingsstelsel een sterk negatief effect te hebben op de levensverwachting. Voor de vrouwen hadden tevens nieuwvormingen en de overige doodsoorzaken nog een beduidend negatief effect op de levensverwachting.
Hoewel het regionale patroon van sterfte aan diverse doodsoorzaken vrij moeilijk te duiden valt, kan met enige voorzichtigheid worden gesteld dat de sterftekansen aan ziekten van het hart- en vaatstelsel in diverse gemeenten in de drie noordelijke provincies en het zuiden van Limburg wat hoger liggen. Dit leidt dan tot een lagere levensverwachting in deze gemeenten. Voor de ziekten aan het ademhalingsstelsel is de regionale variatie wat minder sterk dan bij de ziekten van het hart- en vaatstelsel. In de Gelderland, Overijssel en Noord-Brabant komen relatief veel gemeenten voor met een hogere incidentie van deze ziekten. Wederom gaat hiervan een negatief effect uit op de levensverwachting.
Religie heeft maar een gering effect op de levensverwachting. Bij vrouwen ligt de levensverwachting iets hoger in gemeenten die liggen in de bible belt.
Van de demografische variabelen bleek alleen voor mannen het percentage gehuwden een significant effect te hebben op de levensverwachting: een hoger percentage gehuwden gaat samen met een hogere levensverwachting. Vanuit de literatuur is overigens al voor mannen een sterker effect van de gehuwde staat op de levensverwachting verwacht dan voor vrouwen. In de meeste grote steden en perifere regio's ligt het percentage gehuwde mannen lager dan gemiddeld, terwijl in gemeenten in het midden van het land het percentage juist wat hoger ligt.
Bovenop deze structurele variabelen zijn ten slotte in het regressiemodel nog twee regionale dummies opgenomen. In de in deze dummies gespecificeerde gemeenten blijkt de levensverwachting hoger of lager te zijn dan op basis van de inhoudelijke variabelen verklaard kan worden.
Bij de interpretatie van de uitkomsten moet zorgvuldig rekening worden gehouden met het probleem van ecological fallacy (Robinson, 1950). Dit wil zeggen dat verbanden die op geaggregeerd niveau (zoals gemeenten) worden gevonden, niet noodzakelijk voortvloeien uit verbanden op individueel niveau. Volgens het model ligt bijvoorbeeld de levensverwachting in diverse gemeenten in de periferie lager dan elders in het land. Dit betekent echter niet dat het wonen in de periferie leidt tot een lage levensverwachting.
Appendix: Toepassing in de regionale bevolkings- en huishoudensprognose van PBL en CBS
In de regionale prognose van PBL en CBS (zie: www.regionalebevolkingsprognose.nl en statline.cbs.nl) worden bij het modelleren van de sterfte veronderstellingen geformuleerd over regionale verschillen in levensverwachting. Hiertoe wordt gebruik gemaakt van een multivariaat regressiemodel, waarmee wordt getracht de levensverwachting op gemeentelijk niveau te relateren aan diverse achtergrondvariabelen. In het model dat bij de vorige prognose is gebruikt (zie De Jong et al., 2005), werden deze achtergrondvariabelen onderscheiden in vier categorieën, te weten demografische, cultuur/leefstijl-, sociaal-economische en geografische variabelen. In dit artikel is het model opnieuw geschat aan de hand van recente data. Voorts is het model aangepast met variabelen die betrekking hebben op doodsoorzaken.
Voor toepassing in het model PEARL (De Jong et al., 2005) wordt eerst een inschatting gemaakt van de hoogte van de (uiteindelijk geselecteerde) verklarende variabelen in 2020. Vervolgens kan met behulp van het ontwikkelde regressiemodel de levensverwachting voor mannen en vrouwen op gemeentelijk niveau in 2020 worden geschat. Deze uitkomsten worden vervolgens weer vertaald naar leeftijdsspecifieke sterftekansen die dan in het regionale prognosemodel als input worden gebruikt.
Rob Loke (PBL tot november 2011) en Andries de Jong (PBL)
Literatuur
- Anselin, Luc, 1995, Local Indicators of Spatial Association—LISA, Geographical Analysis 27(2): 93–115.
- Anson, J., 2003, Sex Differences in Mortality at the Local Level: An Analysis of Belgian Municipalities, European Journal of Population 19: 1-28.
- Bailey, T., Gatrell, A., 1995, Interactive spatial data analysis, Harlow, England: Longman.
- Caselli, G., Cerbara, L., Heinsq, F., Lipsi, R.M., 2003, What impact Do Contextual Variables Have on the Changing Geography of Mortality in Italy, European Journal of Population 19 (4): 339-373.
- Chatterjee, S., Hadi, A., 2006, Regression analysis by example, Wiley.
- Commission on Social Determinants of Health, 2008, CDSH Final Report: Closing the gap in a generation: Health equity through action on the social determinants of health, Geneva: World Health Organization. Online at: http://www.who.int/social_determinants/thecommission/finalreport/en/index.html
- Dinkel, R.H., 1985, The seeming paradox of increasing mortality in a highly industrialized nation: the example of the Sovjet Union, Population Studies 39: 87-97.
- Gaag, N. van der, Jong, A.H. de, 1997, Population scenarios for the European Union: regional scenarios, Maandstatistiek van de bevolking, Jaargang 45, december, blz. 17-31.
- Griffith, Daniel, 1987, Spatial Autocorrelation: A Primer, Resource Publications in Geography, Association of American Geographers.
- Jong, A. de, 2002, Gehuwden leven het langst, Maandstatistiek van de bevolking, Jaargang 50, juni, blz. 4-8.
- Jong, A. de, 2004, Analyse van doodsoorzaken op basis van overlevingstafeltechnieken, 1970-2003, Bevolkingstrends, 52(4): 23-36.
- Jong, A. de, Alders, M., Feijten, P., Visser, P., Deerenburg, I., Huis, M. van, Leering, D., 2005, Achtergronden en veronderstellingen bij het model PEARL, Naar een nieuwe bevolkings- en allochtonenprognose, Ruimtelijk Planbureau/Centraal Bureau voor de Statistiek, NAi Uitgevers, Den Haag/Rotterdam.
- Loke, R.E., 2011, Automated quality measures for spatial time series of demographic data, Interne notitie.
- Lucht, F. van der, Picavet, H., 2006, Sociaal-economische verschillen in leefstijl. Nationaal Kompas Volksgezondheid: http://www.rivm.nl/vtv/object_document/o3193n21022.html.
- Mackenbach, J.P., Kunst, A.E., Looman, C.W.N., Beeck, E.F. van, 1991, Regionale sterfteverschillen in Nederland, In: Sterfte en gezondheid nu en straks, Nederlandse Vereniging voor Demografie, 's-Gravenhage.
- Mackenbach, J., 1992, Socio-economic health differences in the Netherlands: a review of recent empirical findings, Social Science & Medicine 34 (3): 213-226.
- Mackenbach, J., Stirbu, I., Roskam, A., Schaap, M., Menvielle, G., Leinsalu, M., 2008, Socioeconomic inequalities in health in 22 European countries, The New England Journal of Medicine, 358: 2468-2481.
- Marmot Review, 2010, Fair Society, Healthy Lives, Strategic Review of Health Priorities in England post-2010, Online at: http://www.ucl.ac.uk/marmotreview.
- McPherson, K., Marsh, T., Brown, M., 2009, Tackling Obesities: Future Choices – Modelling Future Trends in Obesity and the Impact on Health, Government Office for Science, 2nd Edition, Online at: http://www.foresight.gov.uk/OurWork/ActiveProjects/Obesity/KeyInfo/Index.asp
- Minkler, M., Fuller-Thomson, E., Guralnik, J., 2006, Socioeconomic spectrum in the United States, The New England Journal of Medicine , 335: 695-703.
- Mitchell, Andy, 2005, The ESRI Guide to GIS Analysis, Volume 2, ESRI Press.
- Pos, S., Bouwens, J., 2004, Preventie van hart- en vaatziekten bij jong volwassenen van 20 tot 40 jaar. Aanknopingspunten voor prioritering en beleidskeuzes, NIGZ.
- Prospective Studies Consortium, 2009, Body-mass index and cause-specific mortality in 900,000 adults: collaborative analyses of 57 prospective studies, The Lancet, http://www.thelancet.com, Published online March 18, 2009, DOI:10.1016/S0140-6736(09)60318-4.
- Robinson, W.S., 1950, Ecological Correlations and the Behavior of Individuals. American Sociological Review 15 (3): 351–357.
- Rogers, R.G., 1995, Marriage, sex and mortality, Journal of Marriage and the Family 57: 515-526.
- Smith, G.D., Carroll, D., Rankin, D.S., Rowan, D., 1992, Socioeconomic differentials in mortality: Evidence from Glasgow graveyards, British Medical Journal 305: 1554-1557.
- Smits J., Keij, I., Westert, G., 2001, Effecten van sociaal-economische status van kleine, middelgrote en grote geografische eenheden op de sterfte, Maandstatistiek van de bevolking, Jaargang 49, november, blz. 4-10.
- Strutz, T., 2010, Data Fitting and Uncertainty - A practical introduction to weighted least squares and beyond, Vieweg+Teubner, Wiesbaden.
- Valkonen, T., Poppel, F. van, 1997, The contribution of smoking to sex differences in life expectancy: four Nordic countries and The Netherlands 1970-1989, European Journal of Public Health 7: 302-310.
- Waller, L.A., Gotway, C.A., 2004, Applied spatial statistics for public health data, Wiley, New Jersey.
- World Health Organization, 2007, International Statistical Classification of Diseases and Related Health Problems, 10th Revision, Online at: http://www.who.int/classifications/icd/en.
- Wilkinson, R., Pickett, K., 2009, The Spirit Level: why more equal societies almost always do better, Allen Lane, London.
- Zick, C.D., Smith, K.R., 1991, Marital transitions, poverty and gender differences in mortality, Journal of Marriage and the Family 53: 327-336.