5. Methoden
Welke statistische methoden worden in de Monitor Brede Welvaart & Sustainable Development Goals toegepast om trends in Nederland, posities van Nederland in de EU, jaarlijkse mutaties en de verdeling over bevolkingsgroepen te berekenen?
De indicatoren in de monitor worden geanalyseerd met een generieke set statistische methoden. Er wordt geen maatwerk verricht voor individuele indicatoren. De methoden zijn niet per se de beste voor ieder soort analyse en voor iedere afzonderlijke indicator. Hier leggen we uit welke methoden zijn toegepast en lichten we eventuele tekortkomingen van deze methoden toe.
Wanneer in deze Monitor uitspraken worden gedaan over veranderingen ten opzichte van de vorige versie van de Monitor (bijvoorbeeld over veranderingen in de trendkleur), dan wordt dat gedaan op basis van de huidige indicatorenset en niet letterlijk ten opzichte van de 2021-editie van de Monitor. Dit wordt gedaan omdat de indicatorenset veranderd kan zijn, omdat de eenheid van een indicator veranderd kan zijn, of omdat cijfers zijn herzien. De Monitor blijft op deze manier intern consistent.
5.1 Trends
De monitor meet de ontwikkeling van een fenomeen: de brede welvaart. Dat fenomeen wordt thema voor thema in kaart gebracht. Voor het meten van ieder thema worden één of meerdere indicatoren gebruikt die voor dat thema representatief zijn. Omdat deze indicatoren samen een thema en de brede welvaart als geheel beschrijven in een bepaalde periode, móeten de trends in de publicatie betrekking hebben op dezelfde periode. In de Monitor 2022 is voor alle indicatoren de trend bepaald door alle beschikbare data voor de jaren 2014 tot en met 2021 te analyseren, ook wanneer voor 2021 nog geen gegevens beschikbaar zijn. Uitspraken over de trendmatige ontwikkeling hebben dus altijd betrekking op dezelfde periode.
In de dashboards en visualisaties over de brede welvaart ‘hier en nu’, ‘later’ en ‘elders’ en over de SDG’s wordt voor iedere indicator de trendmatige ontwikkeling in de periode 2014-2021 weergegeven. De trends zijn berekend door middel van lineaire regressie door alle beschikbare datapunten in deze periode van acht jaar.
De regressievergelijking is:
y=ax+b
waarbij y de waarde van de indicator is, x het jaar waarop de waarde betrekking heeft, a de richting waarin de trend beweegt (de hellingshoek) en b het punt waar de trendlijn de y-as snijdt (het snijpunt).
Er is sprake van een stijgende of dalende trend wanneer parameter a significant is (p < 0,05). Een trend wordt stabiel genoemd wanneer parameter a niet significant is (p ≥ 0,05). Het minimale aantal datapunten voor een trendberekening is drie.
Voor sommige indicatoren geldt dat de brede welvaart stijgt als de trend omhoog gaat (bijvoorbeeld: tevredenheid met het leven). Voor andere indicatoren geldt dat de brede welvaart stijgt als de trend omlaag gaat (bijvoorbeeld: fijnstof in de lucht). In de dashboards is de richting van de trend aangegeven met een pijl. De pijl wijst naar boven als de trend omhoog gaat en naar beneden als de trend omlaag gaat. De kleur van de pijl toont de betekenis van de richting van de trend voor de brede welvaart. De kleur van de pijl is groen voor een stijging van de brede welvaart of rood voor een daling.
In de Monitor wordt de trend bepaald met behulp van een eenvoudig lineair regressiemodel waarmee een rechte lijn door een waargenomen tijdreeks wordt getrokken. Deze methode heeft echter wel een aantal tekortkomingen. De kleinste-kwadratenmethode, die in deze methode wordt gebruikt om de best passende snijpunt en hellingshoek van de trendlijn te schatten, stelt geen veronderstellingen aan de data. Dat wil zeggen dat de methode valide is als er geen conclusies worden getrokken uit de significantie van de parameters. De schattingen voor het snijpunt en de hellingshoek zijn op zichzelf valide.
Echter, in de monitor worden deze conclusies wel getrokken. Wanneer hypothesen worden getoetst op de significantie van snijpunt en hellingshoek, dan wordt aangenomen dat de residuen van het regressiemodel onafhankelijk normaal verdeelde variabelen zijn met gelijke variantie. Bij het toepassen van lineaire regressie op tijdreeksen is de veronderstelling dat de residuen van het regressiemodel ongecorreleerd zijn echter vaak geschonden. Het gevolg is dat de verdeling van de toetsingsgrootheid voor het toetsen van de regressiecoëfficiënten onbekend is waardoor de toets mogelijk niet meer valide is.
Ondanks deze tekortkoming wordt de kleinste-kwadratenmethode in de Monitor gebruikt om de trendmatige ontwikkeling van indicatoren te bepalen. De methode is eenvoudig te begrijpen en kan gestandaardiseerd worden uitgevoerd voor honderden indicatoren. De uitkomsten voor de verschillende indicatoren zijn vergelijkbaar: voor alle indicatoren in een dashboard is de betekenis van de trend gelijk. Bovendien is er op dit moment geen alternatieve gestandaardiseerde methode beschikbaar waarmee de trendmatige ontwikkeling op de middellange termijn kan worden bepaald, rekening houdend met alle observaties gedurende de trendperiode.
5.2 Posities
De positie van Nederland op de EU-ranglijst is bepaald met behulp van de frequentieverdeling van de indicatorwaarden van EU-lidstaten in het meest recente jaar met data voor tenminste tien landen. De beschikbare waarden zijn verdeeld in kwartielen (groepen van 25 procent). De kleur van de positie is groen wanneer de indicatorwaarde van Nederland hoort bij de bovenste 25 procent van de verdeling. De kleur van de positie is rood wanneer de indicatorwaarde van Nederland hoort bij de onderste 25 procent van de verdeling. In alle overige gevallen is de kleur van de positie grijs.
Het Verenigd Koninkrijk is met ingang van de editie 2021 niet meer opgenomen in de vergelijking met de EU, omdat dit land op 31 januari 2020 is uitgetreden. Waar wordt verwezen naar de EU of de EU-lidstaten, gaat het om de EU-27.
De bepaling van de positie van een land op de ranglijst wordt gedaan zoals in de sport gebruikelijk is. Het bepalen van de ranglijst begint bovenaan. Bij gelijke stand krijgen alle landen met dezelfde waarde dezelfde hoogste plaats op de ranglijst. De kleuren worden op dezelfde manier – dat wil zeggen van bovenaf – bepaald. Bijvoorbeeld, wanneer alle landen exact dezelfde waarde hebben, staan ze allemaal gedeeld eerste op de EU-ranglijst, en is de kleur van de positie van alle landen groen.
De samenvattende figuur over de gemiddelde positie van Nederland over alle indicatoren voor elk van de SDG’s is als volgt gemaakt. Voor iedere indicator die internationaal vergeleken kan worden, is de positie van Nederland in de EU omgerekend naar een percentage. Het is zo gedaan dat de laatste plaats 0 procent is, de eerste plaats 100 procent en het exacte midden (bijvoorbeeld 7e van de 13 landen) 50 procent. De gemiddelde positie van Nederland per SDG is een ongewogen gemiddelde van alle indicatoren. De kleur van de gemiddelde positie van Nederland per SDG is bepaald op basis van het gemiddelde in combinatie met het betrouwbaarheids¬interval (op een niveau van 95 procent). SDG’s met een gemiddelde van 75 procent of meer zijn groen gekleurd. SDG’s met een gemiddelde van minder dan 40 procent en een zeer lage ondermarge (minder dan 20 procent) van het betrouwbaarheids¬interval zijn rood gekleurd. Wanneer minder dan drie indicatoren in een SDG internationaal kunnen worden vergeleken of wanneer het betrouwbaarheids¬interval te groot is (groter dan het gemiddelde), wordt de kleur van het SDG op grijs gezet. Hiermee wordt bij benadering een onderscheid gemaakt tussen het bovenste kwart, het midden en het onderste kwart van de EU-ranglijst.
De staafdiagrammen onder de ‘BWT-wielen’ (de visualisaties van de brede-welvaarttrends) – waarin de positie van Nederland in de EU-27 wordt weergegeven – zijn gemaakt met behulp van bovenstaande methode om de positie van Nederland in de EU om te rekenen naar een percentage. Het aantal landen voor de berekening van de positie in de EU verschilt per indicator. Daardoor kan de staaf voor de Nederlandse positie op de ene indicator laag zijn maar grijs gekleurd, terwijl de staaf voor een andere indicator hoger is maar rood gekleurd.
Waar de ontwikkeling van de Nederlandse positie op de EU-ranglijst door de tijd is gevolgd, is geen rekening gehouden met methodebreuken in de tijdreeksen van Europese landen. In de statistische analyse van Nederlandse tijdreeksen wordt uiteraard wel rekening gehouden met methodebreuken.
5.3 Meest recente jaarlijkse mutaties
In de visualisaties over de brede welvaart ‘hier en nu’, ‘later’ en ‘elders’ (de ‘BWT-wielen’) wordt voor iedere indicator de meest recente jaarlijkse mutatie gemeten. Het gaat hier nadrukkelijk om een verschil tussen twee puntschattingen.
De meest recente mutatie betreft de verandering tussen de twee meest recente datapunten gedeeld door het aantal jaren tussen deze datapunten. Dit cijfer is bij benadering een weergave voor de meest recente jaar-op-jaarmutatie. Van de 70 indicatoren in de drie dashboards – 28 indicatoren voor de brede welvaart ‘hier en nu’, 22 voor de brede welvaart ‘later’, 20 voor de brede welvaart ‘elders’ – gaat het bij 65 indicatoren om een mutatie over 1 jaar en bij 4 indicatoren om een mutatie over 2 jaren en bij 1 indicator om een mutatie over 4 jaren.
Voor een indicator die als percentage wordt uitgedrukt, wordt de mutatie berekend in procentpunten. Bijvoorbeeld, de tevredenheid met het leven daalde van 84,8 procent in 2020 naar 83,6 procent in 2021. De meest recente jaarlijkse mutatie is een afname van 1,2 procentpunt ten opzichte van een jaar eerder.
Voor een indicator die niet als percentage wordt uitgedrukt, wordt een procentuele mutatie berekend. Daarbij wordt het verschil tussen de indicatorwaarden in het laatste en voorlaatste jaar uitgedrukt als percentage van de waarde in het voorlaatste jaar. Bijvoorbeeld, het volume van de werkelijke individuele consumptie per inwoner nam toe van 24 863 euro in 2020 naar 25 754 euro in 2021 (in prijzen van 2015). De meest recente jaarlijkse mutatie is een groei van 3,6 procent op jaarbasis.
Voor iedere indicator is statistisch getest of de meest recente jaarlijkse mutatie significant is. Hiervoor gebruiken we twee methoden. Voor indicatoren uit enquêtes zijn betrouwbaarheidsintervallen bekend. Voor deze indicatoren is de significantie van de meest recente jaarlijkse mutatie bepaald aan de hand van het betrouwbaarheidsinterval rond de meest recente jaarlijkse mutatie. Een jaar-op-jaar mutatie is significant indien de waarde nul niet binnen dat betrouwbaarheidsinterval valt.
Voor alle overige indicatoren wordt de significantie van de mutatie bepaald op basis van eenvoudige structurele tijdreeksmodellen die zijn gebaseerd op stochastische trendmodellen. De meest recente jaarmutatie wordt berekend als het verschil tussen de schattingen van het geselecteerde tijdreeksmodel voor het laatste jaar en het voorlaatste jaar. Het structurele tijdreeksmodel genereert de betrouwbaarheidsmarges rond de meest recente jaarmutatie. Met deze marges wordt – net als voor de indicatoren die afkomstig zijn uit CBS-enquêtes – de significantie van de mutatie bepaald. Een jaar-op-jaarontwikkeling is significant indien de waarde nul niet binnen dat betrouwbaarheidsinterval valt.
Als de trendlijn van een structureel tijdreeksmodel de originele tijdreeks exact volgt en de onder- en bovenmarges van het betrouwbaarheidsinterval niet of nauwelijks van elkaar verschillen, spreken we van ‘overfitten’. Het model vangt niet alleen de trend maar ook een deel van de variatie (de ‘ruis’). In het geval van ‘overfitten’ is de meest recente jaarlijkse mutatie niet significant en krijgt het de kleur grijs. De aanwezigheid van ‘overfitten’ is bepaald aan de hand van modeluitkomsten voor de hoeveelheid ‘ruis’ en voor de ruimte tussen de onder- en bovenmarges van het betrouwbaarheidsinterval van de mutatie. Bij een minimale hoeveelheid ‘ruis’ en geen of nauwelijks verschil tussen de marges van het betrouwbaarheidsinterval is sprake van ‘overfitten’. Voor alle indicatoren waarvoor op deze wijze werd vastgesteld dat de meest recente jaarlijkse mutatie significant was, zijn de statistische uitkomsten handmatig gecontroleerd.
De coronacrisis kan zorgen voor sterk afwijkende waarden voor verslagjaar 2021 en voor grote, statistisch significante mutaties. Het is de vraag of deze waarden en de bijbehorende mutaties uitzonderlijk zijn (‘uitbijters’). Uitbijters zijn gesignaleerd met behulp van de gestandaardiseerde innovaties van de structurele tijdreeksmodellen. Wanneer de gestandaardiseerde innovaties groot zijn – d.w.z. wanneer ze buiten het interval [-2, 2] vallen – dan is mogelijk sprake van een uitbijter. Deze constatering is een signaal dat naar de onderliggende data moet worden gekeken. De controle op uitbijters wordt alleen uitgevoerd wanneer geen sprake is van ‘overfitten’ in het structurele tijdreeksmodel en de mutatie statistisch significant is.
Voor drie indicatoren is geen sprake van ‘overfitten’ in het structurele tijdreeksmodel en wel van een uitbijter in het meest recente jaar. Dit betreft de indicatoren fysieke kapitaalgoederenvoorraad, hoogopgeleide bevolking en hernieuwbare energie. De fysieke kapitaalgoederenvoorraad groeide tussen 2019 op 2020 significant met 4,1 procent. Het gaat echter om kapitaalgoederenvoorraad per gewerkt uur. Tussen 2019 en 2020 nam het aantal gewerkte uren significant af (met 3,2 procent), waarschijnlijk als gevolg van de eerste lockdown tijdens de coronapandemie. Het betreft dus een reëel verschijnsel. Het aandeel hernieuwbare energie in het energieverbruik steeg van 8,9 naar 11,5 procent, een statistisch significante groei van 2,6 procentpunt. Deze snelle stijging kan worden gezien als een functie van de sterke toename van het opgesteld vermogen hernieuwbare elektriciteit (in megawatt elektrisch vermogen per miljoen inwoners). Dit vermogen steeg van 2020 op 2021 met 24,6 procent. Het percentage van de bevolking van 15-74 jaar dat een hoger onderwijs diploma heeft nam tussen 2020 en 2021 significant toe met 1,4 procent. Dit is een voortzetting van een trend die al langere tijd zichtbaar is. De betreffende mutaties zijn groot maar er is een goede verklaring voor. De kleur van de mutaties is daarom gehandhaafd.
5.4 Verdeling over bevolkingsgroepen
In de visualisaties over de verdeling van de brede welvaart wordt een selectie van de waarden van indicatoren voor de brede welvaart ‘hier en nu’ getoond voor verschillende bevolkingsgroepen, verdeeld naar geslacht, leeftijd, onderwijsniveau en migratieachtergrond.2) In die visualisaties worden sommige bevolkingsgroepen rood of groen gekleurd. Deze kleurcodes worden op hun beurt gebruikt om de samenvattende visualisatie over de verdeling van de brede welvaart te maken.
Een groene kleur geeft aan dat de betreffende bevolkingsgroep op dit terrein een hogere brede welvaart heeft dan het gemiddelde voor de hele bevolking bij de betreffende indicator. Een rode kleur geeft aan dat de betreffende bevolkingsgroep op dit terrein een lagere brede welvaart heeft dan gemiddeld. Mannen en vrouwen zijn tegen elkaar afgezet en niet tegen het gemiddelde.
Sommige bevolkingsgroepen zijn in de visualisaties groen of rood gekleurd. Voor indicatoren op basis van steekproefonderzoeken is deze kleur gebaseerd op statistisch significante verschillen. Een bepaalde groep is groen of rood gekleurd als de geschatte waarde voor deze groep significant afwijkt van de geschatte waarde voor de gehele bevolking (mannen en vrouwen worden met elkaar vergeleken). Voor deze editie van de Monitor is gekeken naar de variantie van het verschil tussen de Nederlandse bevolking en een bevolkingsgroep om te toetsen of de betreffende bevolkingsgroep afwijkt van de bevolking als geheel. Er wordt ook rekening gehouden met het feit dat de bevolkingsgroep zelf deel uitmaakt van dit totaal. Hierbij is een significantieniveau van 5 procent gehanteerd en is altijd tweezijdig getoetst.
De indicatoren voor materiële welvaart (gestandaardiseerd besteedbaar inkomen en vermogen) zijn op basis van integrale registergegevens samengesteld. Daar kan geen gebruik worden gemaakt van bovenstaande methode. In die gevallen is geen sprake van schattingen met bijbehorende betrouwbaarheidsmarges. Voor deze indicatoren zijn groepen groen of rood gekleurd als het cijfer voor een bepaalde bevolkingsgroep meer dan 5 procent afwijkt van het cijfer voor de gehele bevolking. De keuze voor die grenswaarde van 5 procent is gemaakt in overleg met de inhoudsdeskundigen.
In de monitor wordt de verdeling van de brede welvaart gemeten door per indicator cijfers uit te splitsen naar de achtergrondkenmerken van mensen: geslacht, leeftijd, onderwijsniveau en migratieachtergrond. Deze achtergrondkenmerken zijn echter niet onafhankelijk. Mensen met een niet-westerse migratieachtergrond zijn bijvoorbeeld gemiddeld relatief jong, mensen met een laag opleidingsniveau zijn gemiddeld juist ouder. Om te kijken naar de effecten van deze samenhangen, hebben we per indicator een multivariate analyse uitgevoerd: voor de enquête-gebaseerde indicatoren een Multipele Classificatie Analyse (MCA); voor de register-gebaseerde indicatoren Quantile Regression. De multivariate analyses leveren gestandaardiseerde cijfers op. We keken of op basis van deze gestandaardiseerde cijfers dezelfde groepen de kleuren groen/rood krijgen. Alleen als dat niet het geval is, wordt dit in de tekst benoemd. In de visualisaties zijn dus de ‘ruwe’, ongestandaardiseerde cijfers weergegeven.
De tekst over de verdeling van de brede welvaart beschrijft niet alleen de situatie in 2021 beschreven (2020 voor inkomen en vermogen). Het kijkt ook naar veranderingen in de verdeling ten opzicht van het basisjaar 2019. Daarbij is per indicator weergegeven of het totaalcijfer statistisch significant is toe- of afgenomen. Vervolgens is gekeken of een subgroep in het recentste meetjaar statistisch significant meer of minder afwijkt van het totaal dan in het basisjaar. Als dat het geval is, krijgt deze groep een groene of rode markering. Groen betekent dat de subgroep zich, in termen van brede welvaart, positiever heeft ontwikkeld dan het totaal. Rood betekent dat de subgroep zich relatief negatief heeft ontwikkeld. Voor de indicatoren over inkomen en vermogen is, vanwege de integrale aard van de bronbestanden, een statistische toets niet mogelijk. In overleg met de inhoudsdeskundigen is daar gekozen voor de volgende aanpak: als de ontwikkeling van een subgroep meer of minder dan 2 procentpunten positiever of negatiever is dan de ontwikkeling van het totaalcijfer, krijgt de betreffende subgroep een groene (positiever) of rode (negatiever) kleur. Positieve en negatieve ontwikkelingen van subgroepen ten opzichte van het totaal worden ook in de tekst beschreven.
5.5 Stapeling van (on)gunstige uitkomsten
Dit is de vierde editie van de Monitor dat ingaat op de mate waarin er op individueel niveau sprake is van stapeling van gunstige en ongunstige uitkomsten. Om te onderzoeken op hoeveel indicatoren iemand op individueel niveau een hoge of een lage welvaart ervaart, moeten de betreffende indicatoren beschikbaar zijn voor dezelfde personen. Omdat veel van de indicatoren voor de verdeling van brede welvaart uit enquêteonderzoeken komen, is dat niet altijd het geval. Het onderzoek Sociale samenhang & Welzijn (SSW) bevat de meeste indicatoren van brede welvaart ‘hier en nu’ en wordt daarom als basis gebruikt voor het onderzoek naar cumulatie. Daaraan zijn gegevens uit de Integrale Inkomens- en Vermogensstatistiek gekoppeld, zodat ook gegevens over het inkomen en vermogen gebruikt kunnen worden. De gegevens over inkomen en vermogen hebben betrekking op 2020; de rest van de gegevens gaat over 2021.
Er zijn indicatoren geselecteerd uit de acht thema’s van de brede welvaart ‘hier en nu’. Het streven bij deze selectie was om één indicator mee te nemen voor elk van de acht thema’s, idealiter een indicator die beschikbaar is voor de gehele volwassen bevolking. Voor de thema’s materiële welvaart en samenleving is in overleg met inhoudelijke experts uiteindelijk gekozen voor twee indicatoren. Het thema arbeid en vrije tijd omvat ook twee indicatoren, om beide aspecten van het thema te kunnen beschrijven. Uiteindelijk bleken er voor zes van de acht thema’s bruikbare gegevens beschikbaar. Voor de thema’s veiligheid en milieu zijn geen gegevens beschikbaar die op persoonsniveau aan de andere gegevens gekoppeld konden worden. In de tabel hieronder zie je welke indicatoren gebruikt zijn voor dit onderzoek, en ook wanneer er sprake is van een gunstige of ongunstige uitkomst.
Van de negen geselecteerde indicatoren is alleen arbeidsparticipatie niet voor de hele volwassen bevolking relevant. De beroepsbevolking heeft namelijk alleen betrekking op personen tot 75 jaar. Er is daarom voor gekozen dat 75-plussers voor deze indicator geen ongunstige uitkomst kunnen hebben. Voor hen is de uitkomst neutraal als ze geen betaald werk hebben en gunstig als ze dat wel hebben.
Thema | Indicator | Ongunstig | Midden | Gunstig |
---|---|---|---|---|
Subjectief welzijn | Tevredenheid met het leven | Score 1 t/m 4 | Score 5-6 | Score 7 t/m 10 |
Materiële welvaart | Gestandaardiseerd besteedbaar huishoudensinkomen | Laagste 20%-groep | Middelste 3 20%-groepen | Hoogste 20%-groep |
Vermogen van het huishouden | Laagste 20%-groep | Middelste 3 20%-groepen | Hoogste 20%-groep | |
Gezondheid | Ervaren gezondheid | Minder dan goed | - | (Zeer) goed |
Arbeid en vrije tijd | Arbeidsparticipatie | Heeft geen betaald werk, jonger dan 75 jaar | Heeft geen betaald werk, 75 jaar of ouder | Heeft betaald werk |
Tevredenheid met de hoeveelheid vrije tijd | Score 1 t/m 4 | Score 5-6 | Score 7 t/m 10 | |
Wonen | Tevredenheid met de woning | Score 1 t/m 4 | Score 5-6 | Score 7 t/m 10 |
Samenleving | Vertrouwen in mensen | Heeft geen vertrouwen | - | Heeft wel vertrouwen |
Vertrouwen in instituties (politie, rechters, Tweede Kamer) | Vertrouwen in geen van de drie instituties | Vertrouwen in een of twee instituties | Vertrouwen in alle drie instituties | |
Op persoonsniveau wordt geteld op hoeveel van de geselecteerde indicatoren iemand een gunstige of ongunstige uitkomst heeft. Mensen die op zeven of meer indicatoren een gunstige uitkomst hebben, vormen de bovenkant van de verdeling. Mensen die op drie of meer indicatoren een ongunstige uitkomst hebben, vormen de onderkant van de verdeling. De rest van de mensen zit in het midden. Personen met meer dan twee missende waarden zijn bij de analyses buiten beschouwing gelaten, waardoor er in totaal gegevens beschikbaar zijn van 6 258 personen van 18 jaar en ouder.
Bij de gehanteerde methode zijn een aantal keuzes gemaakt: de geselecteerde indicatoren, de waarden per indicator die wijzen op een (on)gunstige uitkomst, en de afbakening van de bovenkant en onderkant van de verdeling van brede welvaart. Deels zijn deze keuzes gebaseerd op de acht thema’s in de brede welvaart ‘hier en nu’, deels kwamen ze tot stand na overleg met inhoudsdeskundigen, en deels vloeien ze voort uit de beschikbaarheid van de data. Deze keuzes hebben mogelijk gevolgen voor de uitkomsten van de analyses, waardoor de resultaten met enig voorbehoud moeten worden geïnterpreteerd.
- Keuze van indicatoren. Indien bijvoorbeeld voor het thema vrije tijd de indicator beschikbare vrije tijd (in minuten) was gehanteerd, waren de uitkomsten mogelijk anders geweest.
- Keuze voor de afbakening van (on)gunstige uitkomsten. Voor elk van de indicatoren is een keuze gemaakt over wanneer we spreken van een gunstige of ongunstige uitkomst. Bij sommige indicatoren ligt deze keuze voor de hand, bijvoorbeeld bij vertrouwen in mensen. Bij andere indicatoren ligt deze keuze minder voor de hand. Bij het huishoudensinkomen is er nu bijvoorbeeld voor gekozen om de hoogste 20 procent als gunstig te classificeren, en de laagste 20 procent als ongunstig.
- Keuze voor de afbakening van de bovenkant en onderkant van de verdeling van brede welvaart. Het streven bij deze afbakening was om zowel aan de bovenkant als onderkant van de verdeling een groep van ongeveer 20 procent van de bevolking te hebben. De grenswaarden zijn zo gekozen dat die verdeling zo dicht mogelijk benaderd wordt. De afbakening aan de bovenkant van de verdeling (zeven of meer ‘groene’ uitkomsten) betreft 25,7 procent van de personen. Aan de onderkant van de verdeling (drie of meer ‘rode’ scores) gaat het om 18,2 procent van de personen.
5.6 Nowcasting en versnelling van cijfers
Het CBS streeft ernaar de tijdigheid van de statistische informatie in de Monitor te verhogen. Voor zoveel mogelijk indicatoren moet een cijfer voor het jaar t-1 (dat wil zeggen het jaar voorafgaand aan het publicatiejaar t) beschikbaar zijn. Voor deze 2022-editie van de Monitor betreft dat cijfers voor het jaar 2021.
Sommige indicatoren worden snel geproduceerd en zijn beschikbaar voor het jaar t-1. De productie van andere indicatoren kost meer tijd. Hiervoor heeft het meest recente cijfer betrekking op t-2 of t-3, een enkele keer op een eerder jaar.
De tijdigheid van een aantal indicatoren is verhoogd door te investeren in een versnelling van het productieproces. Dit geldt bijvoorbeeld voor de cijfers over broeikasgasemissies. Omdat zo’n versnelling niet altijd mogelijk is, is voor een aantal indicatoren het cijfer voor het jaar t-1 geraamd door middel van nowcasting.
Nowcasting is een methode waarbij cijfers voor recentere jaren worden toegevoegd aan een bestaande tijdreeks. Het is een modelmatige schatting waarbij op basis van het verleden geschatte patronen worden gecombineerd met gegevens die wel beschikbaar zijn over de verslagperiode om zo het meest recente ontbrekende deel zo goed mogelijk bij te schatten. De nauwkeurigheid van de nowcast verschilt per statistiek en hangt mede af van de stabiliteit van de historische relaties tussen de tijdreeks en de hulpinformatie, waarbij nooit alleen vanuit de tijdreeks zelf wordt gewerkt. Nowcasting is een manier om de tijdigheid van de informatie te verhogen, niet om een cijfer naar de toekomst door te trekken.
De methoden en uitkomsten van de nowcasting van indicatoren in de Monitor, zijn beschreven en verantwoord in twee rapporten: een over de indicatoren in de thema’s milieu, duurzaamheid en landbouw en een over de indicatoren in de thema’s R&D, overheidsuitgaven, armoede en inkomen, criminaliteit en gezondheid.
5.7 Samengestelde index
Brede welvaart is een zeer divers en complex fenomeen. In de definities van de Monitor omvat het zeventig indicatoren in veertien thema’s en drie dimensies (‘hier en nu’, ‘later’ en ‘elders’). Er zijn twee manieren om de brede welvaart in al haar diversiteit in beeld te brengen. De eerste manier is het maken van een samengestelde index waarin de indicatoren voor thema’s en dimensies worden gewogen tot een enkel cijfer. De tweede manier is het visualiseren van de hele indicatorenset en wel in een zodanige samenhang dat de lezer de ontwikkeling van de brede welvaart uit de visualisaties kan afleiden. Conform de aanbeveling van de CES Recommendations is in de Monitor gekozen voor laatstgenoemde.3)
Er zijn sterke analytische en normatieve redenen geen samengestelde index te maken. Een onoverkomelijk bezwaar is dat er geen objectieve manier is om de ‘juiste’ gewichten af te leiden waarmee een index kan worden samengesteld: voor een goede weging is volledige informatie nodig over de feitelijke preferenties van de hele bevolking; deze zijn grotendeels onbekend, wellicht zelfs onkenbaar. Ze zijn bovendien voor ieder individu anders. Een samengestelde index van de brede welvaart van een hele bevolking is per definitie niet representatief voor de brede welvaart van specifieke bevolkingsgroepen. Daarmee is iedere weging arbitrair, ook wanneer alle indicatoren en thema’s een gelijk gewicht krijgen.
Essentiële informatie kan bovendien uit zicht raken. Zo zou een index van de brede welvaart ‘later’ bestaan uit informatie over de vier soorten kapitaal (economisch, menselijk, sociaal en natuurlijk). Daarin zou impliciet de veronderstelling zitten dat de vier soorten kapitaal onderling vervangbaar zijn, wat deels onjuist is. Iedere soort kapitaal is essentieel voor het functioneren van een aspect van onze samenleving. Natuurlijk kapitaal is kritiek: zonder natuurlijk kapitaal is leven onmogelijk. In een samengestelde index verdwijnt een eventuele daling van een van de kapitalen uit het oog.
5.8 Beslisregels
Niet iedere indicator in de Monitor wordt beschreven. We hebben beslisregels opgesteld om te voorkomen dat de waarnemingen in de tekst gemaakt worden op basis van persoonlijke interpretaties of voorkeuren.
De beslisregels zijn een hulpmiddel en geen ijzeren raamwerk. Ze zijn bedoeld om de schrijvers van de Monitor te helpen op momenten dat moeilijke keuzes gemaakt moeten worden. Leesbaarheid staat voorop.
De beslisregels hebben alleen betrekking op het verhaal in de tekst van de Monitor. Alle statistische informatie is zichtbaar; alle onderliggende data zijn toegankelijk; alle indicatoren zijn in visualisaties weergegeven. De onderliggende data en metadata worden openbaar gemaakt in tabellen bij de Monitor op de website van het CBS.
De Monitor is zo neutraal mogelijk geschreven: het CBS doet geen uitspraken over wenselijke ontwikkelingen, bijvoorbeeld door resultaten te benoemen als ‘goed’, ‘slecht’, ‘positief’ of ‘negatief’. Het CBS doet ook geen uitspraken over de effectiviteit van beleid of over de maatschappelijke effecten van beleid op een bepaald terrein. In de beschrijving van de uitkomsten is zo dicht mogelijk gebleven bij de manier waarop indicatoren zijn gemeten en de manier waarop trends, posities in de EU en jaarlijkse veranderingen zijn bepaald. Het is aan de politiek en het beleid om iets met de resultaten te doen.
Beslisregels voor de beschrijving van brede-welvaarttrends
De beschrijving van trends en posities in de brede welvaart ‘hier en nu’, ‘later’ en ‘elders’ is tot stand gekomen op basis van drie beslisregels:
- Beslisregel 1: trends of posities die ‘groen’ of ‘rood’ zijn worden beschreven. Trends of posities die ‘grijs’ zijn, worden in principe niet beschreven.
- Beslisregel 2: voor iedere indicator wordt onderzocht of de richting van de achtjaarlijkse trend in de referentieperiode van deze editie (2014-2021) van kleur is veranderd (bijvoorbeeld van ‘groen’ naar ‘rood’) ten opzichte van de referentieperiode van de editie van 2021 (2013-2020). Nergens wordt gespeculeerd over de richting van de trend in de toekomst.
- Beslisregel 3: voor iedere indicator wordt onderzocht of de positie van Nederland op de EU-ranglijst in het meest recente jaar van kleur is veranderd (bijvoorbeeld van ‘grijs’ naar ‘groen’) ten opzichte van het voorgaande jaar.
Deze beslisregels worden ook toegepast op de trends en posities in de schokbestendigheid van de brede welvaart.
Beslisregels voor de beschrijving van de verdeling van de brede welvaart
De beschrijving van de verdeling van brede welvaart ‘hier en nu’ over bevolkingsgroepen is tot stand gekomen op basis van twee beslisregels:
- Beslisregel 1: Voor iedere indicator worden in de tekst de resultaten beschreven met betrekking tot die bevolkingsgroepen waarvan de indicatorwaarde significant afwijkt van het gemiddelde. Mannen en vrouwen zijn tegen elkaar afgezet en niet tegen het gemiddelde.
- Beslisregel 2: Per indicator wordt beschreven welke deelgroepen zich, ten opzichte van het totaalcijfer van die indicator, statistisch significant positiever of negatiever hebben ontwikkeld.
Beslisregels voor de beschrijving van de SDG’s in de Nederlandse context
De beschrijving van trends en posities met betrekking tot de 23 beleidsthema’s van de SDG’s is tot stand gekomen op basis van drie principiële beslisregels en drie regels met betrekking tot patronen in de data.
Drie principiële regels:
- Beslisregel 1: Harde beleidsdoelstellingen en kernindicatoren van kabinet en EU worden altijd beschreven, ongeacht de kleurcode van de trend of de positie.
- Beslisregel 2: De ontwikkeling van SDG-indicatoren wordt altijd beschreven, ongeacht de kleurcode van de trend of de positie.
- Beslisregel 3: De duiding van trends en posities is specifiek voor de context waarin ze worden gebruikt.
Drie regels met betrekking tot patronen in de data:
- Beslisregel 4: Indicatoren waarvan de trend en/of de positie in vergelijking met het voorgaande jaar van kleur is veranderd (bijvoorbeeld een indicator met een groene trend in de trendperiode 2013-2020 en een grijze trend in de trendperiode 2014-2021), worden altijd beschreven. Beschrijvingen van veranderingen worden gemaakt op basis van de huidige selectie van indicatoren.
- Beslisregel 5: Trends of posities die ‘groen’ of ‘rood’ zijn worden beschreven.
- Beslisregel 6: Trends of posities die ‘grijs’ zijn, worden in principe niet beschreven, behalve wanneer het SDG’s of beleidsdoelstellingen betreft of wanneer het voor het verhaal noodzakelijk is (bijvoorbeeld omdat verschillende indicatoren overduidelijk bij elkaar horen).
3) Er is een groeiende consensus dat voor het meten van brede welvaart niet een samengestelde index maar een conceptuele indicatorenset nodig is. Zie ESB, “Dossier Meten van welvaart”, inhoud 4772S, 11 april 2019.