Het dataverzamelingsproces van de GE/LSM-k sinds 2021, de veranderingen t.o.v. eerdere jaren en de invloed daarvan op de onderzoeksuitkomsten.
Over deze publicatie
De dataverzamelingsstrategie van de Gezondheidsenquete/Leefstijlmonitor-kern vanaf 2021 en de veranderingen daarin sinds 2014. Door middel van simulatie is gekeken naar de impact van de wijzigingen. Hoe zouden de uitkomsten er in eerdere jaren hebben uit gezien als toen al de strategie van 2021 zou zijn toegepast?
Leeswijzer
Na een korte inleiding in paragraaf 1 beschrijft deze notitie in paragraaf 2 de veranderingen in het dataverzamelingsproces van de Gezondheidsenquête/Leefstijlmonitor-kern (GE/LSM-k) die sinds 2014 zijn opgetreden. Per 2021 wordt bij dit dataverzamelingsproces gewerkt met de zogeheten geoptimaliseerde doelgroepenbenadering.
In paragraaf 3 maakt de nota vervolgens inzichtelijk welke impact de wijzigingen hebben op de uitkomsten van het onderzoek. Dit is gedaan door de sinds 2021 gebruikte geoptimaliseerde doelgroepenbenadering te simuleren voor de onderzoeksjaren vanaf 2014. Op die manier ontstaat een beeld van hoe de uitkomsten van de GE/LSM-k zouden zijn geweest als de geoptimaliseerde doelgroepenbenadering al in 2014 zou zijn ingevoerd.
Tot slot staat in paragraaf 4 een gezamenlijk (CBS, RIVM en Trimbos-instituut) advies over hoe er met de bevindingen uit de simulatie kan worden omgegaan.
1. Inleiding
De Gezondheidsenquête (GE) is een jaarlijks onderzoek dat sinds 1981 wordt uitgevoerd door het Centraal Bureau voor de Statistiek. Sinds 2014 is de module met kernvragen uit de Leefstijlmonitor (LSM-k) onderdeel van de Gezondheidsenquête. Doel van het onderzoek is het geven van een beeld van de gezondheid, de leefstijl en het zorggebruik van de Nederlanders en de ontwikkelingen daarin. Daartoe wordt een vragenlijst voorgelegd aan een steekproef uit de Basisregistratie Personen (BRP), het Nederlandse bevolkingsregister. Sinds 2014 kunnen mensen meedoen aan het onderzoek via internet (CAWI) of aan-huis-interviews (CAPI).
In de afgelopen jaren zijn er veranderingen aangebracht in de benaderstrategie; de wijze waarop de data verzameld wordt bij de beoogde respondenten. Met ingang van 2021 is de zogeheten geoptimaliseerde doelgroepenbenadering ingevoerd. Voor deze benaderstrategie is gekozen om de samenstelling van de respons zo representatief mogelijk te laten zijn voor de Nederlandse bevolking. Ook is de strategie van geoptimaliseerde doelgroepenbenadering goedkoper ten opzichte van eerdere strategieën.
In deze nota leggen we uit hoe de geoptimaliseerde doelgroepenbenadering in zijn werk gaat. Ook beschrijven we de verschillende benaderstrategieën uit de periode 2014-2020.
Om goed inzicht te krijgen op de invloed van veranderingen op de uitkomsten van het onderzoek, hebben we de strategie van 2021 gesimuleerd op de data van 2014 tot en met 20191). Op die manier kon voor de belangrijkste kernvariabelen uit de GE/LSM-k geschat worden wat de uitkomsten zouden zijn geweest als de geoptimaliseerde doelgroepenbenadering al in 2014 zou zijn ingevoerd. Deze schattingen vergelijken we met de sinds 2014 gepubliceerde cijfers en daardoor ontstaat inzicht in het effect van de doelgroepenbenadering op de schattingen.
1) Deze simulatie is in 2020 uitgevoerd en liep daarom tot en met 2019. Later kon deze analyse niet uitgebreid worden met het jaar 2020, omdat in dat jaar door corona(maatregelen) de CAPI-waarneming deels niet kon worden uitgevoerd en de data hierdoor verstoord is.
2. Benaderstrategie GE/LSM-k
2.1 De jaren 2014-2020
Voor de GE/LSM-k trekt het CBS steekproeven uit de Basisregistratie Personen (BRP). We streven hierbij naar een minimum aantal respondenten (deelnemers) van 9500. Van 2014 tot en met 2016 kregen steekproefpersoon eerst een brief thuis kreeg met de vraag om via internet (CAWI) deel te nemen aan het onderzoek. Indien de steekproefpersoon niet deelnam via CAWI, ontvingen zijn een tweetal herinneringsbrieven. Wanneer zij niet meededen, maar ook niet expliciet weigerden mee te doen, werden ze herbenaderd voor een aan-huis-interview (CAPI). Vrijwel alle personen die in aanmerking kwamen voor CAPI werden daadwerkelijk herbenaderd. Een persoon kwam niet meer in aanmerking voor herbenadering als hij of zij was overleden of verhuisd. In 2016 kwam 92,9% van de CAWI-non-respons in aanmerking voor CAPI.
Met ingang van 2017 werden er vaste omvangen bij CAPI ingevoerd. Dat betekent dat het aantal mensen dat voor CAPI zou worden benaderd van tevoren werd vastgesteld, met als doel om de planning van de interviewers efficiënter te maken en van te voren de kosten van het dataverzamelingswerk te kunnen inschatten. Het percentage CAPI herbenadering ging daarbij van 92,9% in 2016 naar 83,1% in 2017. Dit betekende dus dat er in de stap van CAWI naar CAPI een uitdunning (niet herbenaderen) van ongeveer 10 procentpunten bij kwam. Deze uitdunning gebeurde aselect, ofwel willekeurig.
Een andere verandering was dat het aantal mensen dat benaderd werd voor CAWI werd vergroot. Zo waren we er zeker van dat er voldoende mensen overbleven voor de vaste CAPI-benadering, ook als de CAWI respons ineens hoger zou uitvallen. Dit had als effect dat de maximale vertekening groter werd. De coefficient of variation (CV) van de responskansen werd namelijk groter. De CV is een maat om aan te geven of de verdeling van de deelnemers aan een onderzoek lijkt op de verdeling in de bevolking. Deze vergelijking maken we op basis van bepaalde kenmerken, zoals geslacht, leeftijd en migratieachtergrond. Hoe kleiner de CV, des te meer de verdeling van de respondenten lijkt op de verdeling in de bevolking.
Met ingang van 2018 werden er twee grote wijzingen doorgevoerd.
De eerste wijziging was dat een incentive (beloning) in de vorm van een iPad verloting werd ingevoerd met als doel de CAWI respons te verhogen. Deelnemers aan het onderzoek maakten dus kans op een prijs. Daarop nam de CAWI respons met 3,6 procentpunten toe, van 34,1% in 2017 naar 37,7% in 2018. Het is niet bekend of het invoeren van de incentive een effect had op de CAPI respons en dit was ook lastig te meten omdat er tegelijkertijd doelgroepenbenadering werd ingevoerd: de tweede wijziging.
De tweede wijziging was de gedeeltelijke invoering van de doelgroepenbenadering bij CAPI. Van bepaalde doelgroepen, waarvan bekend is dat zij goed via CAWI responderen, worden minder mensen herbenaderd voor CAPI. De hierboven beschreven uitdunning en herbenadering werden dus selectief. Het idee van de doelgroepenbenadering was dat de CV van de responskansen kleiner zou worden en hiermee uiteindelijk de maximale vertekening verkleind werd. Zo vindt de correctie voor vertekening deels vooraf plaats en wordt deze niet meer alleen overgelaten aan de achteraf uitgevoerde weging.
Om de doelgroepenbenadering invulling te geven werd eerst een analyse gedaan om mensen op basis van achtergrondkenmerken te clusteren. Daarbij wordt gekeken naar de verwachte respons per waarnemingsmethode (CAWI en CAPI) van mensen met verschillende kenmerken op basis van data van de gerealiseerde respons uit voorgaande jaren. Mensen met verschillende kenmerken maar met eenzelfde verwachte respons worden geclusterd tot een doelgroep. De doelgroepen waren in 2018 gebaseerd op de kenmerken stedelijkheidsgraad van de woongemeente, gestandaardiseerd besteedbaar huishoudinkomen, leeftijd en migratieachtergrond2).
Voor 2018 werd als randvoorwaarde voor de clusteringsanalyse meegegeven dat er 8040 personen benaderd zouden worden voor een CAPI interview. Door die randvoorwaarde noemen we de doelgroepenbenadering van 2018 ‘gedeeltelijk’ en niet ‘optimaal’. Zonder de randvoorwaarde van het aantal voor CAPI te benaderen personen zouden minder personen voor CAPI zijn benaderd en zou de CV lager zijn uitgevallen.
Een effect van de invoering van de gedeeltelijke doelgroepenbenadering was dat de vertekening kleiner werd gemaakt omdat de verschillen in responskansen tussen groepen kleiner werden. Het overall responspercentage nam af omdat minder mensen uit goed responderende groepen herbenaderd werden voor CAPI en omdat het aantal mensen wat überhaupt herbenaderd werd afnam. De modeverhouding verschoof naar meer CAWI respons in de totale respons. In totaal werd in 2018 71,5% van de CAWI-non-respons herbenaderd via CAPI.
Met ingang van 2019 waren er kleine wijzingen in de doelgroepenindeling. Dit omdat de clusteringsanalyse opnieuw werd uitgevoerd, met recentere gerealiseerde responskansen als input, wat tot iets andere resultaten leidde. Stedelijkheidsgraad zat niet meer in de doelgroepenindeling van 2019 en er waren wijzigingen in de definities van migratieachtergrond en in de indelingen van de leeftijdscategorieën.
Er werd besloten om het aantal mensen dat voor CAPI werd benaderd gelijk te houden met het aantal van 2018: 8040 personen werden via CAPI herbenaderd. Door tegenvallende respons werden vanaf juli 2019 meer mensen voor CAWI-deelname benaderd om toch voldoende respons te verkrijgen. Het aantal mensen dat voor CAPI werd benaderd bleef gelijk. Dit zorgde ervoor dat het percentage CAPI herbenadering van 71,5% in 2018 daalde naar 69,7% in 2019.
In 20203) werden geen wijzingen doorgevoerd. De doelgroepenindeling bleef zoals in 2019 en de CAPI uitzet werd weer vastgesteld op 8040. Wel werd het percentage CAPI herbenadering per doelgroep licht gewijzigd, als gevolg van in 2019 waargenomen veranderingen in de responskansen per doelgroep per waarnemingsmethode.
2.2Benaderstrategie GE/LSM-k met ingang van 2021: geoptimaliseerde doelgroepenbenadering
Met ingang van 2021 werd de doelgroepenbenadering bij de GE/LSM-k geoptimaliseerd. Een van de wijzigingen was dat de randvoorwaarde voor het aantal voor CAPI te benaderen personen werd losgelaten. Minimalisering van de CV werd het doel. De randvoorwaarde van een minimumaantal van in totaal 9.500 respondenten, ongeacht of deze via CAWI of CAPI deelnamen, bleef wel gehandhaafd.
Vanaf 2021 is de doelgroepenindeling voor de GE/LSM-k gebaseerd op inkomen, leeftijd en migratieachtergrond. Deze kenmerken sluiten aan bij de doelgroepenindeling van eerdere jaren. De precieze indeling van de doelgroepen stelden we vast door een clusteranalyse uit te voeren op responsdata uit de eerste helft van 2019. Uit deze analyse kwamen acht doelgroepen, zie tabel 2.2.1.
2.2.1 Doelgroepen voor de Gezondheidsenquete 2021
zonder migratieachtergrond
zonder migratieachtergrond
zonder migratieachtergrond
met migratieachtergrond
met migratieachtergrond
met migratieachtergrond
laag inkomen
midden inkomen
hoog inkomen
laag inkomen
midden inkomen
hoog inkomen
0 t/m 11 jaar
2
2
2
1
1
7
12 t/m 24 jaar
3
3
7
8
1
3
35 t/m 44 jaar
3
3
3
5
5
5
45 t/m 64 jaar
3
7
4
5
5
5
65 jaar of ouder
3
7
6
5
5
4
Leesvoorbeeld bij tabel 2.2.1: doelgroep 1 bestaat uit mensen met een migratieachtergrond van 0 tot en met 11 jaar uit huishoudens uit de inkomenscategorie laag of midden. En uit mensen met een migratieachtergrond van 12 tot en met 24 jaar uit huishoudens uit de inkomenscategorie midden.
Ten opzichte van de doelgroepen in 2020 is er in 2021 een leeftijdsgroep minder: voorheen werden 65-74 jaar en 75+ apart meegenomen, nu is er één groep voor 65+. Daarnaast zijn er op basis van verschillen in responskansen andere groepen samengevoegd tot één doelgroep. Dit leidde tot een aantal verschillen:
In vergelijking met 2020 werden in 2021 meer mensen benaderd voor CAWI (van 17.112 in 2020 tot 19.632 in 2021).
Het aantal mensen dat benaderd werd voor CAPI nam af (van 8.040 in 2020 tot 6.624 in 2021).
Het percentage personen uit de herbenaderbare CAWI nonrespons dat via CAPI zou worden herbenaderd in 2021 werd geschat op 55,2%4).
Tabel 2.2.2 geeft een samenvatting van de waarneemstrategie bij de GE/LSM-k in de jaren 2014 tot en met 2021.
2) Er kan alleen naar kenmerken gekeken worden die integraal, dus voor iedereen, beschikbaar zijn. Clusteren naar onderwijsniveau kan bijvoorbeeld niet, omdat onderwijsniveau een doelvariabele is van de GE/LSM-k. Het onderwijsniveau is dus niet vooraf voor iedereen bekend, maar wordt in de vragenlijst zelf uitgevraagd. 3) In 2020 brak de coronaepidemie uit. CAPI-waarneming was in delen van het jaar niet of met beperkingen mogelijk. Het CBS heeft door het inzetten van tijdreeksmodellen gepubliceerd over het jaar 2020. Die tijdreeksmodellen maakten gebruik van informatie uit eerdere jaargangen over het verschil tussen CAWI en CAPI-respons. Op die manier werd zo goed mogelijk gecompenseerd voor het deels wegvallen van CAPI-waarneming. Meer informatie hierover is te vinden in Smeets & Van den Brakel, 2021. 4) In 2021 was het door corona(maatregelen) niet mogelijk om de vooraf geplande waarneemstrategie in zijn geheel uit te voeren. Het was, net als in grote delen van 2020, niet of slechts met beperkingen mogelijk aan-huis waar te nemen. Door de inzet van tijdreeksmodellen heeft het CBS toch gepubliceerd over 2021, zie ook voetnoot 2.
3. Simulatie van de 2021-strategie op data vanaf 2014
In 2020 hebben we de geoptimaliseerde benaderstrategie van 2021 gesimuleerd op de GE/LSM-k-data van de jaren 2014 tot en met 20195). Er is daarbij dus gedaan alsof in die jaren al de geoptimaliseerde benaderstrategie werd toegepast die pas vanaf 2021 daadwerkelijk is ingevoerd. Hierbij werd de verhouding CAWI-CAPI waarneming, uit het steekproefontwerp van 2021, per doelgroep gesimuleerd. Dit deed het CBS door het responsbestand van een bepaald jaar te pakken en daaruit met bootstrapping responsen te trekken. Deze nieuwe dataset had daarmee dezelfde omvang per doelgroep als in het steekproefontwerp van de GE/LSM-k van 2021. Dit gesimuleerde responsbestand werd vervolgens gewogen en op basis van dit gewogen bestand werden voor 17 kernvariabelen (tabel 3.1) nieuwe cijfers geschat. Dit gehele proces herhaalden we vervolgens 1000 keer en van deze 1000 uitkomsten berekenden we vervolgens het gemiddelde. Hieruit volgde dan per kernvariabele voor ieder jaar een gesimuleerde schatting.
3.1 Overzicht onderzochte kernvariabelen
Onderwerp
Thema
doelpopulatie
Huisartscontact
Zorggebruik
0 jaar of ouder
Tandartscontact
Zorggebruik
0 jaar of ouder
Gebruik niet-voorgeschreven medicijnen
Gezondheid
0 jaar of ouder
Ervaren gezondheid
Gezondheid
0 jaar of ouder
Diabetes
Gezondheid
0 jaar of ouder
Psychische gezondheid (MHI)
Gezondheid
12 jaar of ouder
Beperkingen (OESO)
Gezondheid
12 jaar of ouder
Mantelzorg geven
Leefstijl/Gezondheid
16 jaar of ouder
(wel eens) Roken
Leefstijl
18 jaar of ouder
Dagelijks roken
Leefstijl
18 jaar of ouder
Drinken
Leefstijl
18 jaar of ouder
Overmatig alcoholgebruik
Leefstijl
18 jaar of ouder
Cannabis afgelopen jaar
Leefstijl
18 jaar of ouder
Obesitas (BMI ≥ 30)
Leefstijl
4 jaar of ouder
5 dagen voldoende groente
Leefstijl
1 jaar of ouder
Risicovolle seks
Leefstijl
16 jaar of ouder
Voldoen aan beweegrichtlijn
Leefstijl
12 jaar of ouder
De analyses werden per jaar gedaan op totaalniveau (alle respondenten uit de doelpopulatie) en voor de volgende deelpopulaties:
leeftijd (0 t/m 17, 18 t/m 64, 65 of ouder)
geslacht (man, vrouw)
migratieachtergrond (NL, westers, niet-westers)
inkomen (kwintiel 1 (laag), kwintiel 2 t/m 5).
De simulatieschattingen zijn vervolgens vergeleken met de eerder al gepubliceerde cijfers over de 17 kernvariabelen. De verschillen tussen de gesimuleerde en de gepubliceerde uitkomsten zijn vervolgens getoetst op statistische significantie.
Bij vijf kernvariabelen werden statistisch significante verschillen gevonden op totaalniveau tussen de gesimuleerde en de gepubliceerde cijfers. Die verschillen traden het meest op in de beginjaren van de GE/LSM-k, zie tabel 3.2.
3.2 Overzicht statistisch significante verschillen, in procentpunten, per kernvariabele, op totaalniveau
2014
2015
2016
2017
2018
2019
Gebruik niet-voorgeschreven medicijnen
2,2
1,6
1,5
Roken
1,4
1,3
Dagelijks roken
1,5
1,2
1,2
Overmatig alcoholgebruik
1,3
1
Voldoen aan beweegrichtlijn
-2,9
-2,3
-2,3
-2,1
-1,6
Op totaalniveau werden bij de 12 overige kernvariabelen dus geen statistisch significante verschillen gevonden6).
Dat de meeste en grootste verschillen werden gevonden in de beginjaren van de GE/LSM-k komt doordat de veranderingen in de waarneemstrategie vanaf 2014 stap voor stap hebben plaatsgevonden. De eerdere jaren wijken daardoor het meest af van de per 2021 doorgevoerde geoptimaliseerde doelgroepenwaarneming.
Voor de vijf kernvariabelen waarbij op totaalniveau statistisch significante verschillen werden gevonden in tenminste 1 jaar, worden in het vervolg van deze paragraaf de gesimuleerde cijfers en de gepubliceerde cijfers getoond op totaalniveau, zowel grafisch als in tabelvorm (grafiek 3.3 tot en met tabel 3.12). Dit om inzicht te krijgen in de omvang en richting van de verschillen en het verloop ervan in de tijd. In de bijlage zijn voor elk van de vijf betreffende kernvariabelen de cijfers per deelpopulatie te vinden. Verschillen die vet zijn weergegeven, zijn statistisch significant.
3.3 Gebruik niet-voorgeschreven medicijnen
jaar
simulatie (%)
gepubliceerd (%)
2014
36,4
38,7
2015
36,2
37,6
2016
36,8
38,4
2017
38,7
40,2
2018
39,6
40,1
2019
39,8
40,4
2020
39,8
2021
42
3.3 Gebruik niet-voorgeschreven medicijnen
jaar
simulatie (%)
gepubliceerd (%)
2014
36,4
38,7
2015
36,2
37,6
2016
36,8
38,4
2017
38,7
40,2
2018
39,6
40,1
2019
39,8
40,4
2020
39,8
2021
42
3.4 Gebruik niet-voorgeschreven medicijnen
simulatie
gepubliceerd
verschil
%
%
2014
36,4
38,7
2,2
2015
36,2
37,6
1,4
2016
36,8
38,4
1,6
2017
38,7
40,2
1,5
2018
39,6
40,1
0,5
2019
39,8
40,4
0,6
2020
39,8
2021
42,0
3.5 Roken, 18 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
24,3
25,7
2015
25,1
26,3
2016
22,9
24,1
2017
22
23,1
2018
21,8
22,4
2019
21,3
21,7
2020
20,2
2021
20,6
Bron: CBS, RIVM, Trimbos-instituut
3.5 Roken, 18 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
24,3
25,7
2015
25,1
26,3
2016
22,9
24,1
2017
22
23,1
2018
21,8
22,4
2019
21,3
21,7
2020
20,2
2021
20,6
Bron: CBS, RIVM, Trimbos-instituut
3.6 Roken, 18 jaar of ouder
simulatie
gepubliceerd
verschil
%
%
2014
24,3
25,7
1,4
2015
25,1
26,3
1,2
2016
22,9
24,1
1,3
2017
22
23,1
1,1
2018
21,8
22,4
0,5
2019
21,3
21,7
0,4
2020
20,2
2021
20,6
3.7 Dagelijks roken, 18 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
18,2
19,7
2015
18,4
19,5
2016
17,4
18,6
2017
16,2
17,2
2018
15,5
16
2019
15,5
15,9
2020
14,9
2021
15,2
Bron: CBS, RIVM, Trimbos-instituut
3.7 Dagelijks roken, 18 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
18,2
19,7
2015
18,4
19,5
2016
17,4
18,6
2017
16,2
17,2
2018
15,5
16
2019
15,5
15,9
2020
14,9
2021
15,2
Bron: CBS, RIVM, Trimbos-instituut
3.8 Dagelijks roken, 18 jaar of ouder
simulatie
gepubliceerd
verschil
%
%
2014
18,2
19,7
1,5
2015
18,4
19,5
1,2
2016
17,4
18,6
1,2
2017
16,2
17,2
1
2018
15,5
16
0,5
2019
15,5
15,9
0,4
2020
14,9
2021
15,2
3.9 Overmatig alcoholgebruik, 18 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
8,7
9,9
2015
8,5
9,5
2016
8,3
8,8
2017
8,8
9,2
2018
8
8,2
2019
8,4
8,5
2020
6,9
2021
7,3
Bron: CBS, RIVM, Trimbos-instituut
3.9 Overmatig alcoholgebruik, 18 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
8,7
9,9
2015
8,5
9,5
2016
8,3
8,8
2017
8,8
9,2
2018
8
8,2
2019
8,4
8,5
2020
6,9
2021
7,3
Bron: CBS, RIVM, Trimbos-instituut
3.10 Overmatig alcoholgebruik, 18 jaar of ouder
simulatie
gepubliceerd
verschil
%
%
2014
8,7
9,9
1,3
2015
8,5
9,5
1
2016
8,3
8,8
0,5
2017
8,8
9,2
0,4
2018
8
8,2
0,3
2019
8,4
8,5
0,1
2020
6,9
2021
7,3
3.11 Voldoen aan beweegrichtlijn, 12 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
46,5
43,6
2015
45,7
43,4
2016
45,3
43
2017
47,7
45,6
2018
47,2
46
2019
50
48,4
2020
51,9
2021
Bron: CBS, RIVM
3.11 Voldoen aan beweegrichtlijn, 12 jaar of ouder
jaar
simulatie (%)
gepubliceerd (%)
2014
46,5
43,6
2015
45,7
43,4
2016
45,3
43
2017
47,7
45,6
2018
47,2
46
2019
50
48,4
2020
51,9
2021
Bron: CBS, RIVM
3.12 Voldoen aan beweegrichtlijn, 12 jaar of ouder
simulatie
gepubliceerd
verschil
%
%
2014
46,5
43,6
-2,9
2015
45,7
43,4
-2,3
2016
45,3
43
-2,3
2017
47,7
45,6
-2,1
2018
47,2
46
-1,2
2019
50
48,4
-1,6
2020
51,9
2021
5) Deze analyses zijn in 2020 uitgevoerd, waardoor het statistiekjaar 2020 niet is meegenomen. Later was het niet mogelijk het statistiekjaar 2020 nog toe te voegen. Dit vanwege de gevolgen van de coronapandemie waardoor er in 2020 veel minder CAPI-waarneming was dan vooraf gepland. Op het afwijkende 2020-databestand kon de voor 2021 beoogde geoptimaliseerde waarneemstrategie niet worden gesimuleerd. 6) Een enkele keer werd bij deze variabelen op deelpopulatieniveau wel een statistisch significant verschil gevonden.
4. Aanbeveling voor gebruik van de cijfers uit GE/LSM-k
In deze nota is beschreven welke veranderingen sinds 2014 zijn doorgevoerd in het dataverzamelingsproces van de GE/LSM-k en is ook ingegaan op de redenen voor die veranderingen. Belangrijke veranderingen waren:
De invoering van vaste CAPI-omvangen door middel van aselecte uitdunning in 2017.
De gedeeltelijke invoering van doelgroepenbenadering en de invoering van incentives in 2018.
De invoering van de geoptimaliseerde doelgroepenbenadering in 2021.
Ook is voor 17 kernvariabelen van het onderzoek gesimuleerd hoe de uitkomsten over de jaren 2014-2019 er waarschijnlijk hadden uitgezien als de huidige waarneemstrategie, die sinds 2021 in gebruik is, in al die jaren al in gebruik was geweest.
Uit die simulatie komt naar voren dat er voor 12 van de 17 kernvariabelen geen statistisch significante verschillen zouden zijn geweest. Bij de overige vijf variabelen is dat echter wel het geval. Daar lijkt sprake van methodebreuken als gevolg van de doorgevoerde wijzigingen. Bij die variabelen zien we dat vooral de uitkomsten van de oudere onderzoeksjaren afwijkend uit de simulatie komen. Dit hangt waarschijnlijk samen met de stapsgewijs doorgevoerde veranderingen. Elke wijziging kan een effect hebben en de optelsom van die effecten kan dus groter worden naarmate er over de tijd meer veranderingen zijn doorgevoerd. De simulatie geeft een beeld van het totale effect van de veranderingen. Het is niet aan te geven welk deel daarvan veroorzaakt wordt door selectie-effecten (doen er andere mensen mee?) en welk deel door mode-effecten (geven mensen via internet een ander antwoord dan via een aan-huis-interview?). Het CBS, RIVM en Trimbos-instituut willen in 2022 proberen meer zicht te krijgen op het effect van mode. De bevindingen van dat onderzoek zullen apart worden gepubliceerd.
CBS, RIVM en Trimbos-instituut adviseren gezamenlijk om de oorspronkelijk gepubliceerde cijfers, over de periode sinds 2014 te blijven zien als dé uitkomsten van de GE/LSM-k. Deze cijfers zijn onder andere te vinden op CBS-Statline. Een belangrijke reden hiervoor is de bevinding dat bij de meeste van de onderzochte variabelen geen sprake was van statistisch significante afwijkingen tussen de gepubliceerde en de gesimuleerde uitkomsten. Een andere reden is de wetenschap dat aanpassingen aan het proces van dataverzameling onvermijdelijk zijn bij een langlopend onderzoek als de GE/LSM-k. Veranderingen zullen ook in de jaren vanaf 2022 blijven optreden. Het streven daarbij zal altijd zijn om, gegeven bepaalde randvoorwaarden, een zo representatief mogelijk beeld van de gezondheid en leefstijl van de Nederlandse bevolking te geven. Het is echter niet uitgesloten dat aanpassingen in de methode in sommige gevallen invloed kunnen hebben op de schattingen. Ook zonder aanpassingen in het onderzoeksproces zullen wijzigingen optreden. De verhouding tussen de aandelen CAWI en CAPI in de respons verandert bijvoorbeeld door veranderingen in de bereidwilligheid om mee te doen aan het onderzoek.
Om de gesimuleerde uitkomsten van de jaren 2014-2019 te kunnen reproduceren heeft het CBS een bestand beschikbaar gesteld met daarin de daarvoor benodigde doelgroepsimulatie-weegvariabelen. Elke oorspronkelijke respondent uit de jaren 2014-2019 kan met behulp van dat bestand worden voorzien van een simulatiegewicht. De beschikbaarstelling gebeurt via CBS-Microdataservices en het bestand kan gebruikt worden door onderzoekers die aan de voorwaarden voor het gebruik van microdata (via Remote Access) voldoen. Door de doelgroepsimulatie-weegvariabele van bijvoorbeeld 2014 te koppelen aan het reguliere 2014-bestand van de GE/LSM-k, kunnen zowel de oorspronkelijk gepubliceerde uitkomsten als de simulatie-uitkomsten bepaald worden.
Bijlage
Gesimuleerde en gepubliceerde uitkomsten over het gebruik van niet-voorgeschreven medicijnen, naar achtergrondkenmerken
B1 Gebruik niet-voorgeschreven medicijnen, naar leeftijd
jaar
0-17 jaar: simulatie (%)
0-17 jaar: gepubliceerd (%)
18-64 jaar: simulatie (%)
18-64 jaar: gepubliceerd (%)
65 jaar of ouder: simulatie (%)
65 jar of ouder: gepubliceerd (%)
2014
29,8
33,9
39,1
40,5
34,8
37,7
2015
28,8
32,4
39,1
39,7
34,9
36,2
2016
28,2
31,6
39,9
40,8
35,9
37,8
2017
31,4
34,8
41,7
42,5
36,5
38,5
2018
31,6
32,4
43,2
43,4
36,7
37,7
2019
31,9
33,3
42,3
42,7
39,9
40,4
2020
30,8
42,6
40,3
2021
33,1
44
44,5
B1 Gebruik niet-voorgeschreven medicijnen, naar leeftijd
jaar
0-17 jaar: simulatie (%)
0-17 jaar: gepubliceerd (%)
18-64 jaar: simulatie (%)
18-64 jaar: gepubliceerd (%)
65 jaar of ouder: simulatie (%)
65 jar of ouder: gepubliceerd (%)
2014
29,8
33,9
39,1
40,5
34,8
37,7
2015
28,8
32,4
39,1
39,7
34,9
36,2
2016
28,2
31,6
39,9
40,8
35,9
37,8
2017
31,4
34,8
41,7
42,5
36,5
38,5
2018
31,6
32,4
43,2
43,4
36,7
37,7
2019
31,9
33,3
42,3
42,7
39,9
40,4
2020
30,8
42,6
40,3
2021
33,1
44
44,5
B2. Gebruik niet-voorgeschreven medicijnen, naar leeftijd
0-17 jaar
0-17 jaar
0-17 jaar
18-64 jaar
18-64 jaar
18-64 jaar
65 jaar of ouder
65 jaar of ouder
65 jaar of ouder
simulatie
gepubliceerd
verschil
simulatie
gepubliceerd
verschil
simulatie
gepubliceerd
verschil
%
%
%
%
%
%
2014
29,8
33,9
4,1
39,1
40,5
1,4
34,8
37,7
2,9
2015
28,8
32,4
3,6
39,1
39,7
0,7
34,9
36,2
1,2
2016
28,2
31,6
3,4
39,9
40,8
0,9
35,9
37,8
1,9
2017
31,4
34,8
3,4
41,7
42,5
0,8
36,5
38,5
2,0
2018
31,6
32,4
0,8
43,2
43,4
0,2
36,7
37,7
1,0
2019
31,9
33,3
1,4
42,3
42,7
0,4
39,9
40,4
0,4
2020
30,8
42,6
40,3
2021
33,1
44,0
44,5
B3 Gebruik niet-voorgeschreven medicijnen, naar geslacht
jaar
man: gesimuleerd (%)
man: gepubliceerd (%)
vrouw: gesimuleerd (%)
vrouw: gepubliceerd (%)
2014
29,9
32,1
42,8
45,1
2015
29,5
30,9
42,9
44,2
2016
31,1
32,6
42,4
44,1
2017
32
33,5
45,3
46,8
2018
33,4
33,8
45,9
46,4
2019
33,2
33,8
46,3
46,9
2020
33,1
46,5
2021
34,8
49,1
B3 Gebruik niet-voorgeschreven medicijnen, naar geslacht
jaar
man: gesimuleerd (%)
man: gepubliceerd (%)
vrouw: gesimuleerd (%)
vrouw: gepubliceerd (%)
2014
29,9
32,1
42,8
45,1
2015
29,5
30,9
42,9
44,2
2016
31,1
32,6
42,4
44,1
2017
32
33,5
45,3
46,8
2018
33,4
33,8
45,9
46,4
2019
33,2
33,8
46,3
46,9
2020
33,1
46,5
2021
34,8
49,1
B4. Gebruik niet-voorgeschreven medicijnen, naar geslacht
man
man
man
vrouw
vrouw
vrouw
simulatie
gepubliceerd
verschil
simulatie
gepubliceerd
verschil
%
%
%
%
2014
29,9
32,1
2,2
42,8
45,1
2,3
2015
29,5
30,9
1,5
42,9
44,2
1,3
2016
31,1
32,6
1,5
42,4
44,1
1,6
2017
32,0
33,5
1,5
45,3
46,8
1,6
2018
33,4
33,8
0,4
45,9
46,4
0,6
2019
33,2
33,8
0,6
46,3
46,9
0,6
2020
33,1
46,5
2021
34,8
49,1
B5 Gebruik niet-voorgeschreven medicijnen, migratieachtergrond
jaar
Nederland: simulatie (%)
Nederland: gepubliceerd (%)
Niet-westers: simulatie (%)
Niet-westers: gepubliceerd (%)
Westers: simulatie (%)
Westers: gepubliceerd (%)
2014
35,3
37,7
38,6
41,1
42,7
43,3
2015
35,6
37,3
37,6
38,2
39,8
39,2
2016
36,5
38,2
35,9
37,1
40,6
41,6
2017
38,6
40,3
36,9
37,9
41,8
42,7
2018
39,3
39,8
40,3
41,2
41,2
41
2019
39,3
39,9
40,8
41,3
42,3
42,7
2020
38,9
41,6
44
2021
41,1
44,8
44,2
B5 Gebruik niet-voorgeschreven medicijnen, migratieachtergrond
jaar
Nederland: simulatie (%)
Nederland: gepubliceerd (%)
Niet-westers: simulatie (%)
Niet-westers: gepubliceerd (%)
Westers: simulatie (%)
Westers: gepubliceerd (%)
2014
35,3
37,7
38,6
41,1
42,7
43,3
2015
35,6
37,3
37,6
38,2
39,8
39,2
2016
36,5
38,2
35,9
37,1
40,6
41,6
2017
38,6
40,3
36,9
37,9
41,8
42,7
2018
39,3
39,8
40,3
41,2
41,2
41
2019
39,3
39,9
40,8
41,3
42,3
42,7
2020
38,9
41,6
44
2021
41,1
44,8
44,2
B6. Gebruik niet-voorgeschreven medicijnen, migratieachtergrond
Nederland
Nederland
Nederland
niet-westers
niet-westers
niet-westers
westers
westers
westers
simulatie
gepubliceerd
verschil
simulatie
gepubliceerd
verschil
simulatie
gepubliceerd
verschil
%
%
%
%
%
%
2014
35,3
37,7
2,4
38,6
41,1
2,6
42,7
43,3
0,6
2015
35,6
37,3
1,7
37,6
38,2
0,7
39,8
39,2
-0,6
2016
36,5
38,2
1,7
35,9
37,1
1,2
40,6
41,6
1,0
2017
38,6
40,3
1,7
36,9
37,9
1,0
41,8
42,7
1,0
2018
39,3
39,8
0,5
40,3
41,2
0,9
41,2
41,0
-0,3
2019
39,3
39,9
0,7
40,8
41,3
0,4
42,3
42,7
0,4
2020
38,9
41,6
44,0
2021
41,1
44,8
44,2
B7 Gebruik niet-voorgeschreven medicijnen, naar inkomen
jaar
1e kwintiel: simulatie (%)
1e kwintiel: gepubliceerd (%)
2e tm 5e kwintiel: simulatie (%)
2e tm 5e kwintiel: gepubliceerd (%)
2014
38,3
40,3
36,1
38,3
2015
38,8
38,9
35,7
37,3
2016
38,2
39,5
36,6
38,2
2017
39,4
40,6
38,5
40,1
2018
39,6
40,2
39,7
40,1
2019
42,1
42,2
39,4
40,1
2020
40,7
39,7
2021
44,2
41,5
B7 Gebruik niet-voorgeschreven medicijnen, naar inkomen
jaar
1e kwintiel: simulatie (%)
1e kwintiel: gepubliceerd (%)
2e tm 5e kwintiel: simulatie (%)
2e tm 5e kwintiel: gepubliceerd (%)
2014
38,3
40,3
36,1
38,3
2015
38,8
38,9
35,7
37,3
2016
38,2
39,5
36,6
38,2
2017
39,4
40,6
38,5
40,1
2018
39,6
40,2
39,7
40,1
2019
42,1
42,2
39,4
40,1
2020
40,7
39,7
2021
44,2
41,5
B8. Gebruik niet-voorgeschreven medicijnen, naar inkomen