7. Weging
7.1 Weegmethode
De steekproef is willekeurig in twee helften verdeeld, cluster 1 en 2, en in de vragenlijst is sturing aanwezig waardoor een deel van de vragen alleen aan cluster 1 wordt getoond en een ander deel van de vragen alleen aan cluster 2, het split-half ontwerp.
Omdat er uitspraken gedaan dienen te worden over zowel beide helften als over de hele populatie worden er twee wegingen uitgevoerd: één weging voor cluster 1 en één weging voor cluster 2. Achteraf worden de gewichten van beide wegingen gecombineerd via zogenaamde proportionele gewichten. De twee clusters wegen mee naar rato van de respons. Dit leidt in het algemeen tot iets nauwkeurigere schattingen dan wanneer de twee clusters gelijk meewegen. Bovendien is het gemiddelde proportionele gewicht niet alleen in de totale respons, maar ook in beide clusters gelijk aan 1 als de beide clusters naar rato van de respons meewegen.
Daarnaast is het bij de NEA gebruikelijk dat er twee soorten gewichten in het microdatabestand zijn opgenomen: zogenaamde ophooggewichten die optellen tot de populatieomvang en zogenaamde proportionele gewichten die optellen tot de steekproefomvang.
Het microdatabestand bevat daarom meerdere gewichten. In paragraaf 10.2 staan instructies voor gebruikers van het bestand voor het gebruik van de verschillende weegfactoren, waaronder enkele aandachtspunten voor het gebruik van de jaren 2020 en 2021.
7.2 Weegmodel
Voor de NEA 2023 is het volgende weegmodel gebruikt:
[Geslacht(2) × Leeftijd(6)] +
[Stratum(44)]+
[Herkomst(5)] +
[Type huishouden(7)] +
[Type contract(2)] +
[Primair inkomen(10)] +
[landnegendeling(9)]
Al deze variabelen zijn categoriaal. Het aantal categorieën staat bij elke variabele aangegeven tussen haakjes. Het weegmodel maakt uitsluitend gebruik van registergegevens. De verdeling van het steekproefkader, de steekproef en de bruikbare respons over de categorieën van deze variabelen is in paragraaf 6.2 beschreven.
7.3 Gewichten
Voor cluster 1 en 2 is een lineaire weging uitgevoerd op alle bruikbare responsen, waarbij enerzijds rekening wordt gehouden met ongelijke insluitkansen en anderzijds met mogelijk selectieve non-respons. Uitvoeren van de wegingen levert correctie- en eindgewichten op zoals weergegeven in figuur 7.3.1 en 7.3.2.
Productgroep | Waarde | Eerste serie |
---|---|---|
Cluster 1 | Minimum | 0,26 |
Cluster 1 | 1e kwartiel | 0,75 |
Cluster 1 | Mediaan | 0,94 |
Cluster 1 | 3e kwartiel | 1,18 |
Cluster 1 | Maximum | 4,00 |
Cluster 2 | Minimum | 0,29 |
Cluster 2 | 1e kwartiel | 0,76 |
Cluster 2 | Mediaan | 0,94 |
Cluster 2 | 3e kwartiel | 1,18 |
Fietsen | Maximum | 4,06 |
Cluster 1 | Cluster 2 | |
---|---|---|
Correctiegewichten | 4 | 4.06 |
Bron: CBS, TNO |
Het weegmodel is robuust. De verdelingen van zowel de correctie- als eindgewichten is vergelijkbaar voor cluster 1 en 2. Er zijn geen negatieve gewichten en het aantal ‘grote’ correctiegewichten is beperkt. Daarnaast zijn er geen eindgewichten kleiner dan 1 (het is niet logisch als een persoon voor minder dan zichzelf meetelt). Ook de celvulling is voldoende: de kleinste cel bevat 111 personen voor cluster 1 en 107 personen voor cluster 2.
Productgroep | Waarde | Eerste serie |
---|---|---|
Cluster 1 | Minimum | 23,61 |
Cluster 1 | 1e kwartiel | 201,41 |
Cluster 1 | Mediaan | 270,63 |
Cluster 1 | 3e kwartiel | 337,87 |
Cluster 1 | Maximum | 1005,88 |
Cluster 2 | Minimum | 24,48 |
Cluster 2 | 1e kwartiel | 201,68 |
Cluster 2 | Mediaan | 269,26 |
Cluster 2 | 3e kwartiel | 331,42 |
Fietsen | Maximum | 1009,96 |
Cluster 1 | Cluster 2 | |
---|---|---|
Eindgewichten | 1005.88 | 1009.96 |
Bron: CBS, TNO |