7. Weging
Bij de NEA 2022 wijzigt de weging op twee punten, namelijk de weegmethode en het weegmodel.
Om na te kunnen gaan of eventuele opvallende sprongen in uitkomsten samenhangen met de introductie van het nieuwe weegmodel, is ook het oude weegmodel nog een keer toegepast, maar dan met de nieuwe weegmethode (zie paragraaf 8.3).
7.1 Weegmethode
Voorheen werden alle respondenten in één keer gewogen. Vanaf NEA 2022 is dit gewijzigd. De steekproef is willekeurig in twee helften verdeeld, cluster 1 en 2, en in de vragenlijst is sturing aanwezig waardoor een deel van de vragen alleen aan cluster 1 wordt getoond en een ander deel van de vragen alleen aan cluster 2, het split-half ontwerp.
Omdat er uitspraken gedaan dienen te worden over zowel beide helften als over de hele populatie worden er twee wegingen uitgevoerd: één weging voor cluster 1 en één weging voor cluster 2. Achteraf worden de gewichten van beide wegingen gecombineerd via zogenaamde proportionele gewichten. De twee clusters wegen mee naar rato van de respons. Dit leidt in het algemeen tot iets nauwkeurigere schattingen dan wanneer de twee clusters gelijk meewegen. Bovendien is het gemiddelde proportionele gewicht niet alleen in de totale respons, maar ook in beide clusters gelijk aan 1 als de beide clusters naar rato van de respons meewegen.
Het is bij de NEA gebruikelijk dat er twee soorten gewichten in het microdatabestand zijn opgenomen: zogenaamde ophooggewichten die optellen tot de populatieomvang en zogenaamde proportionele gewichten die optellen tot de steekproefomvang.
Bij de NEA 2005-2013 is er één ophooggewicht en één proportioneel gewicht.
Bij de NEA 2020 en 2021 zijn er drie versies van het ophooggewicht bepaald en drie (corresponderende) versies van het proportionele gewicht. Reden voor de verschillende versies is het split-half ontwerp waarmee in 2020 en 2021 is geëxperimenteerd. De drie verschillende versies van de gewichten zijn bedoeld voor schattingen en analyses die betrekking hebben op (1) vragen die alleen aan de eerste steekproefhelft zijn gesteld, (2) vragen die alleen aan de tweede steekproefhelft zijn gesteld en (3) vragen die aan de hele steekproef zijn gesteld.
Vanaf 2022 is er nog maar één versie van de proportionele gewichten die gebruikt kan worden voor alle analyses. Dit is voor gebruikers eenvoudiger en minder foutgevoelig. Bovendien is bij de NEA 2020 en 2021 gebleken dat – voor de vragen die in beide steekproefhelften zijn gesteld – de uitkomsten op basis van elk van de drie versies van de proportionele gewichten dicht bij elkaar liggen.
Van de ophooggewichten blijven ook vanaf 2022 drie verschillende versies beschikbaar (anders telt het gewicht op tot de dubbele populatieomvang). Hierbij geldt als randvoorwaarde dat schattingen voor gemiddeldes en percentages – die kunnen worden berekend op basis van zowel ophoog- als proportionele gewichten – consistent zijn op basis van beide soorten gewichten.
7.2 Weegmodel
Het weegmodel voor de NEA is in 2005 ontworpen en sindsdien niet gewijzigd. Inmiddels zijn er meer registervariabelen beschikbaar en is voor de NEA een nieuw weegmodel ontwikkeld. De ontwikkeling is gedaan op de NEA 2021.
Vervolgens is het weegmodel toegepast op de NEA 2022. Anders dan het oude weegmodel maakt het nieuwe weegmodel uitsluitend gebruik van registergegevens.
Het nieuwe weegmodel is:
[Geslacht(2) × Leeftijd(6)] +
[Stratum(44)]+
[Herkomst(5)] +
[Type huishouden(7)] +
[Type contract(2)] +
[Primair inkomen(10)] +
[landnegendeling(9)]
Al deze variabelen zijn categoriaal. Het aantal categorieën staat bij elke variabele aangegeven tussen haakjes. De verdeling van het steekproefkader, de steekproef en de bruikbare respons over de categorieën van deze variabelen is in paragraaf 6.2 beschreven.
7.3 Gewichten
Voor cluster 1 en 2 is een lineaire weging uitgevoerd, waarbij enerzijds rekening wordt gehouden met ongelijke insluitkansen en anderzijds met mogelijk selectieve non-respons. Uitvoeren van de wegingen levert correctie- en eindgewichten op zoals weergegeven in tabel 7.3.1 voor cluster 1 en 7.3.2 voor cluster 2. In totaal zijn respectievelijk 30.501 en 30.574 personen gewogen.
Correctiegewicht | Eindgewicht | |
---|---|---|
Minimum | 0,25 | 18,11 |
Eerste kwartiel | 0,73 | 191,32 |
Mediaan | 0,95 | 265,06 |
Gemiddelde | 1,01 | 263,11 |
Derde kwartiel | 1,20 | 334,84 |
Maximum | 4,00 | 1 011,12 |
Designeffect | 1,14 | 1,24 |
Het weegmodel is robuust. De verdelingen van zowel de correctie- als eindgewichten is vergelijkbaar voor cluster 1 en 2. Er zijn geen negatieve gewichten en het aantal ‘grote’ correctiegewichten is beperkt. Daarnaast is het designeffect veel kleiner dan 2 en er zijn geen eindgewichten kleiner dan 1 (het is niet logisch als een persoon voor minder dan zichzelf meetelt). Ook de celvulling is voldoende: de kleinste cel bevat 113 personen voor cluster 1 en 111 personen voor cluster 2.
Correctiegewicht | Eindgewicht | |
---|---|---|
Minimum | 0,27 | 17,26 |
Eerste kwartiel | 0,75 | 199,45 |
Mediaan | 0,94 | 269,06 |
Gemiddelde | 1,00 | 262,48 |
Derde kwartiel | 1,18 | 328,30 |
Maximum | 3,89 | 1 048,55 |
Designeffect | 1,14 | 1,24 |