Auteur: Rik van der Vliet, Femke Bosman, Bram Hogendoorn, Jeanine van Wissen-Floris, Jochem Zweerink
Monitor Loonverschillen mannen en vrouwen, 2022

8. Achtergrondgegevens

8.1 Populatie

De onderzoekspopulatie bestaat vanaf de ‘Monitor Loonverschillen mannen en vrouwen, 2022’ uit werknemers woonachtig in Nederland met een (hoofd)baan van vier uur of meer per maand en een leeftijd vanaf 15 tot en met de AOW-leeftijd. Banen van scholieren en studenten en banen van stagiairs en banen in de sociale werkvoorziening tellen niet mee. Alle cijfers in deze publicatie zijn op die onderzoekspopulatie gebaseerd. Deze cijfers kunnen daarom afwijken van andere cijfers die het CBS publiceert over bijvoorbeeld alle banen in Nederland.

8.2 Bronnen

Enquête Beroepsbevolking (EBB)

De EBB is een doorlopende enquête onder personen van 15 tot 90 jaar die in Nederland wonen, met uitzonderingen van personen in inrichtingen, instellingen en tehuizen (de institutionele bevolking). Het doel van de EBB is om inzicht te krijgen in de relatie tussen mens en arbeidsmarkt. Gegevens worden vastgesteld op het moment van enquêteren.

De EBB is een zogenaamd roulerend panelonderzoek. De respondenten worden vijfmaal benaderd (vijf peilingen) met tussenpozen van ongeveer drie maanden. De totale periode waarin mensen deelnemen aan de enquête bedraagt daarmee twaalf maanden. Elke week wordt een nieuwe steekproefportie voor de eerste peiling aangeschreven met het verzoek de vragenlijst in te vullen. Op deze manier worden alle weken van het jaar evenredig vertegenwoordigd en vormen de data een goede afspiegeling van wat er zich gedurende het jaar afspeelt.

De volgende persoonskenmerken uit de EBB zijn gebruikt voor dit onderzoek: beroepsniveau, beroepsrichting en of iemand een leidinggevende functie heeft. Deze gegevens zijn vanuit de EBB voor een klein deel van de werknemers uit de onderzoekspopulatie bekend. Voor de jaren 2014 t/m 2020 gaat het per jaar om 50 tot 60 duizend werknemers en voor 2022 om ongeveer 35 duizend werknemers voor wie gegevens uit de EBB bekend waren. In 2022 is het aantal minder geworden vanwege een vernieuwde opzet van de EBB (CBS, 2023). Voor de werknemers uit de onderzoekspopulatie van wie geen gegevens uit de EBB bekend zijn, worden de drie kenmerken uit de EBB bijgeschat (zie paragraaf 9.2).

Stelsel van Sociaal-statistische Bestanden (SSB)

Het SSB is een stelsel van registers en enquêtes, die op persoonsniveau aan elkaar zijn gekoppeld. De data uit het SSB hebben betrekking op verschillende sociaaleconomische onderwerpen, zoals banen, uitkeringen, woningen en onderwijs.
De doelpopulatie van het SSB bestaat uit alle personen die in Nederland wonen, en personen die niet in Nederland wonen maar in Nederland werken of een uitkering dan wel pensioen vanuit Nederland ontvangen.
Voor dit onderzoek zijn gegevens over de volgende onderwerpen uit het SSB gebruikt:

  • Banen: de baangegevens zijn ontleend aan de Polisadministratie van het UWV.
  • Demografische gegevens: deze zijn gebaseerd op de Basisregistratie Personen (BRP). Het gaat ondermeer om geslacht, leeftijd, herkomst en generatie. De vaststelling van persoonsgegevens sluit aan op het peilmoment van de hoofdbaan (laatste vrijdag van september).
  • Opleidingsgegevens: deze zijn ontleend aan het Opleidingsniveaubestand (zie volgende bronbeschrijving).
  • Kenmerken werkgever: Bedrijfstak/sector en grootte van het bedrijf zijn ontleend aan het Algemeen Bedrijven Register (ABR) van het CBS.

Opleidingsniveaubestand

Het Opleidingsniveaubestand bevat de hoogst behaalde en hoogst gevolgde opleiding van de Nederlandse bevolking op peilmoment (1 oktober van het verslagjaar), zowel qua niveau als qua richting. Het bestand is gebaseerd op gegevens uit diverse registers met onderwijsgegevens en de EBB. Door het gebruik van meerdere (jaargangen van) bronnen heeft het Opleidingsniveaubestand een zeer hoge dekkingsgraad die jaarlijks toeneemt. De opleidingsgegevens waren voor verslagjaar 2022 voor ongeveer driekwart van de onderzoekspopulatie van de Monitor Loonverschillen bekend.

Alhoewel de dekkingsgraad hoog is, vertegenwoordigt het Opleidingsniveaubestand niet de gehele onderzoekspopulatie. De informatie is voor een deel van de werknemers integraal waargenomen en voor de overige werknemers op steekproeven gebaseerd (EBB). De waarneming is op hogere leeftijden bovendien sterk selectief. Dat komt doordat ouderen veelal hun opleidingen hadden afgerond voordat de registers tot stand kwamen die voor het Opleidingsniveaubestand gebruikt worden. Om informatie te krijgen over het opleidingsniveau van de hele onderzoekspopulatie en om te corrigeren voor selectiviteit, is het deel van de onderzoekspopulatie dat niet vanuit registers is waargenomen opgehoogd en gewogen. Dat is gedaan met gewichten uit het Opleidingsniveaubestand. Bij het samenstellen van die gewichten is rekening gehouden met de achtergrondkenmerken leeftijd, geslacht, herkomst, burgerlijke staat, type huishouden, regio, inkomen en voornaamste inkomensbron.

8.3 Operationalisering

In deze paragraaf wordt toegelicht hoe de belangrijkste begrippen uit het onderzoek zijn geoperationaliseerd.

Gemiddeld uurloon

Het basisloon is gelijk aan het (fiscaal) jaarloon, exclusief bijzondere beloning en overwerkloon, maar inclusief de fiscale waarde van niet in geld uitgekeerde belaste vergoedingen. Het aantal reguliere uren is gelijk aan het totale aantal verloonde uren, exclusief overwerkuren en verlofuren in verband met vakantie, adv en algemeen erkende feestdagen. Van alle banen op de laatste vrijdag van september van een verslagjaar is het gemiddelde uurloon berekend voor het hele verslagjaar.
Het uurloon is berekend door voor elke persoon het jaarloon uit de hoofdbaan te nemen en deze te delen door het jaarlijkse aantal reguliere uren in die baan. Vervolgens worden de uurlonen rekenkundig gemiddeld. In formule ziet dit er als volgt uit:

\[
\text{Gemiddeld uurloon} = \frac{\sum_{b=1}^n \text{loon}_b / \text{uur}_b}{n}
\]

waarbij loonb het totaal verdiende basisloon bij hoofdbaan b weergeeft en uurb het totaal aantal regulier gewerkte uren in hoofdbaan b in de periode van het peilmoment. Tot slot staat n voor het aantal hoofdbanen.

Ongecorrigeerd loonverschil

Het ongecorrigeerde loonverschil is de procentuele afwijking van het rekenkundig gemiddelde uurloon van vrouwen ten opzichte van het rekenkundig gemiddelde uurloon van mannen, berekend als volgt:

\[
\text{Ongecorr. loonverschil} = \frac{\text{gem. uurloon vrouwen} - \text{gem. uurloon mannen}}{\text{gem. uurloon mannen}}\cdot 100
\]

8.4 Kwaliteit van de uitkomsten

Vanaf deze publicatie is de Monitor Loonverschillen gebaseerd op integrale gegevens, dat wil zeggen gegevens die voor alle werknemers in Nederland (waaronder onze onderzoekspopulatie) beschikbaar zijn. Daardoor zijn de uitkomsten van de ongecorrigeerde loonverschillen heel nauwkeurig. De gecorrigeerde loonverschillen zijn mede gebaseerd op drie niet integraal waargenomen gegevens uit de EBB. Deze zijn bijgeschat voor werknemers uit de onderzoekspopulatie die niet recent aan de EBB hebben deelgenomen (zie paragraaf 9.2). Dat levert wel onzekerheidsmarges voor de uitkomsten op. Die zijn echter een stuk kleiner dan in de methode die voorheen voor de Monitor Loonverschillen werd gebruikt, toen de onderzoekspopulatie uitsluitend op steekproefgegevens uit de EBB werd gebaseerd. Vanwege de kleinere onzekerheidsmarges worden de gecorrigeerde loonverschillen gepubliceerd met één decimaal. De onzekerheidsmarges worden in figuren getoond door streepjes naar onder en naar boven bij de gecorrigeerde uitkomsten.

8.5 Wijzigingen in de onderzoeksopzet

De nieuwe methodiek achter de Monitor Loonverschillen mannen en vrouwen is beschreven in Hoofdstuk 1. Hiernaast is de regressie zodanig aangepast dat de ongecorrigeerde en gecorrigeerde loonverschillen tussen mannen en vrouwen binnen dezelfde populatie met elkaar vergeleken kunnen worden. Anders dan in voorgaande edities staan daarom ongecorrigeerde en gecorrigeerde loonverschillen naast elkaar in de figuren.