2. Data en methode
2.1 Data
De resultaten die in dit artikel worden gepresenteerd, zijn gebaseerd op de Enquête beroepsbevolking (EBB), met als verslagperiode de jaren 2013 t/m de eerste twee kwartalen van 2021. De EBB is de belangrijkste informatiebron voor statistieken over de werkzame beroepsbevolking2) en binding met de arbeidsmarkt voor niet-werkenden. Daarnaast worden verschillende achtergrondkenmerken verzameld zoals geslacht, leeftijd, onderwijsniveau en herkomst.
De EBB was in de periode 2013 t/m 2020 opgezet als een adressensteekproef waarbij adressen van instellingen of tehuizen werden uitgesloten. Het onderzoek was ingericht als een zogenaamd roterend panel van vijf peilingen waarbij om de drie maanden huishoudens op de getrokken adressen werden geënquêteerd. Een deel van de huishoudens die in de eerste peiling niet respondeerden, werd vervolgens face-to-face of telefonisch benaderd. Bij de vier vervolgpeilingen zijn huishoudens telefonisch benaderd. Vanaf 2021 is het steekproefdesign van de EBB gebaseerd op een personensteekproef. Wel worden van huishoudens die in 2020 hun deelname aan de EBB zijn gestart, de peilingen tot en met de eerste twee kwartalen van 2021 waargenomen.
De doelpopulatie van dit onderzoek bestaat uit niet-werkenden in de leeftijd van 15 tot en met 74 jaar die woonachtig zijn in Nederland in particuliere huishoudens. Voor dit artikel is de doelpopulatie verder ingeperkt tot personen die hun formele opleiding hebben afgesloten. Voor onderwijsvolgende personen is werk namelijk niet in alle gevallen te beschouwen als het begin van een werkzame carrière die aansluit op de gevolgde onderwijsloopbaan. Het gaat bij hen veelal om bijbanen waarbij ze vaak wisselen van baan of van geen werk naar werk en andersom (CBS 2023). In 2021 had 87 procent van de onderwijsvolgende werknemers een flexibele arbeidsrelatie, en van de onderwijsvolgende flexwerknemers was 61 procent werkzaam als oproep- of invalkracht (Bierings, 2022).
Om de samenhang van de kans op werk van personen met andere kenmerken te kunnen schatten is het nodig om aanvullende gegevens bij dit onderzoek te betrekken vanuit andere bronnen dan de EBB. Een voorbeeld hiervan is de duur van de niet-werkzame periode, die in de EBB-enquête niet in alle gevallen volledig wordt waargenomen, maar wel af te leiden is vanuit gegevens uit registerbronnen. Een ander voorbeeld is de uitkeringssituatie van respondenten en de deelname aan maatregelen om de arbeidsdeelname van mensen met een arbeidsbeperking te bevorderen (Wet banenafspraak en quotum arbeidsbeperkten). Om te kunnen beschikken over deze gegevens zijn bestanden van de Enquête beroepsbevolking verrijkt met gegevens uit onder meer de volgende registerbronnen:
- Inschrijvingen bij het Uitvoeringsinstituut Werknemersverzekeringen (UWV)
- Personen die tot de doelgroep van de Wet banenafspraak behoren
- Gegevens over onderwijshistorie, het arbeidsverleden en uitkeringen uit het SSB3)
2.2 Methode
Discrete duuranalyse
De baanvindkansen worden geschat met een zogenaamde discrete duuranalyse, via de methode van de binomiale logistische regressie (Singer en Willett, 1993, Agresti, 2002, Binder, 1983). De kans op werk heeft betrekking op de transitie van geen werk naar werk tussen twee EBB-peilingen (een kwartaal), rekening houdend met de kenmerken van de onderzoekspersoon in de voorafgaande kwartalen. In deze analyse is de afhankelijke variabele de duur van de periode zonder werk. De kansverdeling van de duren wordt geschat door geobserveerde transities van geen werk naar werk te verbinden met achtergrondkenmerken en deze onder te brengen in een duurmodel.
De verklarende variabelen zijn in deze analyse:
- geslacht,
- leeftijd,
- herkomstland,
- samenstelling van het huishouden,
- aantal kinderen (van 0 t/m 5 jaar) in het huishouden,
- arbeidsmarktpositie van de partner,
- onderwijsniveau,
- wel/geen voortijdig schoolverlater,
- arbeidsbelemmering door langdurige ziekte,
- wel/geen lid van de doelgroep banenafspraak,
- binding met de arbeidsmarkt van de voorafgaande peiling,
- uitkeringspositie,
- kenmerken met betrekking tot zoekgedrag,
- wel/niet ingeschreven bij het UWV,
- omvang in uren van de gewenste baan,
- beroepsklasse recent uitgeoefend beroep (indien van toepassing), en
- gemeentelijk werkloosheidspercentage.
Modelselectie en kwaliteitsmaten
Modelselectie betekent het selecteren van de relevante kenmerken voor het schatten van de baanvindkans. Hierbij worden kenmerken waarvan verwacht kan worden dat ze inhoudelijk van betekenis zijn voor de kans op werk, in het model opgenomen en wordt vastgesteld of ze een belangrijke bijdrage leveren aan een goede modelfit, en niet sterk samenhangen met eerder opgenomen kenmerken. Dit laatste gebeurt door de variantie-inflatiefactor (VIF) te berekenen. Om de bijdrage van kenmerken aan de modelfit te kunnen vaststellen wordt het Akaike-informatiecriterium (AIC) toegepast (Akaike 1973). Er is ook nagegaan of het meenemen van de weeggewichten tot andere resultaten leidt (Binder, 1983, Särndal et al., 1992, Lumley, 2010).
De modellen die ontstaan uit de toevoeging van relevante kenmerken, zijn vervolgens op een aantal kwaliteitsmaten getoetst om na te gaan of deze modellen de waargenomen transities goed kunnen voorspellen. Het model met de beste modelfit blijkt ook het beste te scoren op de meerderheid van de kwaliteitsmaten, en bestaat uit de volgende typen variabelen:
- duurvariabelen (duur niet-werken voorafgaand aan het panel, aantal peilingen zonder werk)
- verslagjaar
- demografische kenmerken (geslacht, leeftijd, herkomstland, samenstelling huishouden, aantal kinderen in huishouden)
- sociaaleconomische kenmerken (onderwijsniveau, werkende partner)
- gezondheidsvariabelen (arbeidsbelemmering door langdurige ziekte, aandoening, of handicap)
- uitkeringen (pensioen, WW, Bijstand, overige sociale voorziening, uitkering i.v.m. ziekte of arbeidsongeschiktheid)
- variabelen met betrekking tot zoekgedrag
- voormalig beroep en bedrijfstak
- werkloosheidspercentage per gemeente
Interpretatie van de modellen
De in dit artikel gebruikte modellen schatten de baanvindkans van personen aan de hand van individuele kenmerken van personen. Dit betekent niet dat daarmee de precieze baanvindkans van individuele personen wordt geschat, maar eerder van groepen personen waarbij de groepen gekarakteriseerd worden door de kenmerken die in het model zijn opgenomen. Bovendien wordt de individuele baanvindkans van personen door meer factoren bepaald dan alleen de kenmerken die in dit artikel worden beschouwd.
3) SSB: stelsel van sociaal-statistische bestanden. Voor een belangrijk deel bestaat deze set bestanden uit registerbestanden van diverse registerhouders.