Vacatures, online waarneming (beroepenindeling)
Wat behelst het onderzoek
Doel
Het publiceren van vacaturecijfers in Nederland naar beroepsklasse en beroepssegment volgens de Beroepenindeling ROA-CBS 2014 (BRC 2014).
Doelpopulatie
Alle nieuw ontstane online vacatures van bedrijven en instellingen in Nederland met personeel.
Statistische eenheid
Ontstane vacature.
Aanvang onderzoek
Gegevens over vacatures naar beroepenindeling zijn beschikbaar vanaf 2018.
Frequentie
Elk jaar.
Publicatiestrategie
De resultaten worden ongeveer vijf maanden na afloop van een jaar gepubliceerd. De cijfers zijn voorlopig en kunnen bijgesteld worden ten gevolge van een verbetering van de weegmethode.
Hoe wordt het uitgevoerd
Soort onderzoek
Het onderzoek combineert online vacaturedata met gegevens uit steekproefonderzoek en registerdata. De online vacatures worden gewogen naar het totaal aantal vacatures van de Vacatures, kwartaalenquête.
Waarnemingsmethode
Online vacatures worden verzameld via webscraping op internet. Hierbij wordt systematisch gezocht naar nieuwe vacatures op websites. Vervolgens worden de teksten van de vacatures in het geheel bewaard. Dubbele publicaties van identieke vacatures worden daarna verwijderd. De vacatures worden geclassificeerd naar o.a. beroep en bedrijf.
Berichtgevers
De online vacatures worden verzameld door Textkernel.
Steekproefomvang
Alle online vacatures in Nederland.
Controle- en correctiemethoden
Het CBS past de SBI-code van de online vacatures aan op basis van het Algemene Bedrijvenregister (ABR). Als koppelsleutel wordt het KvK nummer van het door Textkernel toegewezen bedrijf gebruikt. Koppelingen worden gecontroleerd op consistentie via een top down benadering.
Weging
Het aantal online vacatures komt niet geheel overeen met de totale populatie ontstane vacatures. Een verklaring is dat niet alle vacatures online worden gepubliceerd of waargenomen; ook kan een vacature op meerdere plekken online worden gepubliceerd.
Daarom wordt het aantal online vacatures gewogen, zodat het aantal per bedrijfstak aansluit bij het aantal uit de Vacatures, kwartaalenquête (niet seizoensgecorrigeerd). De weging is gebaseerd op een methode van het Uitvoeringsinstituut Werknemersverzekeringen (UWV). Elke online vacature krijgt een gewicht, waarmee zo goed mogelijk gecorrigeerd wordt voor:
- Vacatures met verschillende beroepsniveaus. Voor elementaire beroepsniveaus wordt er minder online geworven en meer andere kanalen ingezet. Lagere beroepsniveaus krijgen daarom een hoger gewicht dan hogere beroepsniveaus, afgeleid uit het aandeel werkenden naar beroepsniveau uit de Enquête Beroepsbevolking (EBB);
- Indirecte vacatures via intermediairs. Intermediairs kunnen de enige bron zijn voor een vacature, maar kunnen ook zorgen voor meer dubbele vacatures. Als er voor een vacature zowel direct als indirect online geworven wordt, is het niet altijd duidelijk dat het om dezelfde vacature gaat en wordt er dus niet altijd ontdubbeld. De indirecte vacatures krijgen daarom een kleiner gewicht (25%) dan de directe vacatures;
- Directe vacatures met een onbekende bedrijfstak, zodat deze bij de juiste BRC 2014 beroepsgroep worden meegeteld;
- Aansluiting van de ontstane vacatures per bedrijfstak bij de aantallen uit de Vacatures, kwartaalenquête voor ieder kwartaal.
Wat is de kwaliteit van de uitkomsten
Nauwkeurigheid
De uitkomsten van het onderzoek hebben een onnauwkeurigheidsmarge. Waarden worden daarom afgerond om de suggestie van al te grote nauwkeurigheid te voorkomen.
Drie oorzaken van onnauwkeurigheid zijn vastgesteld. Hieruit zijn drie voorwaarden afgeleid voor publicatie:
- Het resultaat moet niet te sterk afhankelijk zijn van variatie ten gevolge van onvolledigheid van online vacatures. De online vacaturedata is hiervoor 50 duizend keer random samengesteld volgens een bootstrap analyse. Voorwaarde (1): 90% van de bootstrap-resultaten van een waarde moet binnen een interval liggen dat minder afwijkt dan 10% van de berekende waarde.
- Het resultaat moet niet te sterk afwijken ten gevolge van variatie in de beroepsclassificaties. Hiervoor is gebruik gemaakt van een correctietabel uit eerder onderzoek van UWV naar de beroepenclassificering door Textkernel. Voorwaarde (2): Herclassificatie leidt tot maximaal 10% afwijking van de berekende waarde.
- Het resultaat moet niet te sterk afhankelijk zijn van het gekozen gewicht van 25% van de intermediaire vacatures. Voorwaarde (3): Het verschil tussen de uitkomsten van weging van intermediaire vacatures met zowel een gewicht van 10% als 70% is maximaal 20% van de berekende waarde.
Alleen als de waarde van een cel voldoet aan alle drie de voorwaarden in de jaren 2018, 2019 en 2020, worden de bijbehorende cijfers gepubliceerd.
Uitgezonderd van voorwaarde (2) zijn de beroepen van de BRC 2014 beroepsklasse 06 (Openbaar bestuur, veiligheid en juridische beroepen). Bij deze beroepsklasse wordt de van het UWV onderzoek afgeleide voorwaarde als te streng beschouwd, zie ook de publicatie beroepen classificeren met data in online vacatures.
Volgtijdelijke vergelijkbaarheid
De gegevens zijn volgtijdelijk vergelijkbaar.
Beschrijving kwaliteitsstrategie
De aantallen ontstane vacatures per bedrijf of instelling worden gecontroleerd op plausibiliteit. Onjuiste koppelingen van vacatures aan bedrijven of instellingen worden gecorrigeerd als deze zouden leiden tot indeling bij een verkeerde bedrijfstak.
Relevante links
- Link Onderzoek - Vacatures, kwartaalenquête
- Link Onderzoek - Vacatures, online waarneming
- Link CBS Working Paper - Online vacatures als bron voor statistiek
- Link Onderzoek - Beroepen classificeren met data in online vacatures