4. Verwerking
Verwerking betreft de werkzaamheden die nodig zijn om aan de antwoorden die respondenten geven statistische informatie te kunnen ontlenen. De verwerking van de data is zoveel mogelijk geautomatiseerd. Hieronder staan de voornaamste onderdelen van het verwerkingsproces vermeld.
4.1 Typeren
Om vast te stellen welk onderwijsniveau respondenten behaald hebben, in welke bedrijfstak zij werken en welk beroep zij uitoefenen, heeft het CBS standaard vraagstellingen ontwikkeld. Met een standaard typeerproces worden vervolgens de bedrijfstak, het beroep en het behaalde onderwijsniveau geclassificeerd. Op de website van het CBS is meer informatie beschikbaar over de classificaties.
Het behaalde onderwijsniveau is volledig automatisch geclassificeerd volgens de SOI 2021. Voor beroep wordt de ISCO code deels automatisch en deels handmatig getypeerd op basis van beschrijvingen van het beroep en de werkzaamheden door de respondent. De bedrijfstak waarin respondenten werken is in het merendeel van de gevallen vastgesteld op basis van registerinformatie (Polisadministratie of het Zelfstandigen bestand). Indien onbekend vanuit de registraties, is de bedrijfstak getypeerd (deels automatisch en deels handmatig), bijvoorbeeld als de respondent uitzendkracht of gedetacheerd is of recent bij de huidige werkgever is komen werken. Als de respondent korter dan vier maanden geleden bij de huidige werkgever is komen werken, heeft de registerinformatie mogelijk nog betrekking op de bedrijfstak van de vorige werkgever. Uitzendkrachten en gedetacheerden behoren volgens de Polisadministratie tot de zakelijke dienstverlening. Het bedrijf waarnaartoe zij zijn uitgezonden, zal in de praktijk vaak in een andere bedrijfstak actief zijn. Het typeerproces levert een SBI 2008 code op. Deze wordt gebruikt voor publicatie.
4.2 Verrijken
Net zoals de bedrijfstak kunnen ook andere gegevens worden overgenomen uit registers. Bij de EBB wordt dit standaard gedaan voor inkomensvariabelen en geregistreerd werkzoekenden bij UWV. Ook regiokenmerken en variabelen over de herkomst van respondenten worden uit registers gekoppeld.
4.3 Afleiden
Antwoorden van respondenten worden in de verwerking van de EBB gecombineerd tot afleidingen. Het CBS heeft de vragenlijst zo opgesteld dat respondenten zo min mogelijk vragen hoeven te beantwoorden om aan de informatie behoefte te voldoen. De vragenlijst is opgesteld zodat alle variabelen kunnen worden afgeleid die het Europees statistisch bureau (Eurostat) heeft gedefinieerd. Naast de Eurostat variabelen zijn er ook afleidingen nodig om Statline tabellen te kunnen maken. Hiervoor worden één of meerdere Eurostat variabelen gecombineerd met vraagvariabelen. Tot slot worden in de bestanden ook publicatie indelingen afgeleid die een indikking zijn van de categorieën uit één variabele. Met behulp van afleidingen en publicatie indelingen worden publicaties zoveel mogelijk uniform samengesteld. Daarnaast zijn de publicaties van het CBS en Eurostat eenvoudig te reproduceren met de afleidingen in de microdata.