Meer zicht op de regionale variatie in arbeidsomstandigheden

2. Data en methoden

Data

Het onderzoek naar de regionale verschillen in arbeidsomstandigheden is uitgevoerd met data van de Nationale Enquête Arbeidsomstandigheden (NEA) 2022 van het CBS en TNO. Het doel van de NEA is het in kaart brengen van de arbeidsomstandigheden van werknemers en deze in verband te brengen met kenmerken van de persoon en het bedrijf waar de werknemer in dienst is. De nettosteekproef bedroeg in 2022 ongeveer 61 duizend werknemers van 15 tot 75 jaar die in Nederland wonen en werkzaam zijn.

Vanaf het verslagjaar 2022 verschilt de wijze waarop gegevens voor de NEA zijn verzameld en verwerkt op enkele punten van eerdere verslagjaren. Daardoor zijn de cijfers vanaf 2022 mogelijk niet in alle gevallen vergelijkbaar met de cijfers tot en met 2021. Meer informatie is beschikbaar in de onderzoeksbeschrijving van de NEA 2022

Het steekproefontwerp is op een aantal punten gewijzigd ten aanzien van dat in 2021: er vindt geen oversampling meer plaats van jongeren en van personen met een niet-westerse migratieachtergrond, en na trekking is de steekproef willekeurig onderverdeeld in twee clusters voor het split-half vragenlijstontwerp. Bij het split-half vragenlijstontwerp worden (deels) verschillende sets van vragen gebruikt in de twee clusters. Zodoende is het aantal gemeten doelvariabelen uitgebreid zonder substantiële toename van het aantal vragen per respondent.

Vanwege de gewijzigde waarneming via een split-half vragenlijst is ook de weegprocedure in 2022 aangepast ten opzichte van die in voorgaande jaren. Clusters 1 en 2 zijn apart gewogen door middel van poststratificatie naar geslacht, leeftijd, herkomst, type huishouden, bedrijfstak, type contract en persoonlijk inkomen.

Methode

Uit de NEA-data zijn kenmerken geselecteerd die mogelijk verband houden met de regionale variatie in fysiek zwaar werk, autonomie en werkdruk. De selectie gebeurde in een drietal stappen:

  • Voorselectie van variabelen op inhoudelijke gronden. Bijvoorbeeld het soort beroep gaat naar verwachting in sterke mate samen met de kans op zware lichamelijke belasting in het werk (Douwes et al., 2020). Deze variabele wordt daarom opgenomen in de lijst van te beschouwen variabelen. Van sommige andere variabelen is weliswaar een samenhang met fysiek zwaar werk te verwachten, maar lijkt de richting van de causaliteit eerder in de omgekeerde richting te liggen. Een voorbeeld van zo’n variabele is de leeftijd tot waarop de persoon wil doorwerken. Dit type variabelen wordt daarom niet opgenomen.
  • De variabelenverzameling van de voorselectie is verder ingeperkt met de CHAID-beslisboom. De CHAID-beslisboom is een niet-parametrische methode waarmee de samenhang van een doelvariabele met andere variabelen en hun interacties in beeld wordt gebracht (IBM SPSS 2013, Kass 1980).
  • De uitkomsten van de datareductie met CHAID vormden het startpunt voor het opstellen van expliciete (lineaire) regressiemodellen. Lineaire regressie (en logistische regressie) zijn parametrische schattingstechnieken (Searle 1971, Agresti 2002). De regressiemodellen zijn vervolgens getoetst naar de mate waarin ze in staat zijn om de geobserveerde waarnemingen (al dan niet geaggregeerd) te reproduceren. Een voorbeeld van een dergelijke toetsing is het vergelijken van de modelschattingen met de (gewogen) directe schattingen van het aandeel fysiek zwaar werk per COROP-regio (figuur 2.1). De modelschattingen blijken ook zonder het kenmerk COROP-regio een goede benadering op te leveren voor de aandelen fysiek zwaar werk per regio. Dit betekent dat de regionale variatie in fysiek zwaar werk voor een belangrijk deel samenhangt met de regionale verdeling van andere kenmerken dan COROP-regio.

2.1 Vergelijking modelschattingen met directe schattingen per Corop-regio1)
Aandeel fysiek zwaar werk per regio (%) Modelschatting (%)
30,81989732,183031
31,03692732,360802
31,35176532,618689
33,17552834,112553
33,34501934,251384
35,3249335,873149
35,59333336,093002
36,00973136,434077
36,53031236,860491
36,98265237,231007
37,57381137,715231
37,57423237,715576
38,02751538,086865
38,362438,361172
38,47328938,452003
38,53254538,50054
39,39460339,206661
39,53771139,323882
39,64325439,410334
40,09816139,782953
40,14196239,81883
40,18040539,850319
40,20092239,867125
40,76624340,330185
40,95097840,481504
41,03261540,548373
41,31961540,783458
42,0214341,358322
42,12321341,441693
42,54491341,787112
42,81700342,009984
43,98725642,968551
44,11530443,073436
44,34727943,263449
44,68333843,538718
45,07731643,86143
45,28078744,028095
45,41079544,134586
46,1980744,779451
56,06941352,86517
1) R2-adj: 0,85

Een beperking bij de uitvoering van de analyses is dat vanwege het split-half vragenlijstontwerp niet altijd alle variabelen tegelijkertijd in samenhang kunnen worden bekeken. Zo zijn bijvoorbeeld variabelen die van belang zijn voor de analyse van werkdruk in verschillende clusters van de split-half vragenlijst opgenomen: de kenmerken ‘emotioneel zwaar werk’, en ‘intimidatie door klanten’ bevinden zich in cluster 1, en een aantal variabelen ten aanzien van verwachtingen van het werk bevinden zich in cluster 2. Variabelen die in slechts één van de clusters voorkomen zijn niet in de analyse opgenomen.

In dit artikel is gekozen voor de regionale indeling volgens de COROP-classificatie. Deze classificatie betreft een regionaal niveau tussen gemeenten en provincies in en is de meest gedetailleerde regionale indeling waarvoor in dit artikel nog betrouwbare schattingen gerealiseerd konden worden. De COROP-regio-indeling komt overeen met niveau 3 van de Europese NUTS-indeling. De ‘Nomenclature des Unités Territoriales Statistiques’ (NUTS) wordt voor de regionalisering van statistieken door Eurostat gehanteerd.