2. Data en methoden
Data
Het onderzoek naar de regionale verschillen in arbeidsomstandigheden is uitgevoerd met data van de Nationale Enquête Arbeidsomstandigheden (NEA) 2022 van het CBS en TNO. Het doel van de NEA is het in kaart brengen van de arbeidsomstandigheden van werknemers en deze in verband te brengen met kenmerken van de persoon en het bedrijf waar de werknemer in dienst is. De nettosteekproef bedroeg in 2022 ongeveer 61 duizend werknemers van 15 tot 75 jaar die in Nederland wonen en werkzaam zijn.
Vanaf het verslagjaar 2022 verschilt de wijze waarop gegevens voor de NEA zijn verzameld en verwerkt op enkele punten van eerdere verslagjaren. Daardoor zijn de cijfers vanaf 2022 mogelijk niet in alle gevallen vergelijkbaar met de cijfers tot en met 2021. Meer informatie is beschikbaar in de onderzoeksbeschrijving van de NEA 2022
Het steekproefontwerp is op een aantal punten gewijzigd ten aanzien van dat in 2021: er vindt geen oversampling meer plaats van jongeren en van personen met een niet-westerse migratieachtergrond, en na trekking is de steekproef willekeurig onderverdeeld in twee clusters voor het split-half vragenlijstontwerp. Bij het split-half vragenlijstontwerp worden (deels) verschillende sets van vragen gebruikt in de twee clusters. Zodoende is het aantal gemeten doelvariabelen uitgebreid zonder substantiële toename van het aantal vragen per respondent.
Vanwege de gewijzigde waarneming via een split-half vragenlijst is ook de weegprocedure in 2022 aangepast ten opzichte van die in voorgaande jaren. Clusters 1 en 2 zijn apart gewogen door middel van poststratificatie naar geslacht, leeftijd, herkomst, type huishouden, bedrijfstak, type contract en persoonlijk inkomen.
Methode
Uit de NEA-data zijn kenmerken geselecteerd die mogelijk verband houden met de regionale variatie in fysiek zwaar werk, autonomie en werkdruk. De selectie gebeurde in een drietal stappen:
- Voorselectie van variabelen op inhoudelijke gronden. Bijvoorbeeld het soort beroep gaat naar verwachting in sterke mate samen met de kans op zware lichamelijke belasting in het werk (Douwes et al., 2020). Deze variabele wordt daarom opgenomen in de lijst van te beschouwen variabelen. Van sommige andere variabelen is weliswaar een samenhang met fysiek zwaar werk te verwachten, maar lijkt de richting van de causaliteit eerder in de omgekeerde richting te liggen. Een voorbeeld van zo’n variabele is de leeftijd tot waarop de persoon wil doorwerken. Dit type variabelen wordt daarom niet opgenomen.
- De variabelenverzameling van de voorselectie is verder ingeperkt met de CHAID-beslisboom. De CHAID-beslisboom is een niet-parametrische methode waarmee de samenhang van een doelvariabele met andere variabelen en hun interacties in beeld wordt gebracht (IBM SPSS 2013, Kass 1980).
- De uitkomsten van de datareductie met CHAID vormden het startpunt voor het opstellen van expliciete (lineaire) regressiemodellen. Lineaire regressie (en logistische regressie) zijn parametrische schattingstechnieken (Searle 1971, Agresti 2002). De regressiemodellen zijn vervolgens getoetst naar de mate waarin ze in staat zijn om de geobserveerde waarnemingen (al dan niet geaggregeerd) te reproduceren. Een voorbeeld van een dergelijke toetsing is het vergelijken van de modelschattingen met de (gewogen) directe schattingen van het aandeel fysiek zwaar werk per COROP-regio (figuur 2.1). De modelschattingen blijken ook zonder het kenmerk COROP-regio een goede benadering op te leveren voor de aandelen fysiek zwaar werk per regio. Dit betekent dat de regionale variatie in fysiek zwaar werk voor een belangrijk deel samenhangt met de regionale verdeling van andere kenmerken dan COROP-regio.
Aandeel fysiek zwaar werk per regio (%) | Modelschatting (%) |
---|---|
30,819897 | 32,183031 |
31,036927 | 32,360802 |
31,351765 | 32,618689 |
33,175528 | 34,112553 |
33,345019 | 34,251384 |
35,32493 | 35,873149 |
35,593333 | 36,093002 |
36,009731 | 36,434077 |
36,530312 | 36,860491 |
36,982652 | 37,231007 |
37,573811 | 37,715231 |
37,574232 | 37,715576 |
38,027515 | 38,086865 |
38,3624 | 38,361172 |
38,473289 | 38,452003 |
38,532545 | 38,50054 |
39,394603 | 39,206661 |
39,537711 | 39,323882 |
39,643254 | 39,410334 |
40,098161 | 39,782953 |
40,141962 | 39,81883 |
40,180405 | 39,850319 |
40,200922 | 39,867125 |
40,766243 | 40,330185 |
40,950978 | 40,481504 |
41,032615 | 40,548373 |
41,319615 | 40,783458 |
42,02143 | 41,358322 |
42,123213 | 41,441693 |
42,544913 | 41,787112 |
42,817003 | 42,009984 |
43,987256 | 42,968551 |
44,115304 | 43,073436 |
44,347279 | 43,263449 |
44,683338 | 43,538718 |
45,077316 | 43,86143 |
45,280787 | 44,028095 |
45,410795 | 44,134586 |
46,19807 | 44,779451 |
56,069413 | 52,86517 |
1) R2-adj: 0,85 |
Een beperking bij de uitvoering van de analyses is dat vanwege het split-half vragenlijstontwerp niet altijd alle variabelen tegelijkertijd in samenhang kunnen worden bekeken. Zo zijn bijvoorbeeld variabelen die van belang zijn voor de analyse van werkdruk in verschillende clusters van de split-half vragenlijst opgenomen: de kenmerken ‘emotioneel zwaar werk’, en ‘intimidatie door klanten’ bevinden zich in cluster 1, en een aantal variabelen ten aanzien van verwachtingen van het werk bevinden zich in cluster 2. Variabelen die in slechts één van de clusters voorkomen zijn niet in de analyse opgenomen.
In dit artikel is gekozen voor de regionale indeling volgens de COROP-classificatie. Deze classificatie betreft een regionaal niveau tussen gemeenten en provincies in en is de meest gedetailleerde regionale indeling waarvoor in dit artikel nog betrouwbare schattingen gerealiseerd konden worden. De COROP-regio-indeling komt overeen met niveau 3 van de Europese NUTS-indeling. De ‘Nomenclature des Unités Territoriales Statistiques’ (NUTS) wordt voor de regionalisering van statistieken door Eurostat gehanteerd.