2. Data en methode
De basis van de netwerkanalyse vormen de persoonsnetwerkdata, de belangrijkste variabelen zijn exposure en segregatie. Met een lineaire regressie wordt de relatie tussen persoonskenmerken en segregatie onderzocht.
2.1 Het persoonsnetwerk
Het persoonsnetwerk bevat relaties tussen personen. Hierin worden vijf hoofdtypen relaties onderscheiden: huisgenoten, familie, buren, collega’s en klasgenoten (CBS, 2023b-2023f). Aan de basis van het netwerk liggen de Basisregistratie Personen (BRP), de Polisadministratie van de Belastingdienst en integrale onderwijsregisters van de Dienst Uitvoering Onderwijs (DUO), zoals opgenomen in het Stelsel van Sociaal-statistische Bestanden (SSB). De gegevens worden gepseudonimiseerd verwerkt en zijn nooit te herleiden naar individuele personen (CBS, 2022b).
Vanaf 2009 wordt het persoonsnetwerk jaarlijks afgeleid. Het netwerk bestaat uit personen die op 1 januari van het betreffende verslagjaar staan ingeschreven als inwoner van Nederland. Het gaat in het persoonsnetwerk om administratieve relaties, het is onbekend of mensen elkaar daadwerkelijk kennen, en hoe vaak ze contact met elkaar hebben. Ook ontbreken sociale relaties in dit netwerk, zoals onlinecontacten of kennissen van bijvoorbeeld de sportclub of het gebedshuis. De relaties in het persoonsnetwerk kunnen worden gezien als reservoir van potentiële contacten. Voor uitgebreidere informatie over de afleiding van het netwerk zie de bijlage en de documentatie op cbs.nl (CBS, 2023b-2023f).
2.2 Exposure
Voor elke persoon in Nederland wordt vanuit bestanden met huisgenoten, familie, buren, collega’s en klasgenoten een zogenaamd ego-netwerk samengesteld (Van der Laan et al., 2023). Dit ego-netwerk bevat alle personen in Nederland die vanuit ego via het netwerk te bereiken zijn. Deze personen krijgen een gewicht, dat wordt bepaald door te kijken hoe makkelijk het is om die persoon te bereiken vanuit ego (Ballester & Vorsatz, 2014). Hierdoor tellen personen die in het netwerk dicht bij ego staan (bijvoorbeeld directe contacten, zoals collega’s of buren) zwaarder mee dan personen die meer stappen verwijderd zijn van ego (zoals de zus van ego’s klasgenoot, die twee stappen verwijderd is, of de moeder van de klasgenoot van ego’s kind, die drie stappen verwijderd is). De exposure aan een bepaalde herkomstgroep is dan de gewogen fractie personen van die herkomstgroep in het ego-netwerk. Zo wordt voor elke persoon (ego) de exposure aan verschillende herkomstgroepen berekend. Daarna kan, door deze scores te middelen, per herkomstgroep de exposure worden berekend aan de eigen en andere herkomstgroepen.
2.3 Segregatie
De segregatiescore bouwt voort op de exposure aan de eigen groep: in hoeverre heeft de persoon mensen van de eigen herkomstgroep in het ego-netwerk. De segregatiescore geeft per herkomstgroep aan in hoeverre een groep gescheiden leeft van alle andere herkomstgroepen. Het is een score tussen 0 en 1 waarbij 0 ‘niet gesegregeerd’ en 1 ‘volledig gesegregeerd’ betekent. Het verschil met de exposure is dat in de segregatiescore rekening wordt gehouden met de groepsgrootte van de herkomstgroepen. Als er in een populatie bijvoorbeeld 10 procent personen van herkomst A en 40 procent van herkomst B zijn, is (in een niet-gesegregeerde samenleving) te verwachten dat iedereen ook gemiddeld 10 procent herkomst A en 40 procent herkomst B in het netwerk heeft.
Segregatie meet in hoeverre mensen meer gescheiden van elkaar leven dan op grond van toeval verwacht mag worden. Als mensen met herkomst A méér dan 10 procent mensen van herkomst A in hun netwerk hebben, leven zij in bepaalde mate gesegregeerd: dan is hun segregatiescore hoger dan nul. Voor herkomst B geldt dat zij in bepaalde mate gesegregeerd leven als zij meer dan 40 procent mensen van herkomst B in hun netwerk hebben. Hoe hoog de segregatiescore is, hangt af van het percentage mensen van de eigen herkomst in het netwerk.
Om een eerlijke vergelijking te maken van de exposure tussen groepen, is dus een correctie voor de groepsgrootte nodig. Voor deze correctie is de omvang gebruikt van de groepen in een straal van 30 kilometer rondom iedere individuele persoon. 30 kilometer is gekozen omdat dit het gebied is waarin mensen zich gewoonlijk bewegen in het dagelijks leven. Zo was de gemiddelde woon-werkafstand 22 kilometer in 2022 (CBS Statline, 2022b) en zijn reisafstanden voor allerlei doeleinden – zoals visite, sport en onderwijs – rond de 10 tot 30 kilometer (CBS Statline 2023a). Binnen die 30 kilometer geldt: hoe korter de afstand, hoe vaker een persoon zich hier zal bewegen voor allerlei dagelijkse zaken. Daarom ‘tellen’ mensen op kortere afstanden zwaarder mee dan mensen op langere afstanden binnen deze 30 kilometergrens. Ondanks dat er voor groepsgrootte binnen 30 kilometer gecontroleerd wordt, kan clustering van herkomstgroepen binnen die radius (zoals op buurtniveau) wel een effect hebben op de segregatiescore.
Voor meer informatie en de exacte afleiding, zie Van der Laan et al. (2023).
2.4 Samenhang tussen segregatie en persoonskenmerken
Met een lineaire regressieanalyse wordt onderzocht of en in hoeverre de mate van segregatie samenhangt met sociaaleconomische en demografische factoren. De afhankelijke variabele is de segregatiescore.
De onafhankelijke variabelen zijn:
- Stedelijkheid: stedelijkheid van de woongemeente in vijf categorieën, van ‘niet stedelijk’ tot ‘zeer sterk stedelijk’.
- Sociaaleconomische categorie: sociaaleconomische status van de persoon in vier categorieën: werkende (werknemer, aandeelhouder, zelfstandige), ontvanger uitkering (werkloosheidsuitkering, bijstandsuitkering, arbeidsongeschikt, overige sociale voorzieningen), ontvanger pensioen en overige niet-werkende (nog niet schoolgaand, schoolgaand, studerend, overig niet-werkend).
- Inkomen: het gestandaardiseerd besteedbaar huishoudensinkomen onderverdeeld in vijf gelijke groepen huishoudens: kwintielgroepen. Deze groepen representeren elk 20 procent van de inkomens van alle huishoudens in Nederland. De eerste 20 procent-groep representeert de 20 procent laagste inkomens, en de vijfde 20 procent-groep representeert de 20 procent hoogste inkomens. Elk individueel persoon wordt ingedeeld in de kwintielgroep van het bijbehorende huishouden. De kwintielgroepen zijn dus niet per se vijf in omvang gelijke groepen wat personen betreft.
- In Nederland geboren: of een persoon in Nederland geboren is (tweede generatie) of niet. Deze variabele zit alleen in de modellen voor herkomstgroepen buiten Nederland.
Verder zijn leeftijd en geslacht toegevoegd aan de modellen als controlevariabelen, maar deze worden niet gepresenteerd in de resultaten.
Onderwijsniveau is niet meegenomen in de regressiemodellen omdat deze variabele niet betrouwbaar is gemeten voor een groot deel van de onderzochte groep (migranten die geen opleiding in Nederland gevolgd hebben).
Voor elk van de elf herkomstgroepen is een aparte regressieanalyse gedaan, zodat vergeleken kan worden welke variabelen voor welke groepen een positieve of negatieve relatie hebben met de segregatiescore.