Technische toelichting
Data
Dit onderzoek maakt gebruikt van stembureaudata. Deze zijn direct na de verkiezingen door gemeenten verzameld voor alle stembureaus binnen de gemeente. De gemeenten sturen deze gegevens door naar de Kiesraad, die ze samenvoegt en publiceert. De aldus ontstane dataset is echter onvolledig. Niet alle gemeenten leveren namelijk de gegevens aan de Kiesraad en daarnaast sturen gemeenten ook niet altijd de volledige gegevens door. Zo kunnen bijvoorbeeld de postcodes van de stembureaus of het aantal kiesgerechtigden per stembureau ontbreken. Zo is voor de Tweede Kamerverkiezingen 2017 van slechts 45 procent van de stembureaus de gegevens compleet voorhanden (4 288 van de 9 357 stembureaus in Nederland).
Voor dit onderzoek zijn een groot deel van de ontbrekende data aangevuld. De stembureaudataset is na aanvulling voor ongeveer 70 procent compleet. Om te controleren of de uiteindelijke dataset voor de analyse voldoende representatief is, is gekeken hoe de aangevulde dataset zich verhoudt tot de Nederlandse gemiddelden. In bijlage 1 is te zien dat de aangevulde dataset op geselecteerde variabelen inderdaad overeenkomt met de Nederlandse gemiddelden en dus representatief mag worden genoemd.
Het aanvullen van de missende gegevens is onder andere gedaan door deze op te vragen bij gemeenten en missende postcodes van stembureaus te achterhalen via Google Maps en de website Waarismijnstemlokaal?
De data is als eerste aangevuld met missende gemeenten die voldeden aan een of meer criteria.
- Er was sprake van een herindeling;
- PVV, FvD of Leefbaar Rotterdam deden mee met de gemeenteraadsverkiezingen in deze gemeente;
- De gemeente behoort tot een van de grote 40 (G40) gemeenten. Er is specifiek gekozen voor G40, omdat eerder CBS-onderzoek aantoonde dat er qua kiezers voornamelijk verschillen in wijken van grotere gemeentes te vinden zijn.
Additionele analyses
Tijdens de analyse is er naast de additionele test op de statistische assumpties er een extra test gedaan om uit te kunnen sluiten dat een toevoeging van ontbrekende gemeente of buurt zou kunnen leiden tot andere resultaten. Dit is gedaan door willekeurig zestig procent van de dataset weg te laten, zodat de aangevulde dataset nog maar voor veertig procent compleet is. Met deze ‘veertig procent dataset’ zijn nogmaals de analyses uitgevoerd om te kijken of dezelfde resultaten worden gehaald als met de complete aangevulde dataset. In bijlage 1 valt te zien dat de veertig procent dataset bijna hetzelfde oplevert als de complete dataset als het gaat om de gemiddelden waarden. Er valt te zien dat in ‘veertig procent’ model 8 (bijlage 6) dezelfde resultaten worden behaald als het complete model 5 (bijlage 4). Er kan dus met enige zekerheid gesteld worden dat de toevoeging van een ontbrekende gemeente of buurt op de aangevulde dataset geen groot verschil zou maken op de resultaten.
In de analyse worden verschillende modellen gedraaid. Model 0 bevat nog geen variabelen en wordt gebruikt om te bepalen of het inderdaad zo is dat de opkomstpercentages van buurten beïnvloed worden door de gemeente waarin zij zich bevinden. Het model 0 in de analyse stelt dat 71 procent (55,239/(55,239+22,929)) van het verschil tussen de twee verkiezingen wordt verklaard door het buurtniveau en 29 procent wordt verklaard door het gemeentelijk niveau. Ook zijn beide niveaus significant (P<0,001), wat aantoont dat het zinvol is om een multilevel analyse te gebruiken. Voor elk model waarbij de gemeenteraadsverkiezingen en herindelingsverkiezingen in de afhankelijke variabele zit, is een dummy variabele van de datums van de gemeenteraads- en herindelingsverkiezingen toegevoegd om gedeeltelijk te controleren voor verschillen in tijd.
Toelichting buurttypen
De verschillende buurttypes zijn als volgt gedefinieerd:
- Laag inkomen: Percentage van huishoudens in een buurt die bij de 40 procent laagste inkomens in Nederland horen is meer dan 50 procent (N= 733)
- Hoog inkomen: Percentage van huishoudens in een buurt die bij de 20 procent hoogste inkomens in Nederland horen is meer dan 33 procent (N= 383)
- Laagopgeleid: Het percentage laagopgeleiden in een buurt is hoger dan de percentages middelbaar en hoogopgeleiden in dezelfde buurt (N= 266)
- Hoogopgeleid: Het percentage hoogopgeleiden in een buurt is hoger dan de percentages middelbaar en laagopgeleiden in dezelfde buurt (N=653)
- Buurt wel in gemeente met herindeling: buurt valt in een gemeente die in 2017 of 2018 is heringedeeld (N=399)
- Buurt niet in gemeente met herindeling: buurt valt niet in een gemeente die in 2017 of 2018 is heringedeeld (N=2631)
- De definiëring van de variabelen voor de analyse is te vinden in bijlage 2.
StatLine
CBS StatLine (2018). Kerncijfers wijken en buurten, 2018.
CBS StatLine (2019). Bevolking 15 tot 75 jaar; opleidingsniveau, wijken en buurten, 2019.