3. Gegevens en methode
3.1 Data
Dit onderzoek maakt gebruik van openbare stembureaudata van de Tweede Kamerverkiezingen van 2017, de gemeenteraadsverkiezingen van 2018, en de herindelingsverkiezingen van 2017 en 2018 (Kiesraad, 2017a; Kiesraad, 2017b; Kiesraad, 2018a; Kiesraad, 2018b). De herindelingsverkiezingen vonden enige maanden eerder of later plaats dan de reguliere gemeenteraadsverkiezingen. De heringedeelde gemeenten deden niet mee tijdens de reguliere gemeenteraadsverkiezingen. De stembureaudata bevatten onder andere het aantal kiesgerechtigden zoals geregistreerd bij het stembureau en het aantal mensen dat daadwerkelijk heeft gestemd.
De stembureaudata zijn aan de hand van de postcode gekoppeld aan de CBS-buurtcode voor de buurt waarin het stembureau zich bevindt. De data zijn aan de hand van deze buurtcode geaggregeerd naar buurtniveau, zodat berekend kan worden wat de opkomst per buurt is. Deze buurtcode is tevens gebruikt om buurtgegevens van CBS-StatLine te koppelen aan deze buurten. De buurt is dus het analyseniveau van dit onderzoek. Zie bijlage 2 voor de definitie van alle variabelen in de analyse.
Een belangrijke reden om te kiezen voor stembureaudata gecombineerd met buurtgegevens is het feit dat er relatief weinig andere datasets ingaan op de opkomst van zowel gemeenteraads- als Tweede Kamerverkiezingen. Daarnaast is gebruikmaken van de beperkte hoeveelheid enquêtegegevens die wel ingaat op beide verkiezingen, niet zonder problemen. In enquêtes wordt de opkomst vaak overschat (Schmeets en Van den Brakel, 2015), wat kan leiden tot vertekende resultaten (Sciarini en Goldberg, 2016). Gebruikmaken van buurtgegevens om verklaringen te vinden is niet nieuw als het gaat om partijkeuze (Harteveld, Van der Brug, De Lange en Van der Meer, 2021). Het is echter wel nieuw als het gaat om het verklaren van de opkomst.
Om bij de analyses gebruik te kunnen maken van buurten, zijn twee aannamen gedaan. De eerste vooronderstelling in dit onderzoek is dat kenmerken van buurten, en dus van buurtbewoners, betrekking hebben op de stemgerechtigden van de stembureaus in die buurt. Dit is niet voor honderd procent het geval, omdat niet iedereen stemt in de buurt waar men woont. Er zijn bijvoorbeeld mensen die gaan stemmen op een station of in een ziekenhuis. Voor analysedoeleinden zal dat echter geen ernstige problemen geven, want kiezers gaan over het algemeen naar het dichtstbijzijnde stembureau (Orford, Railings, Trasher en Borisyuk, 2011) en buurten zijn tevens geen totaal gescheiden eenheden: er is enige overlap van kenmerken tussen naastgelegen buurten te verwachten (Sleutjes, De Valk en Ooijevaar, 2018). De tweede vooronderstelling is dat analyseresultaten op buurtniveau niet automatisch vertaald kunnen worden naar relaties op individueel niveau (De Blok en Van der Meer, 2018). Oftewel, er moet worden opgepast dat relaties tussen buurten en opkomst niet altijd direct vertalen zijn naar relaties tussen individuele kiezers en opkomst. Het gaat hierbij om het voorkomen van een zogeheten ‘ecologische fout’ (Kittel, 2006)
3.2 Methode
Om tot conclusies te komen over wat mogelijk het procentuele verschil in opkomst tussen de gemeenteraads- en nationale verkiezingen kan verklaren, wordt gebruikgemaakt van een multilevel lineaire regressieanalyse. Een regressieanalyse biedt de mogelijkheid om de samenhang tussen opkomst en meerdere kenmerken tegelijk te testen. Een multilevel lineaire regressieanalyse wordt gebruikt om te testen of een hoger niveau (gemeenten) effect heeft op een lager niveau (buurten). Daarnaast biedt een multilevel analyse de mogelijkheid om factoren van meerdere niveaus tegelijk te testen, zodat zowel gemeente als buurtkenmerken kunnen worden meegenomen in de analyse. De resultaten van de analyses zijn opgenomen in bijlage B.3 I t/m IV. Model 5 is het complete en meest zuivere model en is gebruikt om uitspraken te doen over het verschil in opkomst.