2. Methode

Om een beeld te krijgen van het aantal vermogensonderzoeken in het buitenland in 2023, is een enquête aan alle Nederlandse gemeenten gestuurd. De vraagstelling was identiek aan de onderzoeken over 2018 tot en met 2022. Wel is vanaf de uitvraag over verslagjaren 2020/2021 in de toelichting bij de vragenlijst expliciet vermeld dat ook informatie gewenst is over vermogensonderzoeken die gemeenten uitbesteed hebben aan het Internationaal Bureau Fraude-informatie (IBF), dat onderdeel uitmaakt van het Uitvoeringsinstituut Werknemersverzekeringen (UWV). Voor de gemeenten die niet hebben gerespondeerd of de vragenlijst niet volledig hebben ingevuld, zijn - voor zover de respons dit toeliet - de missende aantallen geschat op basis van gemeenten die wel hebben gerespondeerd. In dit hoofdstuk wordt een toelichting gegeven op de manier van uitvragen en de gebruikte imputatiemethode.

2.1 Enquête

Het onderzoek is uitgevoerd middels een enquête die naar alle gemeenten in Nederland is verstuurd. Deze enquête is te vinden in bijlage 1. De gemeenten zijn benaderd via de berichtgevers van de Bijstandsdebiteuren- en fraudestatistiek (BDFS). Een berichtgever is een gemeente, of een door een aantal gemeenten opgezette dienst, die de gegevens voor de BDFS aanlevert aan het CBS. Een berichtgever kan dus gegevens verstrekken over verschillende gemeenten, maar het omgekeerde komt ook voor: verschillende berichtgevers kunnen over één gemeente rapporteren.

In de enquête zijn de volgende aantallen en bedragen uitgevraagd:

Het aantal gestarte vermogensonderzoeken in het buitenland in 2023.
Het aantal geconstateerde overtredingen van de inlichtingenplicht in 2023 wegens het verzwijgen van vermogen in het buitenland. Het gaat hier om alle overtredingen die in 2023 zijn geconstateerd, ongeacht het jaar waarin het onderzoek is gestart en de sanctie die hierop volgde.
Het aantal opgelegde boetes en vorderingen in dit kader, met een datum besluit in 2023 en de totale beginschuld hiervan. Ook hier geldt dat het bijbehorende onderzoek niet in 2023 hoeft te zijn gestart.

De enquête is begin april 2024 verstuurd naar alle berichtgevers met het verzoek om deze binnen drie weken terug te sturen. Na het verstrijken van de deadline is eind april 2024 een rappelmail verstuurd naar de berichtgevers die nog niet hadden gerespondeerd, met het verzoek de gegevens alsnog binnen twee weken terug te sturen.

2.2 Schatting totale aantallen

2.2.1 Multiple imputation

Om een landelijk beeld te krijgen moet de non-respons worden bijgeschat. De non-respons omvat enerzijds gemeenten die de enquête niet hebben ingevuld en anderzijds gemeenten die wel gerespondeerd hebben, maar geen (volledige) informatie konden geven. Voor de imputatie van deze niet-responderende gemeenten en missende waarden is gebruik gemaakt van een methode die goed om kan gaan met het feit dat de aantallen die gemeenten verstrekken vaak zeer laag of nul zijn: Multiple Imputation (Random Hot Deck Imputation, methode predictive mean matching). Hiermee kan de respons worden aangevuld met een schatting, om zo een totaalbeeld te krijgen over de gevraagde cijfers. Eerst wordt bij elke non-respons-gemeente een gelijkende responderende gemeente (donorgemeente) gezocht. Vervolgens wordt de door de responderende gemeente ingevulde waarde geïmputeerd bij de non-responsgemeente. Deze procedure leidt tot een volledig gevulde dataset. Om een zo betrouwbaar mogelijke schatting te krijgen, wordt de imputatieprocedure meerdere keren herhaald, wat leidt tot meerdere volledig gevulde datasets. Bij elke imputatieronde is opnieuw een donorgemeente gezocht, waardoor de geïmputeerde datasets van elkaar verschillen. De daaropvolgende analyse om totaalcijfers voor Nederland te bepalen wordt gebaseerd op het gemiddelde van alle volledig gevulde datasets. De schatting is uitgevoerd met het statistisch programma R, en specifieker met het package Multivariate Imputation by Chained Equations (MICE). Bovenstaande analyse is uitgevoerd voor de gevraagde aantallen in de enquête.

Het analyseproces omvat drie stappen.

Stap 1: Controle en correctie

De eerste stap van het analyseproces is het controleren en eventueel corrigeren van de enquêtedata. Bij enquêtes met deels ontbrekende antwoorden zijn deze, indien mogelijk, afgeleid op basis van de overige antwoorden. Wanneer het aantal opgelegde vorderingen bijvoorbeeld 0 was, is de totale beginschuld van de vorderingen ook op 0 gezet, indien deze ontbrak.

Stap 2: Imputatie met behulp van donorgemeente

Voor gemeenten die niet hebben gerespondeerd, is een donorgemeente gezocht die lijkt op de gemeente qua:

het totale aantal vorderingen wegens schending van de inlichtingenplicht (ontstaansgrondcodes 51 tot en met 56 in de BDFS), met een datum besluit in 2023;
gemeentegrootteklasse;
het aandeel personen met een geboorteland buiten Nederland;
bevolkingsdichtheid.

Deze kenmerken zijn voor alle gemeenten bekend, ook voor de gemeenten die de enquête niet hebben ingestuurd. De achtergrondkenmerken worden gebruikt als hulpvariabelen om de ontbrekende enquêtedata (de doelvariabelen) te kunnen imputeren bij de twee typen non-respons-gemeenten (dat zijn enerzijds gemeenten die de enquête niet hebben ingevuld en anderzijds gemeenten die wel gerespondeerd hebben, maar geen (volledige) informatie konden geven). Deze aanpak is identiek aan die van het eerder uitgevoerde onderzoek, behalve dat sinds verslagjaar 2023 ‘het aandeel personen met een geboorteland buiten Nederland’ in plaats van ‘het aandeel personen met een migratieachtergrond’ wordt gebruikt. Het CBS is sinds 2022 namelijk geleidelijk overgegaan op een nieuwe indeling van de bevolking naar herkomst. Voortaan is meer bepalend waar iemand zelf geboren is, naast waar iemands ouders geboren zijn. De indeling westers/niet-westers is vervangen door een indeling op basis van geboorteland van de persoon zelf en diens ouders, waarbij onderscheid wordt gemaakt tussen Europa (incl. Nederland) en buiten Europa.

De vier achtergrondkenmerken zijn op basis van inhoudelijke gronden en ervaring uit het onderzoek over verslagjaar 2018 gekozen. Voor 2018 is met behulp van verkennende analyses (correlaties, chikwadraattoetsen en variantieanalyses), gebaseerd op gemeenten waarvan alle informatie bekend is, geconcludeerd dat deze vier kenmerken de beste bijdrage leveren aan het imputatieproces. Voor 2023 is het vervangen van het kenmerk ‘met migratieachtergrond’ door ‘geboorteland buiten Nederland’ voorafgaand onderzocht en in orde bevonden.

De imputatie van de ontbrekende waarden op basis van een donorgemeente is 100 keer uitgevoerd. In totaal heeft dit geleid tot 100 volledig gevulde datasets plus de originele dataset. Voor elke dataset is een populatietotaal voor de doelvariabele geschat. De gemiddelden van deze 100 schattingen vormen de uiteindelijke geschatte aantallen die opgenomen zijn in de resultaten. Bij de imputatie van de ontbrekende waarden op basis van een donorgemeente zijn geen gemeenten uitgesloten, omdat er geen gemeente als uitbijter is beschouwd.

Stap 3: Onzekerheidsmarges berekenen

Omdat de aantallen die in deze publicatie gepresenteerd worden voor een deel geschat zijn, hebben de uitkomsten een bepaalde onzekerheidsmarge.

Op basis van de spreiding in de 100 verschillende schattingen kan een onzekerheidsmarge worden bepaald van de uiteindelijke schatting van de aantallen. Om uitspraken te kunnen doen over de nauwkeurigheid van de schattingen zijn de marge en relatieve marge als volgt berekend:

Marge = \(\sqrt{\left( \frac{\sum(y-\bar{y})^{2}}{n-1} \right) * (1 + \frac{1}{n})} * 1,96\)

Waarbij:

y = schatting in geïmputeerde dataset
ӯ = gemiddelde van alle schattingen (puntschatting)
n = aantal imputaties

De marges zijn vervolgens gebruikt om een 95%-betrouwbaarheidsinterval voor de schatting te construeren. Het 95%-betrouwbaarheidsinterval geeft een indicatie dat, bij veelvuldig herhalen van de imputatieprocedure (meerdere keren 100 datasets schatten), de werkelijke aantallen in 95 procent van de herhalingen binnen de geschatte range van de puntschatting liggen. Dit betekent dat er een kleine kans is dat het werkelijke aantal hoger of lager dan dit interval is. Hoe breder het interval, hoe minder nauwkeurig de schatting is. De relatieve marge is berekend door de marge te delen door de puntschatting.

Om te bepalen of de schattingen betrouwbaar zijn, wordt naast de marges ook gekeken naar het aantal verschillende waarden van de doelvariabelen en de spreiding hiervan. Een klein aantal verschillende waarden met daarbij een grote spreiding, maakt het moeilijker om een betrouwbaar model samen te stellen waarmee de non-respons kan worden geïmputeerd.

2.3 Gebruikte bronnen

Naast de gegevens die uit de enquête beschikbaar zijn gekomen, is ook gebruik gemaakt van informatie uit de Bijstandsdebiteuren en -fraudestatistiek (BDFS) en van cijfers op gemeenteniveau afkomstig van CBS StatLine.

Bijstandsdebiteuren en -fraudestatistiek (BDFS)

Voor het bepalen van het totale aantal vorderingen wegens schending van de inlichtingenplicht met een datum besluit in 2023 is de BDFS gebruikt. De BDFS is een maandstatistiek en bevat informatie die door gemeenten en de Sociale Verzekeringsbank (SVB) wordt aangeleverd over de in Nederland openstaande schulden die ontstaan zijn vanuit de algemene- en bijzondere bijstand, IOAW, IOAZ en Bbz (waaronder de Tozo en versoepeld Bbz) en de studietoeslag (als aparte regeling onder de Participatiewet m.i.v. april 2022). Maandelijks worden bestanden met gegevens over afzonderlijke vorderingen door de gemeenten en de SVB aan het CBS verstrekt. Gegevens van de SVB zijn in de analyse niet meegenomen. In de analyse zijn per gemeente alle vorderingen met codes 51 tot en met 56 en 58 op het kenmerk Ontstaansgrond vordering¹⁾ en een datum besluit in 2023 meegenomen.

Er is gebruik gemaakt van transactiebestanden. De term transactiebestand duidt bestanden aan waarin de administratief vertraagde informatie voor de twee verslagmaanden volgend op een bepaalde verslagmaand wordt gebruikt om de data voor die verslagmaand te verbeteren.

CBS StatLine

De overige gegevens die zijn gebruikt in de imputatiemethode (gemeentegrootteklasse, het aandeel personen met een geboorteland buiten Nederland en de bevolkingsdichtheid) zijn ontleend aan tabellen op gemeenteniveau die zijn gepubliceerd op CBS StatLine ²⁾

¹⁾ Overtreding inlichtingenplicht: verzwijgen witte inkomsten (code 51), verzwijgen zwarte inkomsten (code 52), verzwijgen vermogensinkomsten (code 53), onjuiste opgave woonadres, onjuiste opgave huishouden, en andere overtreding inlichtingenplicht (code 56). Boete wegens overtreding inlichtingenplicht (met benadelingsbedrag) valt onder code 58.

²⁾Bronnen:
Bevolking; herkomstland, geboorteland, leeftijd, regio, 1 januari 2023
Gebieden in Nederland 2023