Auteur(s): Ellen Webbink, Monica Deschinger, Mathilde Herbschleb, Elles van Timmeren, Jeremy Weidum Publicatiedatum: 15-9-2023 00:00

Vermogensonderzoeken in het buitenland 2022

2. Methode

Om een beeld te krijgen van de aantallen met betrekking tot vermogensonderzoeken in het buitenland in 2022, is een enquête aan alle Nederlandse gemeenten gestuurd. De vraagstelling was identiek aan de onderzoeken over 2018 tot en met 2021. Wel is vanaf de uitvraag over verslagjaren 2020/2021 expliciet in de toelichting bij de vragenlijst vermeld dat ook informatie gewenst is over vermogensonderzoeken die gemeenten uitbesteed hebben aan het Internationaal Bureau Fraude-informatie (IBF), dat onderdeel uitmaakt van het Uitvoeringsinstituut Werknemersverzekeringen (UWV). Voor de gemeenten die niet hebben gerespondeerd zijn, voor zover de respons dit toeliet, de aantallen geschat op basis van gemeenten die wel hebben gerespondeerd. In dit hoofdstuk wordt een toelichting gegeven op de manier van uitvragen en de gebruikte ophoogmethode.

2.1 Enquête

Het onderzoek is uitgevoerd middels een enquête die naar alle gemeenten in Nederland is verstuurd. Deze enquête is te vinden in bijlage 1. De gemeenten zijn benaderd via de berichtgevers van de Bijstandsdebiteuren- en fraudestatistiek (BDFS). Een berichtgever is een gemeente of een door een aantal gemeenten opgezette dienst die de gegevens voor de BDFS aanlevert aan het CBS. Een berichtgever kan dus gegevens verstrekken over verschillende gemeenten, maar het omgekeerde komt ook voor: verschillende berichtgevers kunnen over één gemeente rapporteren.

In de enquête zijn de volgende aantallen en bedragen uitgevraagd:

Het aantal gestarte vermogensonderzoeken in het buitenland in 2022.
Het aantal geconstateerde overtredingen van de inlichtingenplicht in 2022 wegens het verzwijgen van vermogen in het buitenland. Het gaat hier om alle overtredingen die in 2022 zijn geconstateerd, ongeacht het jaar waarin het onderzoek is gestart en de sanctie die hierop volgde.
Het aantal opgelegde boetes en vorderingen in dit kader, met een datum besluit in 2022 en de totale beginschuld hiervan. Ook hier geldt dat het bijbehorende onderzoek niet in 2022 hoeft te zijn gestart.

De enquête is begin april 2023 verstuurd naar alle berichtgevers met het verzoek om deze binnen drie weken terug te sturen. Na het verstrijken van de deadline is eind april 2023 een rappelmail verstuurd naar de berichtgevers die nog niet hadden gerespondeerd, met het verzoek de gegevens alsnog binnen drie weken terug te sturen.

2.2 Schatting totale aantallen

2.2.1 Multiple imputation

Om een landelijk beeld te krijgen moet de non-respons worden bijgeschat. De non-respons omvat enerzijds gemeenten die de enquête niet hebben ingevuld en anderzijds gemeenten die wel gerespondeerd hebben, maar geen (volledige) informatie konden geven. Voor de ophoging voor niet-responderende gemeenten en missende waarden is gebruik gemaakt van een methode die goed om kan gaan met het feit dat de aantallen die gemeenten verstrekken vaak zeer laag of nul zijn: Multiple Imputation (Random Hot Deck Imputation, methode predictive mean matching). Hiermee kan de respons worden aangevuld met een schatting, om zo een totaalbeeld te krijgen over de gevraagde cijfers. Bij deze statistische methode wordt bij elke non-respons-gemeente een gelijkende responderende gemeente (donorgemeente) gezocht. Vervolgens wordt de door de responderende gemeente ingevulde waarde geïmputeerd bij de non-responsgemeente. Deze procedure leidt tot een volledig gevulde dataset. Om een zo betrouwbaar mogelijke schatting te krijgen, wordt de imputatieprocedure meerdere keren herhaald, wat leidt tot meerdere volledig gevulde datasets. De daaropvolgende analyse om totaalcijfers voor Nederland te bepalen wordt gebaseerd op het gemiddelde van alle volledig gevulde datasets. De schattingsmethode is uitgevoerd met het statistisch programma R, en specifieker met de package Multivariate imputation by chained equations (MICE).
Bovenstaande analyse is uitgevoerd voor de gevraagde aantallen in de enquête. Het aantal gemeenten dat vermogensonderzoeken is gestart in 2022 (onderzoeksvraag 1), is vervolgens afgeleid op basis van de (geïmputeerde) antwoorden op de vraag naar het aantal gestarte vermogensonderzoeken in het buitenland in 2022 (onderzoeksvraag 2). De gemeenten met een (geïmputeerd) aantal hoger dan 0 tellen mee voor het aantal gemeenten dat vermogensonderzoeken is gestart in 2022. Deze berekening is uitgevoerd voor alle geïmputeerde datasets. Door middel van de totalen van deze datasets kon ook voor dit aantal een schatting worden berekend, op dezelfde manier als voor de aantallen uit de enquête.

Het analyseproces omvat drie stappen.

Stap 1: Controle en correctie
De eerste stap van het analyseproces is het controleren en eventueel corrigeren van de enquêtedata. Bij enquêtes met deels ontbrekende antwoorden zijn deze, indien mogelijk, afgeleid op basis van de overige antwoorden. Wanneer bijvoorbeeld het aantal opgelegde vorderingen 0 was, is de totale beginschuld van de vorderingen ook op 0 gezet, indien deze ontbrak.

Stap 2: Imputatie met behulp van donorgemeente
Voor gemeenten die niet hebben gerespondeerd, is een donorgemeente gezocht die lijkt op de gemeente qua:

het totale aantal vorderingen wegens schending van de inlichtingenplicht (ontstaansgrondcodes 51 tot en met 56 in de BDFS), met een datum besluit in 2022;
gemeentegrootteklasse;
het aandeel personen met een migratieachtergrond;
bevolkingsdichtheid.

Deze kenmerken zijn voor alle gemeenten bekend, ook voor de gemeenten die de enquête niet hebben ingestuurd. De achtergrondkenmerken worden gebruikt als hulpvariabelen om de ontbrekende enquêtedata (de doelvariabelen) te kunnen invullen (imputeren) bij de twee typen non-respons-gemeenten (dat zijn enerzijds gemeenten die de enquête niet hebben ingevuld en anderzijds gemeenten die wel gerespondeerd hebben, maar geen (volledige) informatie konden geven). Deze aanpak is identiek aan die van het eerder uitgevoerde onderzoek.

De vier achtergrondkenmerken zijn op basis van inhoudelijke gronden en ervaring uit het onderzoek over verslagjaar 2018 gekozen. Voor 2018 is met behulp van verkennende analyses (correlaties, chikwadraattoetsen en variantieanalyses), gebaseerd op gemeenten waarvan alle informatie bekend is, geconcludeerd dat deze vier kenmerken de beste bijdrage leveren aan het imputatieproces.

De imputatie van de ontbrekende waarden op basis van een donorgemeente is 100 keer uitgevoerd. In totaal heeft dit geleid tot 100 volledig gevulde datasets plus de originele dataset. Bij elke imputatieronde is opnieuw een donorgemeente gezocht, waardoor de geïmputeerde datasets van elkaar verschillen. Voor elke dataset is een populatietotaal voor de doelvariabele geschat. De uiteindelijke schattingen van de aantallen zijn de gemiddelden van de 100 schattingen. Bij de imputatie van de ontbrekende waarden op basis van een donorgemeente zijn geen gemeenten uitgesloten. De reden hiervan is dat er geen gemeente als uitbijter is beschouwd.

Stap 3: Onzekerheidsmarges berekenen
Omdat de aantallen die in deze publicatie gepresenteerd worden voor een deel geschat zijn, hebben de uitkomsten een bepaalde onzekerheidsmarge.
Op basis van de spreiding in de 100 verschillende schattingen kan een onzekerheidsmarge worden bepaald van de uiteindelijke schatting van de aantallen. Voor de schattingen zijn marges en relatieve marges berekend om uitspraken te kunnen doen over de nauwkeurigheid van de schattingen. De onzekerheidsmarges zijn op de volgende manier berekend:

Marge = $s q r t (\frac{\sum (y - \bar{y})^{2}}{n - 1}) * (1 + \frac{1}{n}) * 1, 96$

Waarbij:
y = schatting in geïmputeerde dataset
ӯ = gemiddelde aantal van alle schattingen (puntschatting)
n = aantal imputaties

De marges zijn vervolgens gebruikt om een 95%-betrouwbaarheidsinterval voor de schatting te construeren. Het 95%-betrouwbaarheidsinterval geeft een indicatie dat de puntschatting van het aantal binnen deze range zal liggen. Dit betekent dat er een kleine kans is dat het aantal hoger of lager dan dit interval is.

Om te bepalen of de schattingen betrouwbaar zijn, wordt naast de marges ook gekeken naar het waardenbereik van de doelvariabelen. Een klein aantal verschillende waarden met daarbij een grote spreiding, maakt het moeilijker om een betrouwbaar model samen te stellen waarmee kan worden bijgeschat voor de non-respons.

2.3 Gebruikte bronnen

Naast de gegevens die uit de enquête beschikbaar zijn gekomen, is ook gebruik gemaakt van informatie uit de Bijstandsdebiteuren en -fraudestatistiek (BDFS) en van cijfers op gemeenteniveau afkomstig van CBS StatLine.

Bijstandsdebiteuren en -fraudestatistiek (BDFS)
Voor het bepalen van het totale aantal vorderingen wegens schending van de inlichtingenplicht met een datum besluit in 2022 is de BDFS gebruikt. De BDFS is een maandstatistiek en bevat informatie die door gemeenten en de Sociale Verzekeringsbank (SVB) wordt aangeleverd over de in Nederland openstaande schulden die ontstaan zijn vanuit de algemene- en bijzondere bijstand, IOAW, IOAZ en Bbz (waaronder de Tozo en versoepeld Bbz) en de studietoeslag (als aparte regeling onder de Participatiewet m.i.v. april 2022). Maandelijks worden bestanden met gegevens over afzonderlijke vorderingen door de gemeenten en de SVB aan het CBS verstrekt. Gegevens van de SVB zijn in de analyse niet meegenomen. In de analyse zijn per gemeente alle vorderingen met codes 51 tot en met 56 en 58 op het kenmerk Ontstaansgrond vordering en een datum besluit in 2022 meegenomen.

Er is gebruik gemaakt van transactiebestanden. De term transactiebestand wordt gebruikt voor de bestanden waarin de administratief vertraagde informatie voor de twee verslagmaanden volgend op een bepaalde verslagmaand wordt gebruikt om de data voor die verslagmaand te verbeteren.

CBS StatLine
De overige gegevens die zijn gebruikt in de ophogingsmethode (gemeentegrootteklasse, het aandeel personen met een migratieachtergrond en de bevolkingsdichtheid) zijn ontleend aan tabellen op gemeenteniveau die zijn gepubliceerd op CBS StatLine¹⁾.

¹⁾ Bronnen: Regionale kerncijfers Nederland 2022, Gebieden in Nederland 2022