Innovatief onderzoek naar slachtoffers van high impact crimes

plaatje beta product in ontwikkeling
© Hollandse Hoogte / Westend61 GmbH

High impact crimes (high impact crimes) is een verzamelnaam voor delicten die een grote impact hebben op slachtoffers en de directe omgeving. Voorbeelden van high impact crimes zijn woninginbraken, overvallen, straatroven en geweldsdelicten. Het ministerie van Justitie en Veiligheid zet sterk in op het bestrijden en voorkomen van high impact crimes. Om gerichter beleid te kunnen ontwikkelen is meer informatie nodig over high impact crimes.

Gelijkenissen in groepen slachtoffers van woninginbraak

Het Institute For Financial Crime (IFFC) heeft op verzoek van het ministerie van Justitie en Veiligheid onderzocht of er mogelijkheden zijn om met bestaande databronnen en data-sciencemethoden kennis toe te voegen aan de huidige trendrapportages op het gebied van high impact crimes. Het IFCC heeft het CBS gevraagd om daarbij samen te werken vanwege de kennis op het gebied van databronnen en data-analyse. Een eerste verkenning of data-sciencemethoden kunnen bijdragen aan het (door)ontwikkelen van evidence-based-beleid is hier gedaan door het zoeken naar gelijkenissen tussen slachtoffers van woninginbraak.

Vanuit de theorie is er geen eenduidige indeling om slachtoffers van woninginbraak in zo homogeen mogelijke groepen te verdelen. Ieder slachtoffer is immers uniek. Toch zou een dergelijke indeling van waarde kunnen zijn voor beleidsmakers omdat het handelingsperspectief kan bieden voor het ontwikkelen van meer gerichte maatregelen. Clusteranalyse is een methode die veel wordt gebruikt in big-dataonderzoek.

Kunnen de abstracte resultaten van clusteranalyse interpreteerbaar worden gemaakt voor domeinexperts en daarmee inzichten leveren voor beleidsvraagstukken? In dit pilotonderzoek gaat het vooral om het bepalen van de mogelijkheden en de eventuele bredere toepasbaarheid van de methodologie zelf.

Data en methode

De doelgroep van dit onderzoek betreft personen van 18 jaar en ouder die in 2017 als slachtoffer van woninginbraak zijn geregistreerd bij de politie én in dat jaar ingeschreven stonden in de gemeentelijke Basisregistratie Personen (BRP). Achtergrondkenmerken van deze personen en hun woningen zijn toegevoegd uit verschillende registers die bij het CBS beschikbaar zijn. Daarnaast zijn verschillende criminologische variabelen in het onderzoek meegenomen, zoals de afstand van het slachtoffer van de woninginbraak tot de verdachte (indien bekend), het crimineel verleden van de verdachte en van het slachtoffer, en de woonlocatie.

In dit onderzoek is clusteranalyse toegepast. Deze methode heeft als doel om groepen (clusters) te vinden van personen die qua kenmerken zoveel mogelijk vergelijkbaar zijn. Een kenmerk van deze methode is dat er geen inhoudelijke kennis wordt gebruikt om de clusters te vormen: de data moet voor zichzelf spreken.

Resultaten

Er kunnen zeven homogene clusters van slachtoffers worden onderscheiden. Soortgelijke afwegingen in modelkeuze zijn gemaakt op basis van de interpreteerbaarheid van de clusters en de gangbaarheid van de methode. De clusters bevatten elk zo’n 10 tot 20 procent van alle slachtoffers.

Gezien het grote aantal variabelen is het niet in één oogopslag inzichtelijk welke kenmerken voor elk cluster onderscheidend zijn. Om meer inzicht in de samenstelling van de clusters te krijgen is per kenmerk een visualisatie gemaakt van de verdeling binnen en tussen clusters. Onderstaande figuur geeft de verhouding weer van de leeftijdscategorieën binnen elk van de clusters en van alle volwassen Nederlanders als referentiegroep.

Clusters van slachtoffers, leeftijd
 0 tot 20 jaar (%)20 tot 35 jaar (%)35 tot 50 jaar (%)50 tot 65 jaar (%)65 tot 80 jaar (%)80 jaar of ouder (%)
Cluster 10,019,229,837,610,72,7
Cluster 20,017,545,133,43,60,5
Cluster 30,05,88,824,647,213,7
Cluster 40,09,05,114,233,038,7
Cluster 50,034,237,219,24,84,6
Cluster 60,045,727,419,26,21,5
Cluster 70,050,825,416,65,71,5
Populatie3,023,023,925,818,06,2

Het blijkt dat de clusters verschillen naar leeftijd. Cluster 4 bestaat bijvoorbeeld uit relatief veel 65-plussers, terwijl cluster 7 relatief veel jonge slachtoffers betreft. Verschillen tussen de clusters zijn er ook naar sociaaleconomische categorie. Onderstaande figuur geeft de verdeling weer van deze variabele in de verschillende clusters en in de gehele volwassen bevolking.

Clusters van slachtoffers, sociaaleconomische categorie
 Directeur-grootaandeelhouder (%)Meewerkend gezinslid (%)Ontvanger overige uitkering (%)Ontvanger pensioenuitkering (%)Overig zonder inkomen (%)Werknemer (%)Zelfstandige (%)
Cluster 12,910,203,4911,524,4365,4212,02
Cluster 27,580,163,442,883,3564,1318,46
Cluster 33,160,076,0859,535,0818,477,62
Cluster 40,140,0211,0471,145,7310,071,86
Cluster 50,300,2338,379,3417,4227,237,11
Cluster 62,070,0611,606,4810,3455,7113,74
Cluster 70,730,040,106,9020,8223,807,65
Populatie1,440,1610,4622,8113,5944,257,28

Zo valt het op dat cluster 4 een relatief groot aandeel ontvangers van een pensioenuitkering betreft. Samen met de gegevens over leeftijd begint er een beeld te ontstaan van cluster 4. Het zijn vooral ouderen met een pensioenuitkering.

Opgemerkt moet worden dat de clustermethode weliswaar streeft naar homogeniteit binnen de clusters, niet alle personen in het cluster exact dezelfde kenmerken hebben. Personen zijn immers niet in te delen in volledig homogene groepen. Het benoemen van een cluster is daardoor lastig. Zo zitten in cluster 4 ook personen die niet gepensioneerd zijn maar toch veel gelijkenissen vertonen met de gepensioneerden op de andere variabelen. Denk ook aan personen die wel de pensioengerechtigde leeftijd hebben behaald maar nog niet zijn gestopt met werken.

De beschrijving van de clusters geeft het algemene beeld van een cluster weer en de meest opvallende zaken waarin het cluster verschilt van de andere clusters en/of de Nederlandse bevolking. Het gebruik van een meer geavanceerd clusteralgoritme zou mogelijk kunnen leiden tot een meer verfijnde clustering van slachtoffers.

Sets van indicatoren maken het mogelijk om clusters te interpreteren. De zeven clusters die resulteren uit het clustermodel geven een beschrijving van hoe verschillende groepen van slachtoffers van woninginbraak in Nederland geclassificeerd zouden kunnen worden. Op sommige kenmerken zijn er duidelijke verschillen tussen de clusters, op andere kenmerken verschillen de clusters niet zoveel van elkaar. Zo zie je bijvoorbeeld dat cluster 6 en 7 qua leeftijdsverdeling op elkaar lijken terwijl de sociaaleconomische categorie juist verschillend is verdeeld.

Andersom zien we meer verschillen tussen de leeftijdsverdeling van de clusters 1 en 6 en juist een overeenkomst in het relatief hoge aantal werknemers in de sociaaleconomische categorie. Het is een uitdaging om de clusteromschrijvingen zo objectief mogelijk te maken. Kennis van domeinexperts blijft belangrijk bij de interpretatie van alle informatie die de combinatie van variabelen bevat.

Het Institute For Financial Crime

Het IFFC initieert en stimuleert onderzoek over financiële integriteit en veiligheid – ten behoeve van de bestrijding van financiële economische criminaliteit. Het IFFC biedt een veilige omgeving voor kennisdeling, intervisie en samenwerking tussen uiteenlopende organisaties en hun professionals.

Privacy

Het CBS publiceert gegevens altijd zo dat daaraan geen herkenbare gegevens over een afzonderlijk persoon, huishouden, onderneming of instelling kunnen worden ontleend. Hoewel in dit project gegevens over gepseudonimiseerde individuele slachtoffers van woninginbraak zijn gebruikt als input van het clusteralgoritme, zijn de resulterende clusters altijd zo groot dat geen onthulling van persoonsgegevens plaatsvindt.

Feedback

Wij willen graag weten of de abstracte resultaten van de voorgestelde methode interpreteerbaar zijn en inzichten leveren voor beleidsvraagstukken en willen graag uw mening weten over dit nieuwe onderzoek. Dat kan een algemene indruk zijn, maar ook meer specifieke punten die u goed of niet goed vindt. Is het bijvoorbeeld duidelijk wat er getoond wordt? Zo nee, hoe kunnen we dit verbeteren? En ontbreekt er relevante informatie? Commentaar is welkom op innovatie@cbs.nl.