3. Conclusie
In dit onderzoek is machinelearing toegepast op een grote verzameling kenmerken uit registerdata over heden en verleden van alle minderjarige kinderen in armoede, hun huishouden, ouders en buurt. Hiermee zijn diverse potentieel stimulerende en remmende factoren voor de kans dat een kind uit armoede komt in samenhang onderzocht en de belangrijkste kenmerken die bijdragen aan de kans geïdentificeerd.
De kans dat een kind uit de armoede komt laat zich op basis van de gebruikte kenmerken goed schatten. Voor kinderen is de kans zelfs beter te schatten dan voor volwassenen, wat in een eerdere studie op een vergelijkbare manier is onderzocht (Laan e.a. 2021, 2022). De belangrijkste kenmerken voor de geschatte kans om uit armoede te komen zijn de leeftijd van het kind (ouder is hogere kans) en de leeftijd van de moeder bij geboorte (ouder is hogere kans), de duur van de armoede (korter is hogere kans), een recente partnerverandering (zowel samenwonen als uit elkaar gaan draagt bij aan hogere kans dan geen verandering), en het hebben van werk (recent werk hogere kans en meer uren hogere kans). Daarnaast zijn er tientallen andere kenmerken die elk een beetje bijdragen aan de geschatte kans.
Kenmerken die om inhoudelijke redenen wel zijn meegenomen in het model maar weinig bijdragen aan de kans om uit armoede te komen zijn de meeste kenmerken van het kind zelf (behalve leeftijd) en van de partner van een ouder, of er een ouder is overleden (te zeldzaam voor een significant effect), en het medicijngebruik van de ouders. De kenmerken ‘eenouderhuishouden’ en ‘herkomst buiten Europa’, beide belangrijke risicofactoren voor armoede (CBS, 2023a), blijken slechts beperkt bij te dragen aan de kans om uit armoede te komen.
Met behulp van een eenvoudig model, dat gebruik maakt van de informatie uit het complexere machinelearningmodel zijn subgroepen bepaald met relatief hoge en lage kansen om uit armoede te komen. Subgroepen met een lage geschatte kans om uit de armoede te komen, zoals subgroep 14 (kinderen onder de 14 jaar, waarbij het huishouden leeft van een uitkering, al langer inkomsarm was en er geen verandering in partnerschap van de ouders is geweest of een ouder/partner is weggegaan uit het huishouden), zijn potentiele doelgroepen voor armoedebeleid.
Eén van de uitkomsten van dit onderzoek is dat met de belangrijkste kenmerken in het model groepen gemaakt kunnen worden die significant verschillen wat betreft hun kans om uit de armoede te komen. Echter binnen die groepen is nog steeds een forse variatie aanwezig die verklaard kan worden door andere kenmerken. Dus hoewel het model bruikbaar is om potentiële doelgroepen voor armoedebeleid te identificeren, is het model niet geschikt en bedoeld om op individueel niveau besluiten te nemen.
Belangrijke kanttekening bij dit onderzoek is dat alle geïdentificeerde verbanden correlaties zijn en niet noodzakelijkerwijs causale verbanden. Een belangrijk kenmerk kan oorzaak zijn maar ook gevolg, of er kan een andere oorzaak ten grondslag liggen aan het verband tussen een kenmerk en de kans om uit armoede te komen. Voor de vertaling naar armoedebeleid is inhoudelijke expertise of aanvullend onderzoek naar causaliteit nodig.