Voorspelmodel voor Jeugdhulp in Den Haag
Landelijk bestand
Startpunt van de analyse vormde het maken van een landelijke dataset met daarin op wijkniveau het gebruik van Jeugdhulp aangevuld met een groot aantal kenmerken die vanuit literatuur en domeinkennis samenhangen met het gebruik van Jeugdhulp. Het ging hierbij om kenmerken van de jongere zelf (bijvoorbeeld het soort onderwijs en de leeftijd van een jongere) en kenmerken van het gezin (zoals, huishoudtype, hoogte en bron van het inkomen en de gezondheidssituatie binnen het gezin). Voor de analyse zijn alleen wijken meegenomen met 100 of meer inwoners en 69 of meer jongeren met Jeugdhulp zonder verblijf. Verder is, vanwege de vergelijkbaarheid met Haagse wijken, gekozen om alleen wijken van de G44 (de G40 gemeenten plus de G4) te analyseren. Binnen het landelijk databestand met G44-wijken was nog veel variatie zichtbaar in het aantal inwoners per wijk en om te voorkomen dat dit aantal als belangrijk voorspellend wijkkenmerk geselecteerd zou worden, is besloten om uit te gaan van de proportie Jeugdhulpgebruikers en de proportie van verklarende kenmerken.
Model
Op deze landelijke dataset is een paneldata-analyse uitgevoerd over de jaren 2017 tot en met 2020. Omdat wijken onderling verschillen in het aandeel jongeren met Jeugdhulp en dit aandeel jeugdhulpgebruikers binnen wijken weinig varieert in de tijd, is besloten een random model toe te passen in de vorm van een multilevel groeimodel. In dit model wordt naast de variatie binnen en tussen wijken rekening gehouden met de hiërarchische structuur die in de data aanwezig is en met de tijd. Zo zijn metingen van wijken in de tijd in dit model geclusterd binnen wijken en deze wijken zijn weer onderdeel van een gemeente. Het model is getraind op een set van 1.529 waarnemingen en getest op een set van 761 waarnemingen. De splitsing in test- en training-set is gemaakt op gemeenteniveau. Alle wijken van eenzelfde gemeente komen hierdoor alleen voor in de training-set of in de test-set. De gemeente Den Haag maakte onderdeel uit van de test-set zodat vastgesteld kon worden hoe nauwkeurig voorspellingen zijn voor de Haagse wijken.
Resultaten
Het model waar de Gemeente Den Haag op uit is gekomen is een model met drie kenmerken: het aandeel eenoudergezinnen in een wijk, het aandeel jongeren van 8 tot en met 12 jaar en het aandeel jongeren dat speciaal basisonderwijs volgt. Al deze kenmerken hangen positief samen met Jeugdhulpgebruik en gevonden relaties zijn statistisch significant (met betrouwbaarheid van 95 procent). De omvang van de voorspelfout van het model is bepaald door het berekenen van de RMSE en de MAPE. De RMSE staat voor Root Mean Square Error en geeft de gemiddelde afwijking van het voorspelde aantal Jeugdhulpgebruikers ten opzichte van het werkelijk aantal gebruikers weer in aantal personen. De RMSE bedroeg 142 personen voor de gehele landelijke test-set en 43 personen voor de gemeente Den Haag. De MAPE (Mean Absolute Percentage Error) geeft aan hoeveel procent het werkelijke aantal Jeugdhulpgebruikers per wijk gemiddeld genomen afwijkt van het voorspelde aantal Jeugdhulpgebruikers. De MAPE bedroeg 14,5 procent voor de gehele test-set en 9,5 procent voor de gemeente Den Haag. Voor beide maten geldt dat hoe lager de waarde is, des te beter het model in staat is het gebruik van Jeugdhulp te voorspellen.
Dit onderzoek is via remote access uitgevoerd door onderzoekers van de gemeente Den Haag.