5. Samenvatting en conclusies
Het ministerie van OCW wil het financiële verdeelmodel voor voortijdig schoolverlaten (vsv) herzien. Het CBS heeft op verzoek van het ministerie van OCW verkend of het mogelijk is om, op basis van kenmerken die in registraties bij het CBS aanwezig zijn, een indicator te ontwikkelen om de omvang van de vsv-problematiek per regio te schatten. Het is voor het ministerie van OCW daarbij belangrijk dat de nieuwe indicator geen perverse prikkels kent en daarnaast transparant en duidelijk is, zodat regio’s begrijpen hoe het geld wordt verdeeld.
Het huidige rapport betreft de resultaten uit de eerste fase van het onderzoekstraject. Hierbij stond de vraag centraal of een model ontwikkeld kan worden om per leerling of student de kans op vsv te schatten. Daarbij werd onderzocht welke combinatie van kenmerken het beste hiervoor gebruikt kan worden. Eerder onderzoek liet al zien dat het daarbij belangrijk is om onderscheid te maken tussen het vo en het mbo. Op basis van suggesties van de begeleidingscommissie en eerdere onderzoeken van het CBS is vervolgens een lijst met mogelijke verklarende variabelen van vsv opgesteld. De basis van de uitgevoerde analyse vormde een zogenaamde stepwise-selectieprocedure, waarbij stap voor stap het kenmerk met de grootste verklaringskracht wordt toegevoegd aan het model, totdat het model niet of nauwelijks meer verbetert. Vervolgens zijn verschillende aanvullende analyses uitgevoerd om de kwaliteit en stabiliteit van de modellen te beoordelen. De resultaten hiervan zijn gebruikt om voor zowel het vo als het mbo een voorkeursmodel te selecteren.
Voor het vo bestaat het voorkeursmodel uit zeven kenmerken:
- leeftijd van de leerling;
- onderwijssoort;
- opgelopen vertraging;
- ouderlijke structuur;
- welvaartsniveau van het huishouden;
- of de leerling verdachte is geweest van een misdrijf; en
- de aanwezigheid van problematische schulden in het huishouden.
Het verder toevoegen van extra kenmerken leidde niet tot een duidelijk betere kwaliteit van het model en maakte daarnaast het model minder stabiel wanneer we dit vergeleken met een eerder cohort en data van DUO. Op basis van de validatie met deze cohorten en de resultaten van kruisvalidaties concluderen we dat dit voorkeursmodel een betrouwbare schatting geeft van de kans op vsv voor individuele leerlingen in het vo.
Het voorkeursmodel in het mbo bestaat uit meer kenmerken, namelijk twaalf:
- niveau van de mbo-opleiding;
- leeftijd van de student;
- ouderlijke structuur;
- of de student verdachte is geweest van een misdrijf;
- geslacht van de student;
- hoogst behaalde opleidingsniveau van de moeder;
- de aanwezigheid van problematische schulden;
- de gevolgde leerweg en onderwijsrichting;
- welvaartsniveau van het huishouden;
- of de student psychosociale problemen heeft; en
- de stedelijkheid van de buurt waar de student woont.
Het verder toevoegen van kenmerken leidde na het twaalfde kenmerk nauwelijks nog tot verbetering van het model. De validatie op basis van een eerder cohort en data van DUO liet zien dat dezelfde eerste twaalf kenmerken worden geselecteerd. Dit bevestigde de stabiliteit van het voorkeursmodel. Wij concluderen op basis van de kwaliteit en de stabiliteit dan ook dat het voorkeursmodel een betrouwbare schatting van de kans op vsv voor individuele studenten in het mbo geeft.
Verder is door middel van een multilevel analyse onderzocht of het nuttig is om bij de ontwikkeling van de modellen voor vsv rekening te houden met clustering van jongeren op schoolniveau (enkel voor vo) of op RMC-regioniveau (voor vo en mbo). Uit deze analyse bleek dat er relatief weinig clustering bestaat op RMC-regioniveau. Op schoolniveau is in het vo wel enige clustering aanwezig, maar deze kan grotendeels worden verklaard door de kenmerken uit het voorkeursmodel. De geschatte coëfficiënten uit het voorkeursmodel veranderden bovendien nauwelijks als een schooleffect werd toegevoegd. Onze conclusie is daarom dat uitbreiding van het voorkeursmodel voor vo en mbo met een multilevel-component niet of nauwelijks zou leiden tot betere schattingen van vsv op regionaal niveau.
Voor de totstandkoming van het model zijn kenmerken meegenomen die het CBS integraal (voor alle jongeren en hun ouders) tot zijn beschikking heeft vanwege zijn wettelijke taak. Het is mogelijk dat er andere kenmerken zijn, waarvoor de integrale gegevens momenteel niet bij het CBS aanwezig zijn, die mogelijk wel gerelateerd zijn aan de kans op vsv. Zoals eerder is genoemd laten de resultaten van de multilevel analyses echter zien dat er relatief weinig clustering is op RMC-regioniveau. Dat wil zeggen dat we waarschijnlijk geen kenmerken missen die op regioniveau van groot belang zijn.
Tot slot geven we een korte vooruitblik naar de tweede fase van dit onderzoekstraject. In deze fase zal een methode worden uitgewerkt om de geschatte kansen op individueel niveau te aggregeren naar een score per RMC-regio en zullen de gevolgen van de nieuwe verdeelsystematiek in kaart worden gebracht. Hierbij zullen aanvullende keuzes gemaakt moeten worden door het ministerie van OCW, bijvoorbeeld of er met bepaalde grenswaardes gewerkt zal worden, hoe in de uiteindelijke indicator onderscheid gemaakt zal worden tussen het vo en het mbo, en of een mogelijke verdere versimpeling van het voorkeursmodel tot een vergelijkbare verdeling van het budget leidt. In deze fase zullen diverse opties voor de aggregatie naar RMC-niveau met elkaar worden vergeleken en als input dienen voor het beslisproces van het ministerie van OCW. Het is aan het ministerie van OCW om op basis van deze resultaten af te wegen wat het meest gewenste beleidsalternatief is.