Regionale verdeelsleutel op basis van risicoscores voor voortijdig schoolverlaten

2. Modellen om kans op vsv te berekenen

In dit hoofdstuk wordt op hoofdlijnen beschreven hoe voor vo-leerlingen en mbo-studenten de kans op voortijdig schoolverlaten geschat wordt. De kans op vsv wordt voor vo-leerlingen en mbo-studenten apart geschat. De reden hiervoor is dat op basis van eerder onderzoek bekend is dat zowel de kans op vsv als de kenmerken die samenhangen met de kans op vsv voor het vo anders zijn dan voor het mbo. Daarom is zowel een model voor vsv op vo als een model voor vsv op mbo geschat. Meer informatie over de ontwikkeling van de modellen is te vinden in een eerdere CBS-publicatie over dit onderwerp. 

2.1 Conceptuele modellen voor kans op vsv 

Om de kans op vsv zo goed mogelijk te schatten is door het CBS en OCW, in samenwerking met de begeleidingscommissie (zie bijlage 1), een lijst van kenmerken opgesteld die de kans op vsv mogelijk zouden kunnen verklaren. Deze lijst bevat meer dan 25 kenmerken op vier domeinen: 

  1. Sociaal-demografische kenmerken (bijvoorbeeld leeftijd en geslacht)
  2. De aanwezigheid van problemen bij jongeren en/of hun ouders (zoals psychosociale problemen, geregistreerde problematische schulden en verdenkingen van misdrijven) 
  3. Omgevingskenmerken (bijvoorbeeld stedelijkheid van de buurt waarin jongeren wonen)
  4. Onderwijsgerelateerde kenmerken (denk hierbij aan het soort onderwijs en of er sprake is van studievertraging). 

Van deze kenmerken is eerst in kaart gebracht in welke mate deze samenhangen met de kans op vsv. Vervolgens is door middel van een iteratief proces het methodologisch gezien optimale model geselecteerd.9) Hieruit zijn twee modellen gekomen met de beste combinatie van kenmerken om voor het vo dan wel mbo de kans op vsv te schatten. In het voorkeursmodel om vsv op het vo te kunnen schatten, zijn uiteindelijk zeven verklarende kenmerken voor vsv opgenomen (zie Figuur 2.1.1). In het model om de kans op vsv op het mbo te kunnen schatten wordt gekeken naar twaalf kenmerken (zie Figuur 2.1.2). 

S oc i a al- d e m og r a fi s ch L eeftijd Ouderlijke structuur W e l v aa r t huishouden A a n w ez i g h e i d p r o bl e m e n Ps y chosociale p r oblemen V e r dachte v an misdrijf O n d erw i js Onde r wijssoo r t V e r t r aging K a n s o p v s v v o 2.1.1 G e s e l e c t ee r d e k e n m e r k e n i n h e t v o- m o d e l Sociaal-demografisch Leeftijd Ouderlijke structuur Welvaart huishouden Aanwezigheid problemen Psychosociale problemen Verdachte van misdrijf Onderwijs Onderwijssoort Vertraging Kans op vsv vo 2.1.1 Geselecteerde kenmerken in het vo-model

S oc i a al- d e m og r a fi s ch Geslacht L eeftijd Ouderlijke structuur Opleidingsni v e au moeder W e l v aa r t huishouden A a n w ez i g h e i d p r o bl e m e n V e r dachte v an misdrijf P r oblematische schulden Ps y chosociale p r oblemen O n d erw i js Mbo-ni v e au L ee r weg Onde r wijsrichting O m g e v i n g s k e n m e r k e n S tedelijkheid buu r t K a n s o p v s v m bo 2.1.2 G e s e l e c t ee r d e k e n m e r k e n i n h e t m bo- m o d e l Sociaal-demografisch Geslacht Leeftijd Ouderlijke structuur Opleidingsniveau moeder Welvaart huishouden Aanwezigheid problemen Verdachte van misdrijf Problematische schulden Psychosociale problemen Onderwijs Mbo-niveau Leerweg Onderwijsrichting Omgevingskenmerken Stedelijkheid buurt Kans op vsv mbo 2.1.2 Geselecteerde kenmerken in het mbo-model

2.2 Modellen voor schatten kans op vsv voor vo en mbo

In de vorige paragraaf staat in de conceptuele modellen weergegeven op basis van welke kenmerken de kans op vsv in het vo en in het mbo geschat wordt. In paragraaf 2.2. wordt beschreven hoe de kenmerken uit deze conceptuele modellen samenhangen met de kans op vsv in het vo en in het mbo. Met andere woorden, in deze paragraaf wordt weergegeven of de kenmerken een grote invloed hebben op de kans op vsv en of het kenmerk de kans op vsv juist verkleint of vergroot (voor meer informatie over de selectie van de modellen, zie de eerdere CBS-publicatie). 

Om de kans op vsv te schatten op basis van deze kenmerken zijn zogenaamde logistische regressiemodellen geschat. Dit omdat de afhankelijke variabele, de kans op vsv, binair is (wel of geen vsv).10) De kans op vsv wordt als volgt bepaald. Er wordt gekeken naar leerlingen/studenten tot 27 jaar11) die in een bepaald jaar ingeschreven staan in het bekostigd vo, mbo of voortgezet algemeen volwassenenonderwijs (vavo) die op dat moment nog geen startkwalificatie hadden en die het jaar erna niet meer ingeschreven staan in het bekostigd onderwijs en (nog steeds) geen startkwalificatie hebben. De groep vavo-leerlingen is relatief klein. Daarom kon voor deze groep geen apart model geschat worden. Deze leerlingen worden daarom tot de vo-populatie gerekend. Verder zitten niet alle jongeren in de doelpopulatie. Jongeren die onderwijs volgen dat niet direct opleidt tot een diploma/startkwalificatie (bijvoorbeeld praktijkonderwijs) of jongeren voor wie het met de beschikbare data niet mogelijk is om in kaart te brengen of zij een diploma/startkwalificatie halen (bijvoorbeeld Internationaal Baccalaureaat) zitten niet in de doelpopulatie.

Het basismodel is gebaseerd op leerlingen en studenten die op 1 oktober 2018 ingeschreven stonden in het vo, mbo of vavo. Dit is het meest recente cohort (2018/’19) dat onderwijs volgde voordat de coronapandemie uitbrak.12) Omdat de coronacrisis (hierna afgekort tot corona) mogelijk invloed had op de aanwezigheid en ontwikkeling van vsv werd het wenselijk geacht een model te ontwikkelen op basis van data waar corona nog geen invloed kon hebben op vsv (vanuit de redenering dat het model dan een beter algemeen beeld geeft van vsv en daardoor meer toekomstbestendig is).13) Om de stabiliteit van de bevindingen in kaart te brengen zijn de modellen nogmaals geschat voor het cohort 2016/’17, het cohort 2017/’18 én het cohort 2021/’22. Dit laatste cohort is het meest recente cohort dat op het moment van dit onderzoek met de beschikbare data in kaart gebracht kon worden. Dit cohort volgde deels onderwijs tijdens de coronacrisis.14)

In Tabel 2.2.1 staat voor het vo weergegeven hoe de kenmerken samenhangen met de kans op vsv en Tabel 2.2.2 toont hoe de kenmerken in het mbo samenhangen met de kans op vsv. De kenmerken die het sterkst samenhangen met de kans op vsv staan bovenaan in deze tabellen (en de kenmerken die het minst sterk samenhangen met de kans op vsv staan onderaan). In de tabellen zijn de zogenaamde odds ratio’s weergeven. Een odds ratio die groter is dan 1 betekent een toename van het risico op vsv (ten opzichte van de referentiegroep waar de odds ratio 1 is). Een odds ratio tussen de 0 en de 1 betekent een verlaagd risico op vsv. In de tabellen is ook weergeven of de gevonden effecten statistisch significant zijn (en dus waarschijnlijk niet op toeval berusten). In bijlage 2 staat beschreven hoe de verklarende kenmerken gemeten zijn. 

2.2.1 Vergelijking uitkomsten (odds ratio’s) van het voorkeursmodel voor het vo tussen verschillende cohorten
Cohort 2016/'17Cohort 2017/'18Cohort 2018/'19Cohort 2021/'22
Intercept0,0002125***0,0002272***0,0002399***0,0004063***
Leeftijd
referentiecategorie: 11 t/m 14 jaar
15 jaar5,184***4,654***4,065***3,217***
16 jaar10,821***9,562***9,355***5,947***
17 jaar39,324***33,562***33,500***20,409***
18 jaar56,673***42,756***42,664***23,730***
19 t/m 26 jaar87,947***72,637***69,265***38,400***
Onderwijssoort
referentiecategorie: vwo leerjaren 3 t/m 6
leerjaren 1 en 25,364***5,300***4,302***2,838***
vmbo-basisberoeps: leerjaren 3 en 47,299***6,700***6,289***4,828***
vmbo-kaderberoeps: leerjaren 3 en 45,095***4,334***4,749***3,401***
vmbo-gemengd: leerjaren 3 en 44,969***4,561***3,932***2,834***
vmbo-theoretisch: leerjaren 3 en 46,706***5,366***5,656***3,832***
havo: leerjaren 3 t/m 5 en algemeen leerjaar 31,496***1,391***1,320***1,341***
vavo11,925***14,773***14,028***15,516***
Psychosociale problemen leerling
referentiecategorie: geen
wel1,867***1,970***2,025***2,051***
Vertraging
referentiecategorie: geen vertraging
1 jaar vertraging1,208***1,394***1,400***1,781***
tenminste 2 jaar vertraging2,346***3,151***3,306***4,774***
Welvaartspercentiel huishouden
referentiecategorie: 1 t/m 20
21 t/m 400,804***0,790***0,811***0,885**
41 t/m 600,706***0,679***0,689***0,788***
61 t/m 800,687***0,674***0,646***0,779***
81 t/m 1001,336***1,318***1,260***1,300***
onbekend1,491***1,224***1,208**1,269***
Ouderlijke structuur
referentiecategorie: woont bij beide juridische ouders
woont bij 1 van de ouders1,484***1,483***1,502***1,444***
woont zonder ouders1,825***1,715***1,738***1,619***
Verdachte van een misdrijf
referentiecategorie: geen
wel2,130***2,215***2,466***2,325***
Pseudo R2 (McKelvey Zavoina)0,3650,3630,3680,319
 *** p < 0,001; ** p < 0,01; * p < 0,05; + p <0,1

Voor het vo bleek vooral leeftijd relatief sterk samen te hangen met de kans op vsv: oudere leerlingen hebben een grotere kans op vsv dan jongere leerlingen.15) Het is belangrijk om te realiseren dat bovenstaande modellen zogenaamde meervoudige regressiemodellen zijn. Dit betekent dat in deze modellen het effect van een bepaald kenmerk (in dit geval leeftijd) op vsv wordt gegeven rekening houdend met de overige kenmerken in het model.16) Ook het soort onderwijs dat een leerling volgt, hangt relatief sterk samen met de kans op vsv. Zo is de kans op vsv het kleinst in de hoogste leerjaren van het vwo (leerjaar 3 tot en met 6). Ten opzichte van leerlingen in deze vwo-leerjaren is de kans op vsv vooral hoog bij vavo-leerlingen. Ook het hebben van psychosociale problemen vergroot de kans op vsv bij vo-leerlingen. Verder wordt de kans op vsv in het vo bepaald door studievertraging. Leerlingen die vertraging hebben opgelopen ten opzichte van hun jaargenoten, hebben een hogere kans op vsv dan leerlingen die geen vertraging hebben. Ook de ouderlijke structuur hangt samen met vsv in het vo. Leerlingen die met één juridische ouder samenwonen en leerlingen die zonder juridische ouders wonen, hebben een hogere kans op vsv dan leerlingen die met beide juridische ouders wonen. Wat betreft financiële welvaart is te zien dat leerlingen die in een huishouden wonen met een meer gunstige financiële situatie een lagere kans hebben op vsv. Uitzondering is het hoogste welvaartspercentiel: leerlingen met de meest gunstige financiële positie van het huishouden, hebben een hogere kans op vsv dan leerlingen met het laagste percentiel wat betreft financiële welvaart van het huishouden.17) Tot slot verhoogt verdachte zijn van een misdrijf de kans op vsv in het vo. Een vergelijking van de verschillende modellen (kolommen in Tabel 2.2.1) leert dat de inhoudelijke conclusies wat betreft de invloed van de kenmerken op vsv in het vo vergelijkbaar zijn voor de verschillende cohorten.18)

In de volgende tabel staat weergegeven hoe de kenmerken samenhangen met de kans op vsv op het mbo. 

2.2.2 Vergelijking uitkomsten (odds ratio’s) van het voorkeursmodel voor het mbo tussen verschillende cohorten
Cohort 2016/'17Cohort 2017/'18Cohort 2018/'19Cohort 2021/'22
Intercept0,0064179***0,0061098***0,0085954***0,0087365***
Niveau
referentiecategorie: niveau 4
entreeopleiding6,844***5,748***5,574***4,868***
niveau 21,856***1,810***1,897***1,683***
niveau 31,312***1,253***1,222***1,253***
Leeftijd
referentiecategorie: t/m 16 jaar
17 jaar6,273***7,013***5,657***6,912***
18 jaar5,973***6,999***5,551***6,135***
19 jaar6,448***7,539***6,108***6,413***
20 jaar7,938***8,901***7,109***7,728***
21 jaar8,723***10,343***8,569***8,266***
22 jaar9,356***10,796***8,566***8,939***
23 jaar9,270***11,490***8,528***8,742***
24 jaar9,355***10,644***8,082***8,492***
25 jaar8,124***10,319***7,671***7,851***
26 jaar7,823***9,868***7,515***7,863***
Psychosociale problemen
referentiecategorie: geen
wel2,109***2,093***2,064***1,939***
Verdachte van een misdrijf
referentiecategorie: niet
wel2,084***2,283***2,221***2,143***
Ouderlijke structuur
referentiecategorie: woont bij beide juridische ouders
woont bij 1 van de ouders1,369***1,453***1,407***1,418***
woont zonder ouders1,519***1,574***1,589***1,572***
Geslacht
referentiecategorie: man
vrouw0,619***0,597***0,576***0,639***
Schulden
referentiecategorie: student en huishouden zonder schulden
student met schulden2,364***1,859***1,913***2,002***
huishouden met schulden1,480***1,480***1,453***1,428***
Hoogst behaalde opleidingsniveau moeder
referentiecategorie: middelbaar
laag1,185***1,240***1,263***1,229***
hoog0,819***0,852***0,896***0,866***
onbekend0,757***0,740***0,807***0,877***
Leerweg
referentiecategorie: BOL
BBL1,598***1,597***1,838***1,542***
extranei1,695***1,704***1,546***1,163***
Studierichting
referentiecategorie: zorg en maatschappij
economisch en juridisch1,099***1,147***1,119***1,250***
technisch0,770***0,789***0,697***0,832***
landbouw, diergeneeskunde en -verzorging0,739***0,837***0,9711,046
overige richtingen1,0051,044+1,0281,068**
onbekend1,0680,829**0,808***0,768***
Welvaartspercentiel huishouden
referentiecategorie: 1 t/m 20
21 t/m 400,914***0,905***0,911***0,929***
41 t/m 600,791***0,831***0,801***0,853***
61 t/m 800,689***0,714***0,736***0,756***
81 t/m 1000,665***0,648***0,661***0,648***
onbekend1,093*1,0371,0201,119*
Stedelijkheid
referentiecategorie: niet stedelijk
zeer sterk stedelijk1,569***1,501***1,379***1,420***
sterk stedelijk1,432***1,374***1,305***1,349***
matig stedelijk1,317***1,256***1,195***1,291***
weinig stedelijk1,167***1,127***1,090**1,145***
Pseudo R2 (McKelvey Zavoina)0,2940,3030,2870,274
*** p < 0,001; ** p < 0,01; * p < 0,05; + p <0,1

Zoals te zien is in Tabel 2.2.2 hangt het onderwijsniveau het sterkst samen met vsv op het mbo (wederom: gecontroleerd voor de overige kenmerken in het model). Studenten die een mbo-entreeopleiding volgen of een mbo-opleiding op niveau 2 of 3 hebben een hogere kans op vsv dan mbo-studenten die een opleiding volgen op niveau 4. Verder is, net als bij het vo, leeftijd een belangrijke verklaring voor vsv. Ook hier geldt dat oudere studenten een grotere kans hebben op vsv. Daarnaast is, wederom net als bij het vo, het hebben van psychosociale problemen een belangrijke voorspeller van vsv. Mbo-studenten met psychosociale problemen hebben een grotere kans op vsv dan studenten die geen zorg ontvangen op dit gebied. Net als bij het vo zijn ouderlijke structuur, verdachte zijn van een misdrijf en financiële welvaart van het huishouden verklaringen voor vsv. Verder hebben vrouwelijke studenten in het mbo een lagere kans op vsv dan mannelijke studenten en geldt dat studenten met hoger opgeleide moeders een lagere kans hebben op vsv. De aanwezigheid van geregistreerde problematische schulden verhoogt de kans op vsv. Wat betreft leerweg is te zien in Tabel 2.2.2 dat studenten die een beroepsbegeleidende (BBL) leerweg volgen (en dus werken combineren met een paar dagen school) en extranei (studenten die geen onderwijs volgen, maar slechts ingeschreven staan voor het doen van een examen) een hogere kans hebben op vsv dan studenten die een beroepsopleidende (BOL) leerweg volgen (en dus een groot deel van de week op school zijn). Ook studierichting hangt samen met de kans op vsv. Zo is de kans op vsv hoger indien studenten een economische of juridische opleiding volgen dan bij studenten die een opleiding richting zorg en maatschappij volgen. Studenten die een technische opleiding volgen of een opleiding in de richting landbouw, diergeneeskunde en dierenverzorging hebben juist weer een lagere vsv-kans dan studenten die een opleiding richting zorg en maatschappij volgen. Tot slot geldt dat de kans op vsv groter is indien leerlingen in meer stedelijke gebieden wonen. Net als bij het vo geldt voor het mbo dat de richting van het effect (of een kenmerk positief of negatief samenhangt met de kans op vsv) vergelijkbaar is over de jaren heen/voor de verschillende cohorten. 

2.3 Voorbeeld berekenen van vsv-risicoscore voor leerlingen en studenten

In de vorige paragraaf staat beschreven hoe alle kenmerken uit de voorkeursmodellen samenhangen met de kans op vsv. Met behulp van deze gegevens kan vervolgens voor alle individuele vo-leerlingen en mbo-studenten op basis van hun kenmerken (bijvoorbeeld leeftijd) de kans op vsv berekend worden. Elke categorie waarin een jongere valt (bijvoorbeeld 15 jaar oud), heeft een odds ratio ten opzichte van de referentiecategorie. Indien alle odds ratio’s (van alle kenmerken) met elkaar vermenigvuldigd worden (inclusief het intercept) kan de totale odds van een jongere berekend worden en op basis daarvan ook de vsv-kans (vsv-kans = odds/(1+odds)). 

In Figuur 2.3.1 staat een voorbeeld voor een vo-leerling uitgewerkt dat toont hoe op basis van de odds ratio’s de kans op vsv berekend kan worden. Het betreft in dit voorbeeld een vo-leerling van 15 jaar oud die in de bovenbouw van een opleiding vmbo-theoretisch zit, hulp ontvangt voor psychosociale problemen, geen studievertraging heeft, in een huishouden woont met een relatief lage welvaart, met beide juridische ouders woont en die niet verdacht is van een delict. In Tabel 2.2.1 staat per kenmerk de odds ratio weergegeven (het betreft in dit voorbeeld een vo-leerling uit het 2018/’19-cohort). Indien alle odds ratio’s met elkaar vermenigvuldigd worden (inclusief het intercept) kan de odds en vervolgens ook de vsv-kans voor deze leerling berekend worden. Bij deze vo-leerling hoort een geschatte kans op vsv van 0,009. Met andere woorden, de kans dat een vo-leerling met deze combinatie van achtergrondkenmerken vsv’er wordt is 0,9 procent. De gemiddelde vsv-kans op het vo is 0,8 procent (zie het eerdere rapport).19) Dit betekent dat de vo-leerling in dit voorbeeld een iets hogere kans heeft op vsv dan gemiddeld. 

2.3.1 Voorbeeld kans op vsv berekenen voor een leerling op het vo Odds Kans (=odds/(1+odds)) Odds ratio’s Intercept Onderwijssoort Vmbo-theoretisch leerjaren 3 en 4 Leeftijd 15 jaar Psychosociale problemen Ja Verdachte van een misdrijf Nee Ouderlijke structuur Woont bij beide juridische ouders Vertraging Nee Welvaartspercentiel huishouden 21 t/m 40 0,0002399 4,065 5,656 2,025 1,000 0,811 1,000 1,000 0,009 0,009 2.3.1 Voorbeeld kans op vsv berekenen voor een leerling op het vo Odds Kans (=odds/(1+odds)) Odds ratio’s Intercept Onderwijssoort Vmbo-theoretisch leerjaren 3 en 4 Leeftijd 15 jaar Psychosociale problemen Ja Verdachte van een misdrijf Nee Ouderlijke structuur Woont bij beide juridische ouders Vertraging Nee Welvaartspercentiel huishouden 21 t/m 40 0,0002399 4,065 5,656 2,025 1,000 0,811 1,000 1,000 0,009 0,009

Hetzelfde kan gedaan worden voor mbo-studenten. In Tabel 2.2.2 is beschreven hoe alle kenmerken samenhangen met de kans op vsv op het mbo. Ook hier kan op basis van deze gegevens de kans op vsv voor alle individuele mbo-studenten berekend worden. Stel je hebt een mannelijke mbo-student van 19 jaar oud, die een BOL-opleiding volgt op niveau 3 in een economische en juridische richting, bij één van zijn ouders woont, geen problemen heeft op het gebied van criminaliteit, schulden of psychosociale problemen, een hoogopgeleide moeder en een redelijk hoge welvaart van het huishouden heeft en in een matig stedelijk gebied woont. Op basis van deze kenmerken kan vervolgens, met behulp van de odds ratio’s uit Tabel 2.2.2, zijn kans op vsv berekend worden. Dit door eerst de odds te berekenen door alle odds ratio’s met elkaar te vermenigvuldigen en dan de kans te berekenen. In Figuur 2.3.2 staat dit voorbeeld uitgewerkt (in dit voorbeeld is ervan uitgegaan dat de student onderwijs volgde in cohort 2018/’19). Zoals in onderstaand voorbeeld uitgewerkt is, heeft deze mbo-student een kans op vsv van 0,074. Met andere woorden de kans dat een mbo-student met deze kenmerken vsv’er wordt is 7,4 procent. De gemiddelde kans op vsv in het mbo is 7,9 procent (zie het eerdere rapport). De kans op vsv van de mbo-student uit het voorbeeld is dus iets lager dan het gemiddelde. 

2.3.2 Voorbeeld kans op vsv berekenen voor een student op het mbo Odds Kans (=odds/(1+odds)) Odds ratio’s Intercept Mbo-niveau Niveau 3 Leeftijd 19 jaar Psychosociale problemen Nee Verdachte van een misdrijf Nee Ouderlijke structuur Woont bij 1 van de juridische ouders Geslacht Man Geregistreerde problematische schulden Nee Opleidingsniveau moeder Hoog Leerweg BOL Studierichting Economisch en juridisch Welvaartspercentiel huishouden 61 t/m 80 Stedelijkheid woongemeente Matig 0,0085954 1,222 6,108 1,000 1,000 1,407 1,000 1,000 0,896 1,000 1,119 0,736 1,195 0,080 0,074 2.3.2 Voorbeeld kans op vsv berekenen voor een student op het mbo Odds Kans (=odds/(1+odds)) Odds ratio’s Intercept Mbo-niveau Niveau 3 Leeftijd 19 jaar Psychosociale problemen Nee Verdachte van een misdrijf Nee Ouderlijke structuur Woont bij 1 van de juridische ouders Geslacht Man Geregistreerde problematische schulden Nee Opleidingsniveau moeder Hoog Leerweg BOL Studierichting Economisch en juridisch Welvaartspercentiel huishouden 61 t/m 80 Stedelijkheid woongemeente Matig 0,0085954 1,222 6,108 1,000 1,000 1,407 1,000 1,000 0,896 1,000 1,119 0,736 1,195 0,080 0,074

Hierboven is de kans op vsv voor één vo-leerling (Figuur 2.3.1) en één mbo-student (Figuur 2.3.2) berekend. Op de manier zoals uitgewerkt in deze voorbeelden kan het CBS voor alle vo-leerlingen en voor alle mbo-studenten de vsv-kans berekenen. 

9) In het algemeen geldt dat hoe meer kenmerken opgenomen worden in een model hoe beter dit model een verklaring biedt voor de afhankelijke variabele (in dit geval de kans op vsv). Het is echter een methodologisch streven om bij het opbouwen van modellen deze niet onnodig complex te maken. Dit is ook in lijn met het streven van OCW om de (verdeel)modellen zo eenvoudig mogelijk te maken. Op basis van een balans van de kosten van het opnemen van extra verklaringen (complexere modellen) en de baten van het opnemen van extra kenmerken (een betere verklaring van vsv) zijn de voorkeursmodellen geselecteerd. Zie ook de eerdere publicatie
10) Voor meer informatie over logistische regressie, zie: Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression. John Wiley & Sons.
11) In de uiteindelijke implementatie van de regelgeving is dit tot 26 jaar op t0 (en dus tot 27 jaar op t1). Bij een eventuele toekomstige implementatie van een nieuwe vsv-indicator zal de leeftijdsafbakening hierop worden aangepast. Deze kleine afwijking in de afbakening zorgt niet voor een andere selectie van achtergrondkenmerken in de ontwikkelde modellen. 
12) Corona staat hier voor de ziekte Covid-19. Covid-19 is een besmettelijke luchtwegaandoening die wordt veroorzaakt door het SARS-CoV-2 virus. In dit rapport wordt de term corona gehanteerd omdat deze het meest wordt gebruikt in het algemeen taalgebruik. Deze term wordt niet enkel voor de ziekte, maar ook voor de maatschappelijke gevolgen gehanteerd. 
13) Zie voor meer informatie bijvoorbeeld deze Kamerbrief of cijfers van het CBS of van OCW
14) Voor meer informatie over de tijdlijn van de ontwikkeling en de aanpak van het coronavirus zie deze website. In december 2021 was er bijvoorbeeld sprake van een harde lockdown
15) In de tabel staan niet de kansen weergegeven, maar de kansverhoudingen (odds ratio’s). De correcte interpretatie van de odds ratio’s in de tabel is bijvoorbeeld dat voor een leerling van 15 jaar (uit het ‘2018/’19’-cohort) de kans om wel vsv’er te worden versus de kans om geen vsv’er te worden toeneemt met een factor 4,065 ten opzichte van een jongere leerling (de referentiecategorie). Op basis van de odds ratio’s kan de kans berekend worden (door eerst de odds te berekenen door het vermenigvuldigen van alle odds ratio’s, zie ook paragraaf 2.3). Ondanks dat de exacte formulering afhankelijk is van naar welke parameter gekeken wordt bij een logistische regressie (leeftijd hangt positief samen met vsv, de kans om wel vsv’er te worden versus de kans om geen vsv’er te worden neemt toe indien jongeren een hogere leeftijd hebben ten opzichte van de jongste leerlingen, de kans op vsv is groter voor oudere leerlingen) is de inhoudelijke conclusie vergelijkbaar. Kansen zijn voor een groter publiek begrijpelijker dan odds ratio’s. Daarom wordt in de tekst van kansen gesproken. 
16) Doordat meerdere kenmerken tegelijk opgenomen zijn in de modellen ontstaat het risico van multicollineariteit. Dit ontstaat wanneer kenmerken te sterk samenhangen. Hier zijn aanvullende analyses voor uitgevoerd. Deze tonen aan dat dit bij deze modellen niet problematisch is. 
17) Zoals beschreven in voetnoot vier wordt uitstroom naar niet-bekostigd onderwijs (onderwijsinstellingen die geen geld krijgen van de overheid om opleidingen/onderwijs aan te bieden) in de CBS-definitie van vsv niet meegenomen (het CBS beschikt niet over de data om deze mee te kunnen nemen). Dit betekent dat uitstroom naar particulier onderwijs niet meegenomen kan worden. Aanvullende analyses toonden dat de waargenomen vsv in deze specifiek groep waarschijnlijk voor een deel komt doordat leerlingen doorstromen van het bekostigd onderwijs naar het particulier onderwijs. 
18) Hoewel de richting van het effect van de kenmerken op vsv vergelijkbaar is voor de verschillende cohorten/schooljaren lijkt de verklarende kracht van het totale model iets af te nemen over de tijd heen. Het CBS zal bij implementatie de verklaarkracht van het model blijven monitoren. Indien de kwaliteit van het model onvoldoende wordt geacht zal een herijking voorgesteld worden. 
19) Van de vsv-doelpopulatie, volgens de CBS-definitie en in cohort 2018/'19.