Auteur: Astrid Pleijers, Francis van der Mooren
Pilot Monitor Laaggeletterdheid 2021

2. Methode

2.1 Uitgangspunten

Voor de pilot zijn de volgende uitgangspunten gehanteerd: 

  • Een landelijke monitor laaggeletterdheid moet aansluiten bij de uitvoeringspraktijk van gemeenten.
  • Er wordt gestart met een basisset van outputgegevens voor een landelijke monitor via CBS. Hierbij is aangesloten bij de gegevens waarover gemeenten/aanbieders in principe beschikken. Dit is gebaseerd op het onderzoek onder gegevensverzameling bij aanbieders van ICTU in 2020.
  • De basisset bestaat uit aantallen deelnemers per: 
  1. geslacht 
  2. leeftijd 
  3. NT1/NT2 
  4. type cursus 
  5. type aanbod 
  6. woongemeente/postcodegebied.
  • De outputgegevens worden zoveel mogelijk vanuit de bestaande systemen van aanbieders en gemeenten geëxporteerd naar het CBS. Het CBS biedt ook zelf een tool (momenteel een Excel sjabloon) aan voor aanbieders die hiervan gebruik willen maken. 
  • De gegevens die CBS ontvangt, zijn ontdaan van tot individuele personen herleidbare gegevens.
  • Er vindt geen levering plaats van outcome gegevens aan het CBS. Dit zijn gegevens die gemeenten en aanbieders zelf op lokaal/regionaal niveau verzamelen om de effectiviteit van een bepaald aspect van hun zorg- of dienstverlening zichtbaar te maken. Gemeenten hebben keuzevrijheid om lokaal/regionaal zelf aanvullende gegevens te (laten) verzamelen, passend binnen hun wettelijke opdracht. 

Gemeenten kiezen zelf welke gegevensstroom naar CBS zij hanteren: 

  1. De aanbieder levert rechtstreeks aan het CBS 
  2. De aanbieder levert de gegevens aan de (contact)gemeente en de (contact)gemeente levert de gegevens aan het CBS. 

Hiermee wordt zoveel mogelijk recht gedaan aan lokale en regionale verschillen. De gemeente blijft in beide opties verantwoordelijk voor de aanlevering van de gegevens en heeft de regie in de aanlevering. 

Aanlevering kan zowel op recordniveau als op geaggregeerd niveau. Bij record data is elk record gerelateerd aan één persoon. Wel kan het zijn dat personen meerdere cursussen hebben gevolgd. Geaggregeerde data zijn samengevoegde data door onderliggende gegevens op te tellen en totalen of subtotalen weer te geven. Ook hiervoor geldt dat gemeenten zelf een keuze maken op welk niveau ze de data leveren. 

Met de basisset heeft de landelijke monitor voorlopig een beperkte reikwijdte omdat door het ontbreken van persoonsgegevens dubbeltellingen niet kunnen worden uitgesloten (bijvoorbeeld gelijktijdig volgen van meerdere trajecten) en outputgegevens niet kunnen worden gecombineerd met andere databestanden van het CBS. Bovendien kunnen aanbieders niet worden verplicht aan te leveren aan het CBS.

De beperkte reikwijdte was ook het uitgangspunt bij de start van de pilot. Streven is dat gaandeweg wordt toegewerkt naar een landelijke monitor met meer mogelijkheden  (‘groeimodel’).

2.2 Deelnemers

Voor de pilot zijn verschillende contactgemeenten benaderd om deel te nemen. Daarbij is gelet op zowel deelname van gemeenten die zelf wilden aanleveren als gemeenten die de aanlevering laten doen door de aanbieders. Meerdere gemeenten werken samen of willen gaan samenwerken met Qwasp BV voor het monitoren van hun lokale situatie. In de pilot is daarom ook beoogd te kijken hoe de gegevenstransfer van Qwasp BV naar CBS kan plaatsvinden. 

Om de deelnemers tijdens de pilot goed te informeren is een bijdrage geleverd aan de volgende bijeenkomsten. 

  • Werkgroep Monitor Laaggeletterdheid
  • Landelijke bijeenkomst voor WEB contactgemeenten;
  • Twee online vragensessies voor pilot deelnemers gecoördineerd door CBS. 

De werkgroep Monitor Laaggeletterdheid is gestart in november 2020 om als een kleine actieve groep gemeenten samen met het Rijk de monitor verder te ontwikkelen. De volgende contactgemeenten zitten in de werkgroep: Amersfoort, Dordrecht, Den Haag, Haarlem, Heerlen, Rotterdam en Amsterdam (en Utrecht tot eind 2020). VNG/Divosa en de ministeries van BZK en OCW verzorgen de organisatie.

Het CBS heeft input bij deze werkgroep opgehaald voor de inrichting van de pilot en communicatie met deelnemers en de rest van de gemeenten. Tevens is in januari 2021 een speciale werkgroep georganiseerd over de gegevensdefinitie van de 6 indicatoren die het CBS in de pilot moet hanteren. Gedurende het verloop van de pilot heeft het CBS presentaties gegeven over de voortgang in de werkgroep.

In totaal namen 16 gemeenten deel aan de pilot deel. Hiervan hebben er uiteindelijk 13 ook gegevens aangeleverd. Voor 4 gemeenten geldt dat de aanlevering is gedaan door in totaal 9 aanbieders. 

2.2.1 Deelnemende gemeenten en cursusaanbieders
GemeenteGegevens aangeleverd door
1 AmersfoortGemeente zelf
2 AmsterdamGemeente zelf
3 Den HaagROC Mondriaan
4 DordrechtGemeente zelf
5 HaarlemGemeente zelf
6 HeerlenVista college
7 HilversumGemeente zelf
8 LeidenGemeente zelf
9 RoermondGemeente zelf
10 ‘s-HertogenboschGemeente zelf
11 TilburgGemeente zelf
12 VenloTaalhuis Venlo
ORGB
Stichting Groenlicht NML
Gilde Educatie
13 ZoetermeerROC Mondriaan
Fox Taal
Taalhuis Voorschoten/Wassenaar
Volksuniversiteit

2.3 Benaderstrategie

Voor de pilot is aangesloten bij de reguliere werkwijze van het CBS. Dit houdt in dat gebruik is gemaakt van de gebruikelijke benaderstappen en afspraken. 

Deelnemers aan de pilot hebben op 23 maart 2021 een brief en mail ontvangen met hun gebruikersnaam en wachtwoord. Met behulp van deze gegevens konden ze inloggen in de voor hen klaargezette vragenlijst. In de brief/e-mail was een retourdatum vermeld die 30 dagen na ontvangst van de uitzendbrief lag. Na het verstrijken van de retourdatum is een herinnering toegezonden in de vorm van een 1e rappelbrief en mail. Deze rappel is na afstemming met de opdrachtgevers en deelnemers later gepland. Op 21 mei 2021 is de rappelbrief verstuurd en op 25 mei 2021 de rappel e-mail. 

Voor de pilot is een webpagina gemaakt waarop meer informatie over het onderzoek te vinden is, zie Monitor Laaggeletterdheid (cbs.nl)

2.4 Datalevering en -verwerking

De deelnemers hebben de data aangeleverd in de periode 23 maart 2021 tot en met 30 juni 2021. In de meeste gevallen gebeurde dit via het daartoe ingerichte beveiligde uploadportaal van het CBS. Enkele deelnemers hebben hun data via email verstuurd. Binnen de pilot hebben 2 gemeenten kennisgemaakt met de aanlevering via een externe partij (Qwasp). In totaal zijn 22 databestanden aangeleverd. Voor 16 daarvan geldt dat de gegevens op recordniveau zijn aangeleverd en voor 6 dat de gegevens geaggregeerd zijn aangeleverd. Van de aangeleverde bestanden bleken er 18 bruikbaar voor de verdere verwerking: 8 zijn (grotendeels) volgens het sjabloon aangeleverd en 10 gedeeltelijk of niet volgens het sjabloon. 

Van de 18 verwerkte bestanden bevatten 5 bestanden geaggregeerde data en 13 bestanden data op recordniveau. Van deze 18 bestanden zijn 9 bestanden verwerkt (toegevoegd aan het recordbestand) zonder dat daarbij extra werk nodig was. Wil je het verwerken van de data kunnen automatiseren dan is het van groot belang dat de data exact volgens het afgesproken format wordt aangeleverd. In tabel 2.4.1 is opgenomen welke problemen in de dataverwerking aan de orde kwamen. 

2.4.1 Aandachtspunten aangeleverde bestanden
OmschrijvingAantal
1 Niet aangeleverd in het standaard sjabloon8
2 Naam bestand aangepast5
3 Kolomnamen aangepast3
4 Kolommen anders gerangschikt3
5 Kolom inhoud niet volgens standaard sjabloon7
6 Data niet in 1 Excelsheet maar in >= 2 sheets aangeleverd1
7 Witregels in data2
8 Kolom data niet ‘uitgevuld’1
9 Antwoordcategorie aangepast of uitgebreid5
10 Referentiejaar anders genoteerd3
11 Ontbrekende data5
12 Data niet aangeleverd via uploadportaal2
13 Extra kolommen toegevoegd met informatie6
14 Data niet aangeleverd via Excel (of oude versie)4
15 Inhoud data niet consequent en/of bevat fouten4

Streven was om één geüniformeerd analysebestand samen te stellen dat gebruikt zou kunnen worden voor analyse van de pilot resultaten, maar ook de basis zou vormen voor een eventuele reguliere dataverzameling in 2022 en verder. Dit bleek helaas niet te realiseren en vandaar dat twee analysebestanden zijn samengesteld: één bestand op basis van de gegevens die op recordniveau zijn aangeleverd en één bestand op basis van de geaggregeerde data.