Auteur: Chantal Melser, Sven Meijs, Anouk de Rijk en Mark van der Loo
Online vacatures als nieuwe informatiebron voor vacatures in de VVT

3. Vacatureteksten analyseren met behulp van textmining

3.1 Inleiding

In het vorige hoofdstuk is beschreven welke beleidsmatig relevante informatie uit de online vacature data kan worden afgeleid. Naast kenmerken over vacatures, bevat de online vacaturedata de volledige vacatureteksten. Deze teksten zijn ook een bron van data en bevatten veel informatie over gevraagde vaardigheden. Dit biedt mogelijkheden voor aanvullende, meer verdiepende analyses. Voor dit onderzoek hebben we gebruik gemaakt van textmining analyses. Textmining omvat het inzetten van ICT-technieken om grote hoeveelheden teksten te analyseren en hieruit waardevolle informatie te extraheren.

In dit hoofdstuk beschrijven we de methode die we hebben ontwikkeld om vaardigheden uit vacatureteksten te extraheren en welke informatie dit kan opleveren.

3.2 Databewerking en dataverkenning

Voor dit deel van het onderzoek is een bestand samengesteld bestaande uit de volledige teksten van de online vacatures (mits beschikbaar) voor de hoofdbranche “Verpleging, Verzorging en Thuiszorg”. Uit deze volledige vacatureteksten zijn alleen de gedeelten meegenomen die betrekking hebben op het profiel van de toekomstige kandidaat; informatie over de werkgever en sollicitatieprocedure is uitgesloten. De extractie van het kandidaatprofiel uit de volledig vacaturetekst is uitgevoerd door Textkernel en door het CBS overgenomen. Hierna kortweg benoemd als ‘de vacatureteksten’. Ook hier heeft de data betrekking op de periode vierde kwartaal 2017 tot en met vierde kwartaal 2018. Dat levert voor de analyse in totaal 39 734 vacatureteksten op bestaande uit 4 087 138 woorden.

De vacatureteksten zijn in deze vorm nog niet geschikt voor analysedoeleinden. Om analyses uit te kunnen voeren, moet de data eerst bewerkt worden en brengen we zo veel mogelijk structuur aan. De eerste stap is om de teksten zo basaal mogelijk neer te zetten zodat ze een ‘corpus’ vormen: een bibliotheek van teksten, inclusief de set aan variabelen (kenmerken) van de vacatures. Dit zijn de kenmerken die in het vorige hoofdstuk zijn besproken en die gebruikt kunnen worden voor nadere analyses. De volgende bewerking van de teksten bestaat uit het identificeren van afzonderlijke woorden (tokenization) en het verwijderen van standaard stopwoorden (waaronder bijvoorbeeld lidwoorden, persoonlijk voornaamwoorden). Zo valt de zin “dit is een vacaturetekst” uiteen in de woorden dit, is, een en vacaturetekst. De woorden dit en een worden vervolgens aangemerkt als stopwoorden en worden verwijderd voorafgaand aan het uitvoeren van verdere analyses. Het resulterende bestand vormt de basis voor de verdere dataverkenning en analyses.

Dataverkenning met behulp van wordclouds

Als eerste stap in de verkenning van de vacatureteksten hebben we een wordcloud gemaakt op basis van het ‘corpus’. De wordcloud geeft een visuele indruk van de meest voorkomende woorden in de vacatureteksten en geeft een goede eerste indruk van opvallende zaken. Hoe groter het woord, hoe vaker het in de teksten voorkomt.

 

In deze eerste analyse vallen woorden als bent, hebt en kunt op. Ook zijn deels al vaardigheden te onderscheiden (bv zelfstandig, flexibel). Veel woorden zijn echter nog minder relevant (bv zorg, staat, goede, wij).

Voor verdere analyse zijn specifieke stopwoorden en werkwoorden geïdentificeerd via een handmatige controle van de vijftienhonderd meest voorkomende woorden. Na identificatie van deze woorden kunnen zij naar wens uitgesloten worden bij verdere analyses. Er zijn 256 werkwoorden aangemerkt (handmatig), 534 stopwoorden (handmatig) en 101 stopwoorden (default). Voorbeelden hiervan zijn: resterende persoonlijke voornaamwoorden, beroep (arts is geen vaardigheid), branche (zorgtype of branche zijn overige kenmerken van de vacature), gevraagd diploma (diploma of registratie is geen vaardigheid), Engelse termen, verkleinwoorden of versterkende woorden (bv goede. Dit voegt inhoudelijk niks toe). Ook hele werkwoorden en directe vervoegingen daarvan (zoals ondernemen en onderneem) worden verwijderd, omdat deze niet verwijzen naar vaardigheden. De werkwoordsvorm ondernemend is in de teksten ongemoeid gelaten, dit verwijst immers wel naar een persoonlijke vaardigheid. De wordcloud na tekstbewerking geeft al wat meer inzicht in gevraagde vaardigheden.

Door deze bewerkingen zijn het meer de persoonlijke eigenschappen en vaardigheden die het meest voorkomen en opvallen.

Keywords in context

Een andere methode voor verkenning van de data is om te kijken naar “keywords-in-context” (KWIC). Daarvoor geef je een zogenaamd keyword op, bijvoorbeeld de meest voorkomende woorden in de eerste wordcloud als bent, hebt en kunt. Dan kijk je naar de twintig woorden die in de zin voorkomen ná dit woord1). De twintig woorden vóór deze keywords bleken minder relevant. De twintig woorden ná de werkwoorden bent, hebt en kunt in de teksten benaderden het best de vaardigheden in de vacatures. Dit is toegepast op de basistekst (het ‘corpus’), waarin de werkwoorden en de meest voorkomende woorden nog aanwezig waren. Van deze verzameling van twintig woorden ná bent, hebt en kunt is opnieuw een wordcloud gemaakt.

Woorden in deze wordcloud komen sterk overeen met de woorden in figuur 17 (wordcloud op de basisteksten zonder stopwoorden en werkwoorden) en geven daarmee wederom een eerst inzicht in gevraagde vaardigheden. We zien dat de analyse met KWIC kwalitatief de bevindingen uit de eerdere wordclouds bevestigt.

Frequentietellingen

Naast een visuele analyse en weergave van de teksten met behulp van wordclouds, kunnen ook frequentietellingen van vaardigheden in de teksten worden samengesteld.

Het woord flexibel bijvoorbeeld, komt voor in 34 procent van de vacatures voor. In de thuiszorgvacatures wordt bij bijna 20 procent werkervaring gevraagd, bij de subbranche verpleging en verzorging is dit ruim 15 procent2).

Gegroepeerde analyses

Een andere manier om meer inzicht te krijgen in gevraagde vaardigheden, is door de vacatureteksten in groepen in te delen en wordclouds of frequentietellingen voor specifieke groepen samen te stellen. De vacatureteksten kunnen bijvoorbeeld ingedeeld worden naar beroep of functie, gevraagd opleidingsniveau of branche. Onderstaande wordcloud laat het verschil3) zien tussen enerzijds vacatures voor de beroepen verzorgenden (groen) en anderzijds vacatures voor gespecialiseerd verpleegkundigen (blauw).

In vacatures voor verpleegkundigen wordt vaker gevraagd om een rijbewijs en (werk)ervaring. Ook woorden als complexe en specialist komen vaker terug in vacatures voor verpleegkundigen. In vacatures voor verzorgenden komen woorden als cliënt(en), flexibel(e), houding en collega’s vaker terug. Er is inhoudelijke kennis nodig van beide beroepsgroepen en werkzaamheden om hier nadere duiding aan te geven, maar de dominante woorden wijzen wel op duidelijke verschillen tussen beide beroepen/functies.

Zo is het mogelijk om de meest gevraagde vaardigheden te splitsen naar functie, maar ook naar opleidingsniveau. De vaardigheden in vacatures kunnen ook per functie (bijvoorbeeld verpleegkundigen) worden uitgesplitst naar mbo-niveau of hbo-niveau en zo met elkaar worden vergeleken.

3.3 Classificeren van vaardigheden

Er zijn diverse mogelijkheden om meer duiding aan de vaardigheden in vacatureteksten te kunnen geven. Met behulp van technieken van textmining kunnen vooral de woorden met hun inhoudelijke betekenis centraal worden gesteld. Via machine learning is het mogelijk om na te gaan of patronen in woordgebruiken automatisch herkend kunnen worden. We hebben ervoor gekozen om verder te gaan met textmining technieken, omdat daarmee naar verwachting de maximale informatie uit de dataset kan worden gehaald

Voor betere duiding en nadere analyses is gezocht naar een manier om vaardigheden te classificeren. Vaardigheden die op een andere manier worden omschreven, kunnen hetzelfde betekenen of anderszins vergelijkbaar zijn. Zij behoren, met andere woorden, tot hetzelfde domein. Een voorbeeld: ‘je bent empathisch’ en ‘je hebt een groot inlevingsvermogen’. Deze eigenschappen behoren tot hetzelfde domein. Om deze vaardigheden te kunnen groeperen is een classificatie nodig waarbij woorden met dezelfde betekenis bij elkaar worden gevoegd.

Voor dit onderzoek maken we gebruik van een bestaande classificatie, namelijk de European Skills, Competences, Qualifications and Occupations (ESCO) classificatie.

ESCO-classificatie

De ESCO is een meertalige Europese classificatie van vaardigheden, competenties, kwalificaties en beroepen. De ESCO is gericht op de Europese arbeidsmarkt en de onderwijs- en opleidingssector en geeft een systematisch overzicht van de relaties tussen de verschillende concepten. Bij deze analyse hebben wij gebruik gemaakt van de Nederlandse versie van de ESCO classificatie van vaardigheden (https://ec.europa.eu/esco/portal/skill). De ESCO omvat ruim dertienduizend vaardigheden verdeeld over de hoofdgroepen ‘attitudes en waarden’, ‘kennis’, ‘taalvaardigheden en taalkennis’ en ‘vaardigheden’. Hierbinnen zijn weer verschillende onderwerpen te onderscheiden zoals ‘ICT vaardigheden’ en ‘transversale vaardigheden4)’. Tenslotte kan iedere vaardigheid meerdere omschrijvingen of labels kennen. Zo heeft de vaardigheid moeite doen een alternatief label in de vorm van inspanningen leveren; beide labels komen uit bij dezelfde skills.

Omdat we voor de analysedoeleinden om praktische en inhoudelijke redenen voor dit onderzoek slechts gebruik maken van een selectie van vaardigheden uit de ESCO-classificatie, gebruiken we op dit moment minder dan duizend vaardigheden, uit de meer dan dertien duizend gelabelde vaardigheden uit de ESCO-classificatie.

Koppelen van de vacatureteksten aan de classificatie

Om gebruik te kunnen maken van de ESCO-classificatie, moeten de vaardigheden in de vacatureteksten gematched worden aan de termen uit de classificatie. Hiervoor is gebruik gemaakt van de methode moving window en een cosine distance: de ESCO-vaardigheid wordt positie voor positie vergeleken met de vacaturetekst en berekent iedere keer de gelijkenis5). Op deze manier wordt in elke vacaturetekst het deel gevonden dat het meest lijkt op een gekozen ESCO-vaardigheid. Bovendien is er een maat, tussen nul en één, die zegt hoeveel het gevonden deel afwijkt van de ESCO-vaardigheid. Om te bepalen of er een voldoende match is met een ESCO-vaardigheid, worden er grenswaardes bepaald. Deze kunnen per domein verschillen.

Een andere methode om vaardigheden uit de ESCO-classificatie te koppelen aan de vacatureteksten, is een zoekfunctie met inachtneming van de Levenshteindistance. Met deze methode wordt gekeken hoeveel letters/karakters minimaal gewijzigd moeten worden (ingevoegd, verwijderd, vervangen) om woorden gelijk te maken aan elkaar. Woorden hoeven niet exact overeen te komen, maar moeten ook niet té verschillend van elkaar zijn (fuzzy matching). Bij te weinig flexibiliteit van de koppeling zijn er te weinig overeenkomsten te vinden. Als er te veel wijzigingen worden toegestaan, worden ook koppelingen gelegd tussen woorden die niet dezelfde betekenis hebben. Er wordt dan vaker niet correct gekoppeld dan wel. Deze methode bleek echter niet goed bruikbaar voor dit onderzoek. Er waren óf onvoldoende koppelingen in de gehele dataset, óf te veel koppelingen die niet correct bleken. Daarom is gekozen voor de moving window.

3.4 Belangrijkste resultaten gekoppelde vaardigheden

In totaal konden 36 procent van de vacatureteksten gematched worden aan minimaal één transversale of ICT-vaardigheid uit de ESCO-classificatie indeling.

Zelfstandig werken is veruit de meest gevonden vaardigheid in de vacatureteksten. Deze vaardigheid kwam al duidelijk naar voren in de dataverkenning (figuur 17 en 18). Enthousiasme tonen was eerder ook al terug te vinden in deze wordcloud. Na koppeling met de ESCO-classificatie behoren ook doorzetten en anderen motiveren tot de meest gekoppelde vaardigheden. Anderzijds hebben een aantal prominente woorden uit de wordclouds, zoals communicatief en stressbestendig, niet geleid tot een koppeling met een ESCO-vaardigheid. Dit kan het gevolg zijn van een te strenge grenswaarde voor deze begrippen. In eventueel vervolgonderzoek kunnen de grenswaarde en de (woorden in de) vaardigheid beter op elkaar afgestemd worden.

De ESCO-classificatie bestaat uit verschillende domeinen. Voor dit onderzoek gaan we hierna dieper in op zogenaamde transversale vaardigheden en ICT-vaardigheden.

Transversale vaardigheden

Transversale vaardigheden zijn vaardigheden die voor vrijwel ieder beroep relevant zijn. De vaardigheden zijn vrijwel nooit aan een opleiding gebonden en gaan in op persoonlijke eigenschappen. Voorbeelden van transversale vaardigheden zijn: enthousiasme tonen, werken in teams, informatie opzoeken, nieuwsgierigheid tonen en feedback accepteren.

Transversale vaardigheden worden vaak aan de hand van algemene begrippen omschreven. De vaardigheden vindt men eerder terug in tekstgedeeltes dan in specifieke woorden. Daarom is op basis van een steekproef van aselecte getrokken teksten en vaardigheden besloten de grenswaarde voor een match met transversale vaardigheden op 0.35 te zetten6). Via deze methode is in 34 procent van de vacatureteksten minimaal één transversale vaardigheid gevonden.

De geclassificeerde vaardigheden zijn afzonderlijk te analyseren, maar kunnen ook groepsgewijs bekeken worden. Eveneens is het mogelijk een vergelijking te maken met overige kenmerken van vacatures. Zo is het bijvoorbeeld mogelijk in beeld te brengen welke transversale vaardigheden het meeste voorkomen in de vacatureteksten voor verpleegkundigen en verzorgden of in de VVT in vergelijking met de overige zorg en welzijn.

20. Meest gevraagde ESCO vaardigheden vacatures VVT, 2018
Vaardigheidaandeel in VVT-vacatures (%)
zelfstandig werken15,3
enthousiast zijn6
doorzetten3,9
anderen motiveren2,8
beslissingen nemen2,3
Bron: CBS, Textkernel

ICT-vaardigheden

Er is binnen de zorg steeds meer aandacht voor ICT-oplossingen en E-health toepassingen. Het gebruik daarvan vereist wellicht meer ICT-vaardigheden in de zorg dan in het verleden. Het ligt daarom voor de hand dat ICT-vaardigheden ook steeds meer gevraagd worden in vacatures, ook in de VVT-sector.

Uit de analyse van de gevraagde vaardigheden komt naar voren dat ICT-vaardigheden nog niet dominant voorkomen in de VVT. Maar zij worden - net zoals in alle andere sectoren - wel steeds belangrijker.

Op basis van een steekproef van aselecte getrokken teksten en vaardigheden is besloten de grenswaarde voor ICT-vaardigheden op 0.4 te zetten. Dit omdat naar verwachting niet heel specifieke ICT-kennis en kunde zal worden gevraagd. Deze grenswaarde geeft een goede indicatie of sprake is van een ICT-vaardigheid uit het ESCO-domein.

De ESCO-vaardigheid computers programmeren koppelde het vaakst met zinsdelen als ‘om kunnen gaan met computerprogramma’s’. Om deze reden is besloten de ICT-vaardigheden uit de ESCO niet afzonderlijk, maar gegroepeerd te behandelen. Indien er een match is met één van de ICT-vaardigheden wordt het domein ICT-vaardigheden toegewezen aan de vacature.

In bijna 2 procent van de vacatures in de VVT wordt om enige ICT-vaardigheid gevraagd.

21. Beroepen met hoogste aandeel ICT-vaardigheden (VVT), 2018
BRCaandeel ICT-vaardigheden in beroep (%)
Software- en applicatieontwikkelaars18,4
Technici bouwkunde en natuur18,2
Meubelmakers, kleermakers en stoffeerders16,7
Verkoopmedewerkers detailhandel14,1
Elektriciens en elektronicamonteurs12,5
Laboranten12,5
Bron: CBS, Textkernel

Binnen de vacatures in de VVT waarin het vaakst wordt gevraagd naar ICT-vaardigheden, gaat het uitsluitend om vacatures voor niet-cliëntgebonden beroepen. Dit geldt vooral voor vacatures voor ‘Software- en applicatieontwikkelaars’. Het aandeel vacatures voor Software- en applicatieontwikkelaars’ waarin gevraagd wordt naar ICT-vaardigheden is met nog geen 20 procent wel lager dan je zou verwachten. Mogelijk bevat deze groep enkele classificatiefouten of worden voor deze beroepen dusdanig specifieke ICT-vaardigheden gevraagd dat deze nog niet in de ESCO-classificatie voorkomen.

Cliëntgebonden beroepen in de VVT komen niet terug in de bovenstaande figuur met vraag naar ICT-vaardigheden. Op basis van de data kunnen we wel bekijken of de vraag naar ICT-vaardigheden toeneemt in de VVT in de periode eerste kwartaal 2017 tot en met eerste kwartaal 2018.

22. Ontwikkeling gevraagde ICT-vaardigheden VVT vacatures
jaarkwartaalaandeel in VVT-vacatures (%)
20174e kwartaal1,56
20181e kwartaal1,68
20182e kwartaal1,56
20183e kwartaal1,98
20184e kwartaal2,53
Bron: CBS, Textkernel

Alhoewel het aandeel vacatures met een vraag naar ICT-vaardigheden laag blijft, is er wel een duidelijke stijging zichtbaar in vraag naar ICT-vaardigheden. Op termijn kan bezien worden of deze trend zich doorzet.

3.5 Vacatureteksten zonder match met ESCO-classificatie

Op basis van de beschreven methode kon aan 64 procent van de vacatureteksten geen ESCO-vaardigheid gekoppeld worden. Ook in vacatureteksten waar wel één of meerdere vaardigheden aan toegewezen worden, blijven er gedeeltes van de tekst over die niet koppelden met een vaardigheid uit de ESCO7).

Bij het gebruik van een bestaande classificatie is het belangrijk om de vacatureteksten die niet gekoppeld worden aan de classificatie in detail te bekijken. Het is – op enkele uitzonderingen na – onwaarschijnlijk dat er geen vaardigheid voorkomt in een vacaturetekst. Het analyseren van deze teksten helpt dan bij het verbeteren van de gehanteerde methodes voor textmining. Ten tweede kunnen er vaardigheden in vacatureteksten staan die nog niet zijn opgenomen in een classificatie. Juist deze vaardigheden zijn interessant, omdat ze kunnen wijzen op nieuwe ontwikkelingen over de arbeidsmarkt.

Een globale analyse van de vacatureteksten zonder koppeling met een ESCO-vaardigheid levert de volgende wordcloud op. Stop- en werkwoorden zijn conform eerdere figuren verwijderd.

Deze wordcloud laat een patroon zien dat sterk lijkt op de wordclouds uit de verkennende analyse van alle VVT-vacatureteksten. De wordcloud toont ook een aantal nieuwe woorden, zoals initiatiefrijk, taal en talen. Dit kan duiden op nieuwe domeinen uit de ESCO-classificatie die extra aandacht behoeven, zoals het domein Taal.

Als gevolg van de methode moving window worden delen van de vacatureteksten niet gebruikt. Deze segmenten kunnen nader geanalyseerd worden. In deze wordcloud (figuur 24) zijn het dezelfde woorden die prominent naar voren komen. Nieuwe woorden in de wordcloud zijn geduldig, tact en passie.

Met de huidige gehanteerde grenswaarden lijken er begrippen onterecht niet aan een ESCO-vaardigheid toegeschreven te worden. Het patroon wijst er verder op dat de niet-gekoppelde vacatures door de dataset verspreid zitten. Dit zou dus niet moeten leiden tot een over- of ondervertegenwoordiging van specifieke groepen. Het is aan te raden om bij vervolgonderzoek de grenswaarden aan te scherpen en te laten verschillen voor de verschillende vaardigheden. Eveneens is het aan te raden meer ESCO-domeinen te betrekken.

3.6 Meerwaarde en toekomstmogelijkheden

Vacatureteksten bevatten veel informatie over gevraagde vaardigheden in de Verpleging, Verzorging en Thuiszorg. Textmining biedt mogelijkheden om die informatie uit de data te halen. De in dit onderzoek gehanteerde methode geeft inzicht in de mogelijkheden, maar is slechts een van vele wegen die bewandeld kunnen worden en biedt ruimte voor verbetering.

Voor dit rapport is een methode ontwikkeld om vaardigheden uit teksten te extraheren, met als referentiekader de ESCO-classificatie. In de methode is tevens ruimte voor het analyseren van teksten en tekstsegmenten waarbij geen directe koppeling met een bestaande classificatie gemaakt kan worden.

De beschreven methode kent een aantal aandachtspunten. Aan een groot deel van de vacatureteksten kon op dit moment geen vaardigheid uit de ESCO-classificatie worden gekoppeld. Uit de analyse van de niet-gekoppelde teksten en tekstsegmenten kwam naar voren dat het patroon met dominante woorden nauwelijks verandert ten opzichte van de gekoppelde teksten. Het koppelen van alle domeinen uit de ESCO-classificatie zou tot een verbetering moeten leiden. Ook het aanscherpen van de gehanteerde drempelwaardes voor iedere individuele vaardigheid of een klein cluster van vaardigheden zal tot verbeteringen leiden.

Voordeel van de methode is dat het laagdrempelig in gebruik is en eenvoudig kan worden toegepast op meer recente vacatureteksten voor de VVT, vacatureteksten uit andere sectoren, op andere databronnen en met andere classificaties. Voldoende rekenkracht en opslagruimte is hierbij wel steeds een randvoorwaarde.

1) Het is mogelijk dat één of meerdere keywords volgen binnen 20 woorden van een ander keyword; bijvoorbeeld “je hebt een goede werkhouding en bent flexibel inzetbaar”. In dit geval worden beide woorden en intervallen meegenomen en kan er overlap ontstaan met dubbeltellingen (in dit voorbeeld: flexibele en inzetbaar) van woorden tot gevolg.
2) Deze percentages zijn gebaseerd op de ongewogen aantallen. Voor een juiste representatie en aansluiting bij de overige cijfers en figuren uit dit rapport zou dit nog moeten worden bijgewerkt naar de gewogen aantallen.
3) Voor dit type wordcloud wordt een frequentietelling van de woorden gemaakt van een aantal teksten in groep ‘A’ en van hetzelfde aantal teksten in groep ‘B’. Deze tellingen worden vervolgens van elkaar afgetrokken. Het resultaat van deze berekening bepaalt in welke groep het woord thuishoort en hoe groot het woord getoond wordt in de wordcloud. Het gaat hierbij dus niet om de frequenties binnen de afzonderlijke groepen, maar om de grootste verschillen.
4) Vaardigheden die niet aan een beroep gebonden zijn maar van toepassing zijn op het individu en in alle beroepen van pas komen. Een voorbeeld hiervan is ‘nieuwsgierig zijn’.
5) Dit gebeurt aan de hand van de cosinus waarde van de numerieke representatie van de teksten (maat voor gelijkenis). Hoe lager deze cosinus waarde, hoe groter de gelijkenis tussen de beide tekstgedeeltes.
6) Deze grenswaarde levert een selecte groep vaardigheden op die onterecht koppelen als gevolg van de lengte van de tekst en de gebruikte woorden. Deze vaardigheden zijn niet van groot belang bij de identificatie van vaardigheden en zijn handmatig uitgesloten. Voorbeelden van dergelijke vaardigheden zijn: gendergelijkheid ondersteunenonline op zoek gaan naar informatie en ecologisch duurzame werkpraktijken toepassen.
7) Een specifieke vaardigheid wordt maar aan één deel van de tekst toegewezen (beste match) en alleen dat deel van de tekst wordt opgeslagen. Het kan voorkomen dat een vaardigheid meerdere keren voorkomt in een tekst. Een tekst kan dus nog steeds een match op zelfstandig werken generen, omdat alleen de beste match voor zelfstandig werken uit de tekst verwijderd is.