Monitor online platformen 2023

8. Samenstelling onderzoekspopulatie

Een groot deel van de gegevens in deze rapportage komen uit de enquête ‘Platformsamenleving’. Deze enquête wordt door het CBS jaarlijks gehouden onder online platformen. Dit hoofdstuk beschrijft de samenstelling van de onderzoekspopulatie.

Er bestaat geen compleet register van alle online platformen in Nederland; iedereen kan een website starten, zonder zich ergens officieel te registreren als platform. Om te bepalen welke online platformen er zijn in Nederland, heeft het CBS daarom gebruikgemaakt van webscraping en machine learning. Hierbij is gestart met een lijst van reeds bij het CBS bekende online platformen. Deze platformen waren bijvoorbeeld bekend uit vorige edities van de enquête ‘Platformsamenleving’. De lijst met online platformen is gebruikt als ‘training set’ voor een model. Met behulp van machine learning leerde dit model onderscheid te maken tussen websites die een online platform zijn en websites die dat niet zijn, voornamelijk door te kijken naar woorden en tekstgedeeltes op de website.
Vervolgens zijn de websites op een zeer omvangrijke lijst met websites in Nederland, samengesteld door het bedrijf Dataprovider, door een webscraper bezocht. Webscraping is het automatisch door een computerscript laten bekijken van grote hoeveelheden publiek toegankelijke websites, en het registreren van enkele kenmerken van deze websites. De teksten op de website zijn vervolgens in het model ingevoerd. De output van het model was een score die de kans weergeeft dat een bepaalde website een online platform is.

De websites die, volgens het model, een kans van minstens 80 procent hadden om een online platform te zijn, zijn geselecteerd als ‘potentieel platform’. Hieraan zijn nog een aantal websites toegevoegd die bekend waren als online platform uit vorige edities van de enquête ‘Platformsamenleving’. Ook zijn websites waarvan bekend was dat het geen online platformen waren, bijvoorbeeld uit eerdere enquêtes, uit de lijst verwijderd.

Deze lijst is vervolgens gekoppeld aan het bedrijvenregister van het CBS op basis van adresinformatie en informatie over Kamer van Koophandel-inschrijving uit de dataset van Dataprovider. Een deel van de websites kon niet eenduidig aan een bedrijf gekoppeld worden. Naar de wel gekoppelde bedrijven heeft het CBS de enquête ‘Platformsamenleving’ uitgestuurd. Om de lastendruk voor bedrijven laag te houden, hebben bedrijven die meerdere platformen bezitten maar voor één van hun platformen een enquête gekregen. Voor meer informatie over de methodologische effecten hiervan, zie hoofdstuk 9.1 in de Monitor online platformen 2020. Bedrijven die een ‘adult website’ runnen zijn buiten de populatie gehouden; aan hen is geen enquête gestuurd. Uiteindelijk zijn er ongeveer 4 857 bedrijven benaderd om de enquête in te vullen. Zo’n 2 900 bedrijven vulden de enquête in.

In de enquête wordt in eerste instantie geverifieerd of het bedrijf daadwerkelijk de eigenaar van de website is. Vervolgens wordt de vraag gesteld: ‘Bemiddelt of ondersteunt uw website of app de uitwisseling van goederen, diensten of informatie tussen personen, bedrijven of organisaties? (Het kan hier gaan om bemiddeling of ondersteuning bij verkoop van goederen, het bij elkaar brengen van bewoners, patiënten en familie, crowdfunding, dating, nieuwe vriendschappen, het verhuren van accommodaties, het lenen van spullen etc.)’. Als deze vraag met ‘Ja’ wordt beantwoord, wordt gevraagd of het bedrijf de enige aanbieder van goederen, diensten of informatie op de website of app is. Als het antwoord op deze tweede vraag ‘Nee’ is, en er dus meerdere aanbieders op de website zijn, beschouwt het CBS het als online platform in het kader van dit onderzoek. Op deze wijze konden via deze enquête 1 057 websites daadwerkelijk geclassificeerd worden als online platform.

De resultaten in hoofdstuk 5 zijn gebaseerd op de online platformen die de enquête in 2023 invulden. In de hoofdstukken 2, 3, 4, 7 over demografie, de ontwikkeling van omzet en werkzame personen, veiligheid van websites worden ook resultaten gepresenteerd over de volledige groep van alle bij het CBS bekende online platformen (een kleine 1 600).

Trends op basis van enquêtedata

De CBS-enquête onder online platformen is een aantal opeenvolgende jaren uitgevoerd. Een directe vergelijking van cijfers in de uitkomsten van de verschillende verslagjaren is echter niet altijd mogelijk. Bij het samenstellen van de groep platformen die een enquête ontvangen, is namelijk gekozen voor een hybride vorm, waarbij deels nieuwe platformen en deels reeds bekende platformen zijn geselecteerd. Het includeren van nieuwe platformen is van belang om zicht te houden op ontwikkelingen in de populatie platformen; ieder jaar worden nieuwe platformen opgericht en verdwijnen andere. Het includeren van reeds bekende platformen werd van belang geacht voor het in kaart brengen van jaar-op-jaar ontwikkelingen. Het is echter gebleken dat van de reeds bekende platformen een deel niet respondeerde, waardoor het deel platformen dat zowel dit jaar als vorig jaar respondeerde te klein was om een valide vergelijking met vorig jaar te maken.