Interneteconomie Zuid-Korea in kaart met CBS-expertise
Big data-technologie
De samenwerking met het Zuid-Koreaanse KOSTAT op het gebied van big data dateert van september 2016. ‘Toen ondertekende Directeur-Generaal Tjark Tjin-A-Tsoi van het CBS een overeenkomst met KOSTAT voor samenwerking in het Center for Big Data Statistics (CBDS) van het CBS. Het CBDS ziet in big data-technologie kansen om - samen met gerenommeerde nationale en internationale partijen - de statistiek te vernieuwen. Een van de afspraken die uit de overeenkomst voortvloeiden was dat er een medewerker van KOSTAT, Hae-Ryun Kim, voor langere tijd bij het CBDS gestationeerd zou worden’, aldus CBS-innovatiemanager Barteld Braaksma. ‘Mijn voorstel was toen om de interneteconomie als één van de onderzoeksthema’s op te pakken. Het CBS deed in 2016 - in samenwerking met Google en Dataprovider - innovatief big data onderzoek naar de omvang en aard van de Nederlandse interneteconomie. We hebben in kaart gebracht welke Nederlandse bedrijven via internet actief zijn en welk deel van hun omzet ze daar bijvoorbeeld mee behalen.’ Een uitdagende opdracht, omdat zowel de methode van data combineren als een deel van de gebruikte databronnen nieuw was.
Nieuwe databronnen
Onderzoeker Hyun-Joon Jung en directeur Data Science Yong-Chan Jung zijn beiden werkzaam bij het KISDI. Dit aan de overheid gelieerde instituut levert een belangrijke bijdrage aan de totstandkoming van het IT-beleid en de ontwikkeling van de nationale economie in Zuid-Korea. Het voert ook onderzoek uit in opdracht van KOSTAT. Hyun-Joon Jung en zijn collega tonen grote interesse in het meten van de interneteconomie. ‘In onze tijd is internet cruciaal en het wordt ook steeds belangrijker voor de Zuid-Koreaanse economie. Er zijn internationaal enkele onderzoeken gedaan naar het meten van de interneteconomie, maar het bijzondere van het CBS-onderzoek is het benutten van de sterke kanten van een breed scala aan bronnen. Daarbij wordt gebruik gemaakt van web scraping (computertechniek waarbij software wordt gebruikt om informatie van webpagina’s te halen en analyseren, red.), administratieve data en data uit bedrijfsenquêtes. Met slimme matchingstechnieken worden die bronnen gecombineerd opdat een samenhangend beeld ontstaat. Omdat de veranderingen op het gebied van de interneteconomie zich met een enorme snelheid voltrekken, is het belangrijk zowel big data als administratieve data te gebruiken. Juist de combinatie van nieuwe en traditionele databronnen zorgt voor meerwaarde.’ Binnen het CBS wordt expertise ontplooid om bijvoorbeeld web scraping en andere big data-technologieën verder te ontwikkelen. Dit gebeurt voor een belangrijk deel in het CBDS.
Niet alleen KOSTAT is geïnteresseerd in het onderzoek naar de interneteconomie, maar bijvoorbeeld ook het Duitse, Ierse en Mexicaanse statistiekbureau en internationale organisaties zoals Eurostat, OESO en IMF.
Koppelen van websites aan bedrijven
Hyun-Joon Jung en zijn collega volgden een intensief 3-daags programma, waarbij CBS-collega’s allerlei facetten van het interneteconomie onderzoek lieten zien. Tijdens dat programma lichtte Magda Slootbeek, statistisch onderzoeker, de betekenis van het Algemeen Bedrijven Register (ABR) toe. ‘In het onderzoek naar de interneteconomie hebben we de websites van de bedrijven die actief zijn op internet gekoppeld aan het ABR. Op basis van de inhoud van die websites hebben we bepaald hoe bedrijven gebruik maken van internet. Dat leverde interessante informatie op. In totaal vormen zo’n 50.000 bedrijven de kern van de interneteconomie in ons land. Dat zijn bijvoorbeeld webshops, online diensten en internet gerelateerde ICT-bedrijven. Verrassend was dat tweederde van de bedrijven geen website bleek te hebben.’
Internationale interesse
Volgens Braaksma is niet alleen KOSTAT erg geïnteresseerd in het onderzoek naar de interneteconomie, maar bijvoorbeeld ook het Duitse, Ierse en Mexicaanse statistiekbureau en internationale organisaties zoals Eurostat, OESO en IMF. ‘Het zou heel interessant zijn als het CBS regulier gegevens over de interneteconomie zou kunnen publiceren in plaats van eenmalig, maar dat is wel afhankelijk van beschikbaarheid van middelen. Er zijn ook diverse mogelijkheden om het onderzoek verder uit te breiden, bijvoorbeeld met kenmerken die iets zeggen over beveiliging van websites tegen cyberaanvallen.’ Volgens Braaksma heeft KISDI inmiddels met Dataprovider (een Nederlands bedrijf dat via internet diverse attributen van bedrijven in tientallen landen verzamelt en structureert, red.) een contract afgesloten en gaat het aan de slag met de door Dataprovider geleverde datasets om de interneteconomie van Zuid-Korea in kaart te brengen. ‘Het CBS-onderzoek vormt hiervoor de basis.’