Internationaal naslagwerk bundelt kennis over bedrijfsstatistieken
Veel nieuwe bronnen
Bedrijfsstatistieken, in brede zin, zijn statistieken over bedrijven, inclusief de agrarische sector en instellingen. CBS-onderzoeker en projectleider Ger Snijkers: ‘Zes jaar geleden vroeg de American Statistical Association mij om naar aanleiding van het zesde internationale ICES-congres over bedrijfsstatistieken (International Conference on Establishment Statistics) een boek samen te stellen.’ Het congres was gepland in 2020 en werd door de pandemie uitgesteld naar 2021. Dit boek moest de opvolger worden van het boek dat bijna dertig jaar geleden na het eerste ICES-congres verscheen. Ook CBS-onderzoeker Arnout van Delden zat in het redactieteam: ‘Er is sindsdien veel veranderd. Dertig jaar geleden baseerden we onze statistieken grotendeels op enquêtes. Nu zijn daar veel nieuwe bronnen bijgekomen. Dat brengt nieuwe technieken en nieuwe methodologie met zich mee.’Cijfers over klimaatverandering en globalisering
Het boek bestaat uit zeven secties en beslaat het hele productieproces. Snijkers: ‘We beginnen bij het eindproduct: aan welke statistieken is behoefte? Ook daar zijn veel ontwikkelingen gaande. Nieuw is de behoefte aan cijfers die bijvoorbeeld samenhangen met klimaatverandering en globalisering.’ Vervolgens worden de volgende onderwerpen behandeld: het productieproces van statistieken, secundaire bronnen als overheidsregisters, enquêtes, en het gebruik van nieuwe bronnen als webscraping en big data. Verder komt de statistiek zelf aan bod: het schatten van statistische uitkomsten op basis van de verschillende databronnen én de integratie van die bronnen.Wereldwijd relevant
Het boek is samengesteld door een internationaal team van acht editors met Snijkers als hoofdeditor en van Delden als één van de sectie-editors. Meer dan 100 onderzoekers van over de hele wereld schreven eraan mee, bijvoorbeeld uit de Verenigde Staten, Canada, Nepal en Indonesië. Snijkers: ‘Om het boek echt wereldwijd relevant te maken, hebben we ook wetenschappers uit niet-westerse landen uitgenodigd om mee te schrijven. Zij zijn doorgaans minder vaak vertegenwoordigd. In die landen spelen soms heel andere zaken op statistisch gebied.’ Van Delden: ‘Al voor het congres hebben we een vliegende start gemaakt door onderwerpen te selecteren en schrijvers te benaderen. Zo is het gelukt om een paar maanden na het congres een eerste concept van de hoofdstukken gereed te hebben.’
Steekproeven, ontbrekende data en administraties
Naast alle nieuwe ontwikkelingen komen in het boek ook meer conventionele onderwerpen aan bod, zoals vragenlijstontwerp, kanssteekproeven, steekproefcoördinatie, en hoe je omgaat met ontbrekende data. Van Delden schreef mee aan een hoofdstuk over administratieve data en was editor van die sectie. Elk statistisch bureau gebruikt die data, want de meeste statistiekbureaus hebben als beleid om eerst administratieve bronnen te gebruiken. Eén probleem met administratieve data is dat je afhankelijk bent van externe organisaties. Van Delden: ‘In de statistiek hebben we afspraken gemaakt over wat we onder een bedrijf verstaan. Maar de definities van wat een bedrijf is kunnen in deze externe bronnen anders zijn. Het is dus van belang te onderzoeken hoe je de data uit verschillende bronnen, bijvoorbeeld van de Belastingdienst en uit een bedrijvenregister, op elkaar laat aansluiten.’ Snijkers: ‘Bij een enquête bepaal je zelf wie je bevraagt en wat je precies vraagt. Dat geldt uiteraard niet als je administratieve data gebruikt. De vraag is dus altijd: hoe maak ik deze bron bruikbaar?’Realtime statistieken
Of het gloednieuwe boek weer dertig jaar mee kan, is de vraag. De ontwikkelingen gaan immers razendsnel. Van Delden: ‘De data-revolutie is pas net gestart. En ook kunstmatige intelligentie gaat weer zorgen voor verandering, bijvoorbeeld als we die kunnen inzetten bij het zoeken naar gegevens over bedrijven op internet.’ Snijkers: ‘Ik denk dat we uiteindelijk toegaan naar (near) realtime statistieken. Nu heb je soms een jaar nodig om een statistiek te maken, voor bijvoorbeeld een jaarlijkse enquête. Met behulp van IT-technologie is dat straks anders. Maar let op: de technologie maakt dingen mogelijk, maar om het echt te laten werken is goede methodologie nodig. Methodologie draagt er aan bij dat de technologie betrouwbare statistieken oplevert.’Steeds meer bedrijven data-minded
De auteurs gaan in het boek ook in op de ontwikkeling dat bedrijven steeds meer data over hun eigen processen verzamelen. Snijkers: ‘Steeds meer bedrijven zijn data-minded. We moeten nú beginnen met het beantwoorden van de vraag hoe we daar het beste gebruik van kunnen maken, want over tien jaar zijn we te laat.’ Statistiekbureaus zullen nieuwe technieken moeten ontwikkelen om aan te sluiten bij de data die bij bedrijven beschikbaar zijn en nieuwe methodes om daar relevante uitkomsten over te publiceren. ‘Vertrouwen is daarbij essentieel: bedrijven moeten erop kunnen vertrouwen dat we goed met hun data omgaan.’Alle kennis gebundeld
‘Advances in Business Statistics, Methods and Data Collection’ is bruikbaar voor statistici wereldwijd, maar ook voor onderzoekers van nationale banken, economen, studenten en hun docenten. Snijkers: ‘Je haalt eruit wat voor jou interessant is. Er is geen andere plek waar zoveel kennis over bedrijfsstatistieken is gebundeld. Het vult een gat in het kennisveld. Ik vond het een eer dat de American Statistical Association mij vroeg het boek te maken en ik ben heel trots op het resultaat dat we met het hele team hebben bereikt. De inhoud komt overeen met wat we voor ogen hadden, maar zonder de bijdragen van alle auteurs was het er niet in deze vorm gekomen.’Relevante links
- Website - Bedrijven
- Privacyregels CBS - Privacy
- Website - Wiley - Advances in Business Statistics, Methods and Data Collection