Betrouwbare data in coronatijd en daarna
Over het belang van data in deze tijd, dataverzameling en het belang van een nationale datastrategie spreken we Bert Kroese, die met het vertrek van de DG Tjark Tjin-a-Tsoi naar Sanquin per 1 april deze functie waarneemt.
Waarnemend DG in coronatijd. Niet echt een periode van ‘even op de tent passen’?
Het is een bijzondere tijd beaamt Kroese. Het hele CBS werkt nu vanuit huis. Dit vraagt veel van de mensen en de organisatie. Sommige medewerkers proberen hun werk te doen met jonge kinderen om hen heen die niet naar school of de opvang kunnen. Anderen voelen zich juist heel alleen en missen de sociale contacten op het werk. Er zijn zorgen over de gezondheid van zichzelf en dierbaren. We hebben als CBS de technische voorzieningen om thuis te werken prima op orde, maar het is voor velen echt een moeilijke tijd.
Terwijl juist nu de behoefte aan betrouwbare, onafhankelijke data heel groot is. We werken in deze bijzondere omstandigheden met man en macht om aan die statistische behoefte te voldoen. Het gaat er niet alleen om de bestaande statistieken te continueren maar ook om nieuwe statistieken op te zetten die juist nu relevant zijn. Voorbeeld hiervan is een wekelijks overzicht van faillissementen. Dat vraagt om improvisatievermogen, deskundigheid en het aangaan van nieuwe samenwerkingsverbanden. We werken intensief samen met organisaties als het RIVM, Sociaal Cultureel Planbureau, Planbureau voor de Leefomgeving, Centraal Planbureau en met het bedrijfsleven. Soms moeten we daarbij creatieve oplossingen bedenken. Bijvoorbeeld bij statistieken waarbij normaliter enquêteurs en enquêtrices langs de deuren gaan. Dat kan eenvoudigweg niet in deze tijd. Dat lossen we nu deels op door telefonische enquêtes of via internet.
Het CBS stuurt nog altijd enquêtes uit. Waarom stopt het CBS daar niet gewoon even mee?
Juist nu er zo’n grote behoefte aan data is, is het verkrijgen van gegevens voor het CBS van groot belang. Het allergrootste deel van de gegevens komen geautomatiseerd bij ons. Toch zijn er ook gegevens die we schriftelijk of mondeling uitvragen bij particulieren en bedrijven. Een statistiek als consumenten- of producentenvertrouwen is juist op dit moment erg belangrijk voor de inschatting van de economische situatie. Dergelijke informatie is niet te vinden in registraties, dat moeten we echt vragen aan burgers en ondernemers.
Waar in de maatschappij slaat de crisis nu echt toe en hoe groot is het effect? We begrijpen heel goed dat mensen nu wel wat anders aan hun hoofd hebben dan vragenlijsten invullen en dat bedrijven moeite hebben om het hoofd boven water te houden. Toch hebben we die gegevens hard nodig om Nederland van die cijfers te kunnen voorzien die zo nodig zijn voor beleidsmakers om zo goed mogelijk beslissingen te kunnen nemen.
Kunnen die gegevens niet op een andere manier worden verkregen?
Natuurlijk zijn we constant op zoek naar alternatieve databronnen. Dat doen we al heel lang omdat we de administratieve lasten voor kleinere en grote ondernemers willen verminderen, maar nu lijkt de noodzaak nóg groter om nieuwe databronnen te vinden. Het CBS is hierbij wel heel voorzichtig. We kijken altijd goed naar welke data we nu écht nodig hebben (proportionaliteit). Als het even kan laten we de data vooral bij de bron zelf (data-minimalisatie). We voldoen altijd aan alle eisen ten aanzien van informatieveiligheid en privacywetgeving, dit is essentieel voor ons. Het CBS levert daarom nooit data die naar individuele personen of bedrijven kunnen leiden. Tot slot, we maken alle statistiek die wij produceren, openbaar. Hiermee zijn we transparant en kan iedereen ook gebruik maken van onze statistieken.
Nieuwe databronnen, moeten we dan denken aan big data, zoals mobiele telefoniedata?
Bijvoorbeeld ja. We onderzoeken in hoeverre we departementen en het RIVM kunnen ondersteunen met het analyseren van mobiele telefoniegegevens om bijvoorbeeld verplaatsingen in beeld te krijgen. We kijken ook in hoeverre we de actuele stand van de economie goed kunnen beschrijven door gebruik te maken van data uit verkeerslussen op de weg, bezorgde postpakketjes en sensoren in schepen. We onderzoeken verder de mogelijkheden van data over het betalingsverkeer zoals de Betaalvereniging Nederland die nu ook al publiceert. We willen met behulp van deze data helpen de (gevolgen van de) huidige coronacrisis goed in kaart brengen en daarmee beleidsmakers in staat te stellen de juiste keuzes te maken. Voor ons als CBS geldt altijd: alleen als onze werkwijze getoetst is en dus past binnen de wet- en regelgeving, zullen we deze informatie maken.
Welke resultaten zijn er al geboekt?
Een mooi voorbeeld is het onderzoek naar prijzen ten behoeve van de inflatiestatistieken. In veel landen om ons heen, waar statistische onderzoekers gewoon nog langs de detailhandel moeten gaan om prijzen te meten, ontstaan nu problemen. Wij doen het onderzoek naar de prijzen helemaal met big data-bronnen, zoals webscraping voor onlinewinkels en geaggregeerde scannerdata van de kassa’s van winkels. Daarmee kunnen we probleemloos zeer nauwkeurige inflatiecijfers blijven maken. We kunnen hiermee ook een actueel beeld geven waar de consumenten hun geld aan besteden in de winkels. Zo konden we al snel een beeld geven van het hamsteren in de supermarkten aan het begin van de coronacrisis.
Een ander goed voorbeeld zijn onze sterftecijfers. In nauwe samenwerking met het RIVM publiceren we nu wekelijks cijfers over het aantal overledenen. Door die cijfers te vergelijken met de gebruikelijke sterfte in deze periode kan een inschatting worden gemaakt van het aantal niet gediagnosticeerde overledenen door het coronavirus.
Datagedreven-werken staat nu echt in de spotlight, denkt u dat deze ontwikkeling blijft?
De behoefte aan betrouwbare data is al een tijd groot. Door de coronacrisis is de urgentie om snel inzicht en overzicht te krijgen op basis van betrouwbare onafhankelijke data alleen maar toegenomen. Maar ook rondom andere maatschappelijke opgaven zien we een toenemende behoefte aan betrouwbare data. Overheden, de academische wereld, het bedrijfsleven en nationale statistische bureaus innoveren overal ter wereld met nieuwe databronnen voor overheidsstatistieken. Deze ontwikkeling blijft. De overheden gaan nog sneller over tot werken, kennisdeling en beleids- en besluitvorming op basis van data. Door verder te investeren in een goede data-infrastructuur maken we dat mogelijk.
Welke stappen moeten dan worden gezet?
Er is veel data bij de overheid aanwezig en er kan veel winst behaald worden door die data goed te ontsluiten en te gebruiken voor het beleid. Datamanagement is niet langer ‘iets voor erbij.’ Het is een randvoorwaarde willen we de verdere ontwikkelingen op een goede manier sturen en stimuleren. In de informatiesamenleving waarin ‘waarheid’, betrouwbare data en het veilig inzetten van data een groot goed is geworden, is een investering op regie en sturing nodig. In veel landen zijn dergelijke stappen al gezet in de vorm van een nationale datastrategie. Steeds vaker stellen landen bijvoorbeeld een nationale ‘chief data officer’ en ‘data stewards’ aan. De nationale statistische bureaus hebben daar vaak een fundamentele expertiserol bij. Het CBS wil hierover graag in gesprek met het kabinet, departementen, gemeenten, wetenschap en bedrijfsleven.
Waarom nu beginnen over een nationale datastrategie?
Juíst in deze crisistijd merk je hoe belangrijk het is om de juiste data te hebben om op te kunnen sturen. We krijgen als CBS nu veel vragen van departementen om snel informatie te leveren. Voor ons is het soms zoeken om de juiste gegevens bij elkaar te halen. Als we verder investeren in een open datastructuur waar alle openbare overheidsdata beschikbaar en goed vindbaar is, kunnen de vragen van departementen sneller en beter beantwoord worden.
Ook zien we dat veel nieuwe informatie gemaakt kan worden door databronnen te koppelen en te combineren. Dat allemaal binnen onze harde randvoorwaarde dat aan de privacywetgeving voldaan blijft worden. Als CBS zetten we daarom sterk in op technieken om individuele gegevens niet naar het CBS te halen maar te laten bij de plek waar die verzameld is. En dan op afstand veilig te analyseren: privacy by design.
In deze crisis zien we dat de samenwerking tussen het bedrijfsleven en de overheid op datagebied heel veel kan betekenen. Door op een veilige manier gebruik te maken van data die bedrijven hebben kan veel maatschappelijke waarde gecreëerd worden zonder dat de privacy in gevaar komt. Ik noemde daar eerder voorbeelden van. Bedrijven hebben ook veel kennis en expertise die heel waardevol is in deze tijd. Wij onderzoeken bijvoorbeeld samen met een Nederlands bedrijf met behulp van webscraping hoe ondernemingen zich aanpassen in deze crisis.
Waar bestaat zo’n nationale datastrategie uit?
Wat we nodig hebben is een goed werkend systeem met goede spelregels. Aan de ene kant vanwege de kansen: met de juiste, betrouwbare en actuele data bij de hand kun je sneller en betere beleidsmaatregelen nemen. En aan de andere kant vanwege de risico’s: zaken als transparantie, zorgvuldigheid en de bescherming van persoonsgegevens staan in dit soort tijden enorm onder druk. Die moet je dus goed regelen met elkaar.
Een nationale datastrategie voor Nederland zorgt ervoor dat we een aantal zaken goed regelen:
- Het borgt democratische waarden: het opstellen van spelregels voor het omgaan met data (denk aan het borgen van transparantie, navolgbaarheid, openheid, privacy, gegevensbeveiliging en betrouwbaarheid van data en methodieken, zoals algoritmen).
- Het stimuleert verantwoorde innovaties op het gebied van datagebruik en het creëren van maatschappelijke meerwaarde met data.
- Het zorgt voor de inrichting van een technische en administratieve (overheidsbrede) infrastructuur voor data, datadeling en datasturing. Dat betekent bijvoorbeeld afspraken over meta-datering, standaarden, geharmoniseerde definities om data-uitwisseling mogelijk te maken.
- Het organiseert kennis en competenties om op een doelmatige en veilige wijze met data om te gaan.
Geldt zo’n datastrategie alleen voor de overheid?
Ik verwacht een steeds verdere samenwerking tussen overheid, wetenschap en bedrijfsleven en die is hard nodig. Ook in deze coronacrisis zie je weer goed dat iedereen bij kan dragen. Nederland heeft mijns inziens behoefte aan een systeem van bedrijven, academische instellingen en overheidsorganisaties die samenwerken op dit snel ontwikkelende veld. Vraag en aanbod bij datadiensten explodeert wereldwijd, net als de beschikbare (AI) technologie, en als Nederland daarin mee wil groeien is een dergelijke samenwerking essentieel. De data die private partijen hebben is van grote waarde om overheidsbeleid op te baseren. Denk bijvoorbeeld aan een beter inzicht hoe de doelstellingen over duurzame energie gehaald kunnen worden door beter inzicht in het verbruik van energie door huishoudens. Of beter beleid over toerisme door meer inzicht in de verhuur bij AirBnB. Aan de andere kant zijn er bedrijven die met eigen analyses en onderzoeken een goede bijdrage kunnen leveren. Op dit moment krijgen we veel verzoeken van bedrijven die ons vragen om het aanbod onder de aandacht te brengen bij de juiste overheidspartners omdat deze op dit moment moeilijk te benaderen zijn. In dit samenspel is nog veel te bereiken en dat moeten we met elkaar gaan vormgeven in breder verband, in een breed maatschappelijk debat. Het CBS zelf heeft samenwerking met wetenschap en bedrijfsleven als strategische prioriteit benoemd.
Data zijn belangrijk, maar in deze tijd uiteindelijk slechts een middel tot een doel: weer terug naar een samenleving waarin we met elkaar kunnen wonen, werken en recreëren in alle vrijheid en veiligheid die we gewend zijn.