Europees onderzoek naar big data goed op stoom
Inzoomen op details
De verwachtingen waren hoog gespannen toen het ESSnet big data in 2016 van start ging. Big data zijn hot en de 22 deelnemende organisaties uit 20 landen stonden te popelen om proofs of concepts te bedenken en uit te werken. Nederland heeft de leiding over het Europese onderzoeksproject. Projectleider Peter Struijs: ‘Bij de start van het project hebben we zes hoofdthema’s bepaald (zie kader, red.). Daarnaast kijken we in één overkoepelend project naar de eisen die nodig zijn om op een goede manier met big data te werken, bijvoorbeeld op het gebied van ICT, methodologie en kwaliteit.’
Big data bieden een zee aan mogelijkheden. Struijs: ‘We kunnen bijvoorbeeld steeds meer inzoomen op details: op een bepaalde tijd of plaats. Dat levert maatschappelijk relevante informatie op.’
Omvangrijk project
Martin van Sebille neemt als secretaris de administratieve en financiële kant van het big data project voor zijn rekening, een belangrijke taak bij zo’n omvangrijk project met zoveel verschillende deelnemers en ook belangen. ‘Voor een goed verloop is een goede afstemming met alle deelnemende landen én binnen het CBS nodig’, zegt Van Sebille. ‘Daar heb ik vanaf het begin op ingezet, omdat er zoveel disciplines bij dit onderzoek betrokken zijn.’ Van Sebille stelde de financiële budgetten voor alle landen op en maakt verslagen van alle projectoverleggen. Daarnaast houdt hij bij hoeveel uren en kosten alle landen per deelproject maken. ‘Zo is er steeds overzicht en kunnen we goed monitoren of we op het juiste pad zitten, qua doel én qua kosten en tijdsbesteding.’ De nauwgezette aanpak maakt dat de verplichte projectverantwoording aan Eurostat zeer goed verloopt.
AIS: een goede bron
Anke Consten van het CBS leidt het succesvolle onderzoek rond de scheepvaartstatistiek binnen het Big Data project: ‘Wij hebben bekeken hoe we bestaande statistieken kunnen verbeteren met behulp van gegevens uit het AIS, het automatische identificatiesysteem voor schepen. We hebben met het AIS één Europese bron tot onze beschikking, dat biedt veel mogelijkheden.’ Dankzij het AIS is bekend wanneer een schip waar en met welke snelheid gevaren heeft. Hierdoor kunnen de routes en bestemmingen van schepen bepaald worden en is te zien welke schepen op een bepaald moment in de havens liggen en hoeveel schepen een bepaalde sluis passeren. ‘Deze informatie hadden we niet of met mindere kwaliteit in de bronnen die we nu voor onze statistieken gebruiken’, zegt Consten. Uit dit project blijkt dat AIS een goede bron is om de huidige statistieken over de zeevaart en de binnenvaart te verbeteren. Daarnaast zijn nieuwe statistische producten mogelijk op basis van deze bron. Tussen nu en eind mei 2018 richt Consten zich op de mogelijkheden om de emissiestatistieken te verbeteren op basis van het AIS.
Resultaten implementeren
Nederland heeft veel expertise in huis, onder meer in het Center for Big Data Statistics (CBDS), dat ook bij het ESSnet betrokken is. ‘Een mooie bijkomstigheid van het ESSnet is dat landen die minder ver zijn met big data in de afgelopen tijd veel hebben bijgeleerd van de landen die voorop lopen’, zegt Consten.
Struijs benadrukt dat er veel aandacht was voor lean werken. ‘We doen de meeste internationale vergaderingen bijvoorbeeld per video, om reistijd en -kosten te besparen. Maar we richtten ook de administratie zo in dat alle landen hun werkzaamheden goed kunnen verantwoorden zonder dat daar veel papierwerk aan te pas komt.’ Het ESSnet loopt in mei af. Dan vindt een grote conferentie plaats in Sofia, Bulgarije, waar alle resultaten gepresenteerd worden. Eurostat bereidt ondertussen een nieuwe subsidieronde voor, onder andere om de resultaten van het oude ESSnet big data te implementeren.
Meer weten? Kijk eens op de ESSnet-wiki, waar het onderzoek stap voor stap is na te lezen: https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata
Waar doet het ESSnet onderzoek naar?
Het ESSnet big data doet onderzoek naar:
• De inzet van online informatie voor statistieken, bijvoorbeeld vacatures of informatie van ondernemerswebsites door middel van webscrapen.
• De inzet van data van ‘slimme’ energiemeters. Automatisch uitgelezen informatie over stroomgebruik kan bijvoorbeeld bijdragen aan de statistiek over leegstand.
• De inzet van het volgsysteem voor schepen (AIS) voor de scheepvaartstatistieken.
• De inzet van gegevens van telefoonproviders, bijvoorbeeld voor statistieken over de mobiliteit van mensen.
• De mogelijkheid om big data bronnen te combineren met administratieve bronnen en gegevens uit enquêtes.
• Het combineren van verschillende big data bronnen, bijvoorbeeld voor statistieken over toerisme, de bevolking of de landbouw.