Makkelijk en snel met CBS open data aan de slag
Meer transparantie
Het open data portal is in juni 2014 gelanceerd. ‘De introductie sloot aan bij de behoefte in de maatschappij om meer transparantie. De statistische informatie van het CBS wordt door het beschikbaar stellen van de open data beter bereikbaar en is gemakkelijker te hergebruiken’, vertelt Erwin van Mierlo. Hij is coördinator open data bij het CBS. ‘We zorgen er voor dat ook via ons open data portal altijd de meest recente informatie beschikbaar is. Dat is een groot voordeel.’ Gemiddeld maken maandelijks 450.000 unieke klanten gebruik van de datasets in het open data portal van het CBS. ‘Gebruikers binnen de overheid en het bedrijfsleven ontwikkelen steeds meer toepassingen waarbij onze open data van toegevoegde waarde zijn’, aldus Van Mierlo.
‘We zien dat steeds meer mensen datagedreven willen werken. Hopelijk worden op deze manier de CBS-data nóg toegankelijker’
Gemakkelijk en snel aan de slag
Voor het gebruik van de openbare datasets van het CBS in de software van de gebruikers is een zogenaamde application programming interface (API) nodig. Momenteel wordt gewerkt aan een nieuwe versie van deze API, gebaseerd op het nieuwe OData 4-protocol. Dat was de aanleiding voor Jolien Oomens, ICT-onderzoeker bij het CBS, om een aantal handleidingen te schrijven. ‘Die zorgen er voor dat nieuwe gebruikers gemakkelijk en snel met open data aan de slag kunnen in Python en R en zelf mooie kaarten en tijdreeksen kunnen maken. Het package voor R dat in de handleidingen gebruikt wordt, is ontwikkeld door methodoloog Edwin de Jonge van het CBS. Jonathan de Bruin, Research Data Engineer aan de Universiteit van Utrecht, heeft het package voor Python ontwikkeld.
Drempel verlagen
Oomens verzorgt binnen het CBS cursussen over open data, deep learning, visualisaties en R en ontwikkelt daarvoor ook het lesmateriaal. ‘De handleidingen voor het gebruik van OData 4 met Python en R hebben we laten testen door docenten en studenten van een aantal hogescholen en universiteiten. Hun feedback hebben we verwerkt. Omdat enkele docenten aangaven dat ze de handleidingen al in het volgende collegejaar wilden gebruiken, hebben we ervoor gekozen om ze ook aan te passen aan het reeds bestaande OData 3-protocol en ze zo snel mogelijk op onze website te publiceren.’ Oomens hoopt dat de handleidingen in het Nederlands en Engels voor gebruikers de drempel verlagen om met open data aan de slag te gaan. ‘We zien dat steeds meer mensen - bijvoorbeeld data-analisten, data-journalisten en studenten - datagedreven willen werken. Hopelijk worden op deze manier de CBS-data nóg toegankelijker’.