CBS en Kadaster koppelen open en linked data
Koppelen van data
Het registreren van vastgoed- en geografische informatie. Dat is de wettelijke taak van het Kadaster. Die informatie van het Kadaster wordt nog waardevoller als deze verbonden kan worden met de data van het CBS. ‘Denk bijvoorbeeld aan de CBS-data op wijk- en buurtniveau’, zegt Erwin Folmer. Hij is senior adviseur Landelijke Voorzieningen bij het Kadaster. ‘Van dat soort relevante sociaal-demografische data hebben wij weinig informatie. Als je die gegevens weet te koppelen aan onze gegevens krijg je dieper inzicht in verschillende maatschappelijke thema’s.’
Datathon
Om te onderzoeken wat die koppeling van data in de praktijk zou kunnen opleveren, organiseerden beide partijen in opdracht van de interdepartementale Stuurgroep Open Data van 6 tot en met 9 november 2017 een datathon bij het CBS in Den Haag. Daarin gingen teams van het CBS en het Kadaster met de data van beide organisaties aan de slag. Om precies te zijn: met de datasets Wijken en Buurten, Krimpregio’s, Afstand banen per gemeente, Energiepotentie per gemeente, Arbeidsdeelname per gemeente en Aantallen woningtransacties per gemeente. Data die werden aangevuld met informatie uit de BAG (Basisregistraties Adressen en Gebouwen), de BRT (Basisregistratie Topografie) en de DKK (Digitale Kadastrale Kaart). ‘Kunnen we deze data op toegankelijke wijze met elkaar linken zodat ze ons meer inzichten opleveren over thema’s die in de samenleving actueel zijn’, verwoordt Folmer dé grote uitdaging van de datathon.
Maatschappelijke thema’s
De datathon verliep succesvol. ‘We zijn er met elkaar in geslaagd om de open datasets geschikt te maken voor linked data’, vertelt Erwin van Mierlo. Hij is coördinator Open Data bij het CBS. ‘We kunnen er ook mee laten zien wat de mogelijkheden zijn.’ Om dat aan te tonen hadden het CBS en het Kadaster twee datajournalisten uitgenodigd met de vraag welke maatschappelijke thema’s zij urgent vinden. ‘Duurzaamheid en energietransitie waren voor hen belangrijke thema’s’, zegt Folmer. ‘Het verbaasde het tweetal hoeveel informatie we aan de hand van hun vragen konden opdiepen in zo’n korte periode.’
‘We zijn er met elkaar in geslaagd om de open datasets geschikt te maken voor linked data’
Quick en dirty
Van Mierlo nuanceert dat die inzichten tot nu toe beperkt zijn: ‘Je moet bedenken dat we door de beperkte duur van de datathon quick and dirty te werk zijn gegaan. Dat wil zeggen: we hebben over de onderwerpen één jaar in beeld gebracht en kunnen de cijfers niet in historisch perspectief plaatsen. De finesses zijn er dus nog niet. Maar daar was het ons ook niet om te doen. Waar het om gaat, is dat we hebben bewezen dat het linken van CBS- en Kadasterdata inzicht geeft in thema’s van maatschappelijk belang én dat we die heel toegankelijk en bruikbaar kunnen maken onder andere voor visualisering op kaartniveau.’ En dat is van grote waarde, benadrukken de twee. Folmer: ‘In een paar seconden kun je inzoomen op allerlei onderwerpen, van duurzaamheid tot mobiliteit. Toegegeven, dat kon tien jaar geleden ook, maar dat was een stuk lastiger. Je moest losse tabellen downloaden en koppelen. Nu doe je dat met één druk op de knop.’ Van Mierlo: ‘Als je naar een data gedreven overheid wil - één van de belangrijke beleidspunten van het nieuwe kabinet - is dit van grote toegevoegde waarde.’
Puzzelstukjes
De proef is onderdeel van een bredere ontwikkeling die zich richt op het realiseren van een breed platform van linked data, waar het Kadaster al enige tijd aan werkt. De samenwerking tussen het CBS en het Kadaster is hierin cruciaal als de twee grootste leveranciers van Open Data. En die loopt gesmeerd, zegt Van Mierlo. ‘Het Kadaster heeft veel kennis van linked data en wij hebben vooral veel data-technische kennis. We vullen elkaar mooi aan.’ Folmer: ‘Het CBS heeft waardevolle datasets en de datathon heeft in korte tijd bewezen dat een dataset nooit op zichzelf staat. Met het platform van linked data vullen we eigenlijk alle puzzelstukjes mooi in.’