Wat kan het CBS zeggen over causaal verband?
Causaliteit
Leidt nieuw beleid tot bijvoorbeeld minder armoede of meer mensen vanuit een uitkering naar werk of zijn er andere factoren die een rol spelen, of is de gevonden samenhang toeval? En kun je een eventuele causaliteit wel vaststellen op grond van - vaak beperkte - datareeksen? Het is een belangrijke methodologische vraag voor het CBS en daarom bracht senior methodoloog Frank Pijpers hem in bij de Wiskunde- en Industrieweek, een jaarlijks evenement dat georganiseerd wordt door onder andere de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO). Als voorbeeld diende een vraag van Staatstoezicht op de Mijnen over de aardgasboringen in Groningen.
Gasboringen
‘Staatstoezicht op de Mijnen stelde ons de vraag of het beleid om de aardgasboringen in Groningen te verminderen, heeft geleid tot minder aardbevingen’, zegt Pijpers. ‘Nu zijn er wiskundige technieken waarmee je onder bepaalde omstandigheden een oorzakelijk verband kunt aantonen. Maar daarvoor zijn veel metingen over een hele lange periode nodig en die hebben we meestal niet. Ook niet in het geval van de situatie in Groningen.’ Pijpers bedacht een hypothese: misschien kun je op grond van weinig metingen wel een beperkte uitspraak over causaliteit doen. Namelijk alleen of het beleid wel of niet voor een verandering zorgt en niet hoe groot die verandering is. Met deze hypothese ging een team van vijf wiskundigen aan de slag tijdens de jaarlijkse Wiskunde- en Industrieweek.
Een eerste stappenplan moet leiden tot een algoritme, waarmee statistische onderzoekers kunnen nagaan of bij een bepaald probleem een uitspraak kan worden gedaan over oorzaak en gevolg
Ruis
Sándor Kolumbán van de Technische Universiteit Eindhoven was één van deze wiskundigen. ‘Uit ons onderzoek blijkt dat het onder bepaalde voorwaarden mogelijk is om op grond van een beperkte dataset een uitspraak te doen over causaliteit. Eén van die voorwaarden is de aanwezigheid van ruis in de data – kleine verstoringen. Dat klinkt raar maar juist die ruis kan een aanwijzing zijn voor de richting van de samenhang van gebeurtenissen: voor het verband tussen de oorzaak en het gevolg.’ Als twee reeksen met gebeurtenissen op dezelfde tijd plaatsvinden, kun je zonder verdere informatie niet zeggen of de ene reeks de andere veroorzaakt, of dat er nog een heel andere oorzaak is. Als in één van de reeksen echter een onregelmatigheid optreedt: een foutje in de database bijvoorbeeld, of een verstoring van buitenaf en dat heeft effect op de andere reeks, dan zegt dát iets over oorzaak en gevolg. Dat is een belangrijke uitkomst, aldus Pijpers: ‘Perfecte metingen maken het onmogelijk om oorzaak en gevolg te ontdekken.’
Algoritme
Het onderzoek van de wiskundigen leidt tot een eerste stappenplan. Dat moet leiden tot een algoritme, waarmee statistische onderzoekers stap voor stap kunnen nagaan of bij een bepaald probleem een uitspraak gedaan kan worden over oorzaak en gevolg. Pijpers: ‘Bij een beperkte hoeveelheid statistische data is dat onder heel specifieke omstandigheden het geval. Vaker is dat niet zo. Ook in het geval van de gasboringen leidt deze aanpak op zichzelf nog niet tot een duidelijke uitspraak over causaliteit.’ De uitkomst van het methodologisch onderzoek is voor het CBS een grote stap vooruit. ‘We hebben nu een wetenschappelijke basis voor het feit dat we uitspraken over causaliteit vermijden. Doen we wél uitspraak over oorzaak en gevolg, dan kunnen we nu laten zien dat dat verband er echt is.’
Ook de wiskundigen zijn tevreden met de resultaten. Zij werkten deze uit tot een wetenschappelijk artikel dat op dit moment wordt aangeboden voor publicatie.
Theorie en praktijk
Bij de Wiskunde- en Industrieweek worden wiskundigen van universiteiten ingezet bij problemen waar bedrijven en overheidsinstellingen mee kampen. Kolumbán: ‘We werken als wiskundigen niet vaak op deze manier samen met de praktijk. Het is mooi om te zien wat ons universitaire werk kan opleveren. We geven aan de samenwerking graag een vervolg. Ik heb subsidie aangevraagd bij de Europese Unie om causaliteit verder te onderzoeken.’