De ethische kant van big data
Training op gebied van data science
Het Rijks Data Science Programma is een initiatief van het ministerie van BZK in samenwerking met het CBS. Binnen dit programma werken 35 net afgestudeerden 2 jaar bij verschillende ministeries. Bij het CBS volgen ze een training, waarbij de nadruk ligt op de ontwikkeling van kennis en vaardigheden op het gebied van data science. Een deel van hen voert ook een aantal projecten uit bij het CBS. Prof. Bart Bakker is bij het CBS verantwoordelijk voor de inhoud van het Rijks Data Science Programma. ‘Ethisch omgaan met data is van groot belang voor ons en voor de wetenschap. Het voorkomt wetenschappelijke calamiteiten, die het imago van de wetenschap in grote mate kunnen schaden. Dat geldt ook voor de officiële statistiek. Dat bewustzijn vergroten is dan ook het doel van de module ethiek die in het Rijks Data Science Programma en het vaktraineeship van het CBS is opgenomen. Ethiek staat hoog in het vaandel van het CBS en de mensen die er werken.’
Module ethiek
‘Data dringen overal ons leven binnen’, zegt Francien Dechesne van het Centrum voor Recht en Digitale Technologie van de Universiteit Leiden, die de module ethiek verzorgt tijdens het Rijks Data Science Programma. ‘Als we een partner zoeken via een datingprogramma, als we informatie zoeken op internet, maar ook in onze relatie met de overheid en met commerciële partijen. Wie data bezit, heeft een bepaalde macht.’ De razendsnelle ontwikkelingen in de datatechnologie roepen veel vragen op, zeker ook voor het CBS en andere overheidsinstellingen die met grote hoeveelheden data werken.
‘Je hebt als data scientist of statisticus een professionele verantwoordelijkheid’
Algoritme
Als je beslissingen neemt of conclusies trekt op basis van big data, dan is er altijd een kans dat die data een onrechtvaardigheid introduceren. Dechesne geeft een voorbeeld: ‘Stel dat je een algoritme wil gebruiken om uit een berg sollicitaties geschikte kandidaten voor een directeursfunctie te halen. En stel dat je dat algoritme baseert op big data over in het verleden als succesvol beschouwde directeuren. Wat er dan gebeurt kun je illustreren door een Google-image search te doen op CEO: dan vind je overheersend mannen in pakken. In dit geval kan een onrechtvaardige behandeling in het verleden leiden tot een onrechtvaardige behandeling in het heden en daarmee ook de toekomst.’
Kaders
Elke overheidsorganisatie werkt binnen bepaalde kaders. Het CBS mag bijvoorbeeld niet aan profilering en niet aan opsporing doen. Voor de politie gelden andere kaders. Als medewerker van een organisatie moet je je aan die kaders houden, die vaak wettelijk zijn vastgelegd. Dechesne: ‘Daarnaast heb je als data scientist of statisticus een professionele verantwoordelijkheid. Je moet goed kunnen uitleggen wat jouw model of grafiek wel én niet laat zien en welke conclusies je daar wel en niet uit kunt trekken.’ Wees je bewust van hoe je informatie presenteert en hoe die presentatie samenhangt met je onderzoeksvraag. Een duidelijk voorbeeld is de grafiek met de uitvergrote y-as. Daardoor kan een geringe stijging van een fenomeen, een grote stijging lijken - het hangt van de vraag af of je grafiek in dit geval de juiste informatie overbrengt.’
Macht van data
Waarom is aandacht voor ethiek zo belangrijk? Dechesne: ‘Ik ben wiskundige. Ik kom uit de wereld van de cijfers. Maar tijdens mijn opleiding heb ik niet veel oog gekregen voor de macht van data in de maatschappij. Cijfers hebben een aura van objectiviteit om zich heen hangen. Maar de conclusies die je uit de data trekt, zijn altijd relatief aan de definities die je hanteert en de keuzes die je maakt bij de opzet van je onderzoek. Die keuzes kunnen daarom grote impact hebben op groepen in de maatschappij. Het is belangrijk je dat te realiseren. Keuzen maken moet en is niet erg, zolang je ze bewust maakt en er transparant over bent.’