De ethische kant van big data

/ Auteur: Masja de Ree
© Hollandse Hoogte / Cultura Images RF
Hoe ga ik veilig maar ook integer om met de data die ik over burgers verzamel? Hoe presenteer ik mijn conclusies op een eerlijke manier? Welke machtspositie levert de beschikking over grote hoeveelheden data op en hoe ga ik daarmee om? Het zijn belangrijk vragen voor data scientists en statistici. Daarom is er specifiek aandacht voor ethiek tijdens het Rijks Data Science Programma van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties (BZK) en het CBS.

Training op gebied van data science

Het Rijks Data Science Programma is een initiatief van het ministerie van BZK in samenwerking met het CBS. Binnen dit programma werken 35 net afgestudeerden 2 jaar bij verschillende ministeries. Bij het CBS volgen ze een training, waarbij de nadruk ligt op de ontwikkeling van kennis en vaardigheden op het gebied van data science. Een deel van hen voert ook een aantal projecten uit bij het CBS. Prof. Bart Bakker is bij het CBS verantwoordelijk voor de inhoud van het Rijks Data Science Programma. ‘Ethisch omgaan met data is van groot belang voor ons en voor de wetenschap. Het voorkomt wetenschappelijke calamiteiten, die het imago van de wetenschap in grote mate kunnen schaden. Dat geldt ook voor de officiële statistiek. Dat bewustzijn vergroten is dan ook het doel van de module ethiek die in het Rijks Data Science Programma en het vaktraineeship van het CBS is opgenomen. Ethiek staat hoog in het vaandel van het CBS en de mensen die er werken.’

Francien Dechesne
© Sjoerd van der Hucht Fotografie

Module ethiek

‘Data dringen overal ons leven binnen’, zegt Francien Dechesne van het Centrum voor Recht en Digitale Technologie van de Universiteit Leiden, die de module ethiek verzorgt tijdens het Rijks Data Science Programma. ‘Als we een partner zoeken via een datingprogramma, als we informatie zoeken op internet, maar ook in onze relatie met de overheid en met commerciële partijen. Wie data bezit, heeft een bepaalde macht.’ De razendsnelle ontwikkelingen in de datatechnologie roepen veel vragen op, zeker ook voor het CBS en andere overheidsinstellingen die met grote hoeveelheden data werken.

‘Je hebt als data scientist of statisticus een professionele verantwoordelijkheid’

Algoritme

Als je beslissingen neemt of conclusies trekt op basis van big data, dan is er altijd een kans dat die data een onrechtvaardigheid introduceren. Dechesne geeft een voorbeeld: ‘Stel dat je een algoritme wil gebruiken om uit een berg sollicitaties geschikte kandidaten voor een directeursfunctie te halen. En stel dat je dat algoritme baseert op big data over in het verleden als succesvol beschouwde directeuren. Wat er dan gebeurt kun je illustreren door een Google-image search te doen op CEO: dan vind je overheersend mannen in pakken. In dit geval kan een onrechtvaardige behandeling in het verleden leiden tot een onrechtvaardige behandeling in het heden en daarmee ook de toekomst.’

Kaders

Elke overheidsorganisatie werkt binnen bepaalde kaders. Het CBS mag bijvoorbeeld niet aan profilering en niet aan opsporing doen. Voor de politie gelden andere kaders. Als medewerker van een organisatie moet je je aan die kaders houden, die vaak wettelijk zijn vastgelegd. Dechesne: ‘Daarnaast heb je als data scientist of statisticus een professionele verantwoordelijkheid. Je moet goed kunnen uitleggen wat jouw model of grafiek wel én niet laat zien en welke conclusies je daar wel en niet uit kunt trekken.’ Wees je bewust van hoe je informatie presenteert en hoe die presentatie samenhangt met je onderzoeksvraag. Een duidelijk voorbeeld is de grafiek met de uitvergrote y-as. Daardoor kan een geringe stijging van een fenomeen, een grote stijging lijken - het hangt van de vraag af of je grafiek in dit geval de juiste informatie overbrengt.’

grafiekvoorbeeld

Macht van data

Waarom is aandacht voor ethiek zo belangrijk? Dechesne: ‘Ik ben wiskundige. Ik kom uit de wereld van de cijfers. Maar tijdens mijn opleiding heb ik niet veel oog gekregen voor de macht van data in de maatschappij. Cijfers hebben een aura van objectiviteit om zich heen hangen. Maar de conclusies die je uit de data trekt, zijn altijd relatief aan de definities die je hanteert en de keuzes die je maakt bij de opzet van je onderzoek. Die keuzes kunnen daarom grote impact hebben op groepen in de maatschappij. Het is belangrijk je dat te realiseren. Keuzen maken moet en is niet erg, zolang je ze bewust maakt en er transparant over bent.’