Controle en correctie en het schatten van meetfouten

Omslag, Editing and Estimation of Measurment Errors in Administrative and Survey Data, Sander Scholtus
© CBS
Proefschrift over nieuwe methoden voor het automatisch corrigeren van meetfouten en het toepassen van meetfoutmodellen.

Data die zijn verzameld voor het maken van officiële statistieken of, algemener, voor statistisch onderzoek, bevatten vrijwel altijd meetfouten. Statistiekbureaus en andere onderzoekers hebben daarom methoden ontwikkeld om foutgevoelige data te gebruiken. Op hoofdlijnen zijn er twee soorten aanpakken: enerzijds controle- en correctiemethoden die proberen om individuele fouten in de data op te sporen en aan te passen en anderzijds schattingsmethoden die proberen rekening te houden met meetfouten tijdens de analysefase, zonder de data zelf aan te passen. Dit proefschrift beoogt bij te dragen aan de ontwikkeling van beide aanpakken, met speciale aandacht voor mogelijke uitbreidingen van deze methoden die kunnen worden toegepast op grote hoeveelheden gegevens uit administratieve bronnen.

In het bijzonder komen de volgende punten aan de orde in dit proefschrift:

Ten eerste zijn de huidige methoden voor automatische controle en correctie—gebaseerd op het pionierswerk van Fellegi en Holt—beperkt toepasbaar in de praktijk omdat ze uitgaan van vrij restrictieve aannames. In dit proefschrift worden twee nieuwe methoden voor automatische controle en correctie voorgesteld die deze aannames gedeeltelijk loslaten.

Ten tweede wordt het schatten van meetfoutmodellen met latente variabelen behandeld in de context van de officiële statistiek. Bijzonder is dat men hier vaak geïnteresseerd is in univariate beschrijvende statistieken zoals populatietotalen en -gemiddelden. Er wordt getoond hoe modellen met latente variabelen in deze context gebruikt zouden kunnen worden om de bruikbaarheid te evalueren van nieuwe databronnen, om meer inzicht te krijgen in de nauwkeurigheid van statistieken en om de kwaliteit van statistische uitkomsten te verbeteren.

Ten derde wordt een toepassing bij het CBS beschreven waarin een meetfoutmodel wordt gebruikt om de kwaliteit te vergelijken van data vóór en na automatische controle en correctie.

Scholtus, S. (2018). Editing and estimation of measurement errors in administrative and survey data. Dissertation, Vrije Universiteit Amsterdam, handle:1871/55568.