Imputatie van incomplete steekproefdata onder restricties

Omslag, Restrictive imputation of imcomplete survey data, Gerko Vink
© CBS
Ontbrekende waarden zijn een veelvoorkomend probleem bij statistische analyses. Het schatten van zulke waarden—ook wel imputatie genoemd—kan erg lastig zijn, vooral als de geïmputeerde waarden aan restricties moeten voldoen. Dit proefschrift gaat over imputatiemethoden, waarvoor de imputaties aan restricties onderhevig zijn.
Ontbrekende waarden in data sets zijn een probleem omdat de meeste statistische analyses veronderstellen dat de data compleet zijn. Een veelgebruikte oplossing is imputatie: het invullen van de ontbrekende waarde met een schatting. Dit proefschrift richt zich op het vinden van plausibele imputaties. Dit zijn schattingen die echte waarden zouden kunnen zijn geweest wanneer ze wel waren geobserveerd.

Plausibiliteit heeft niet alleen betrekking op de schattingen in afzondering, maar ook op de relatie tussen geschatte waarden en de overige metingen voor de respondent. Een eenvoudig voorbeeld vindt men in variabelen die gezamenlijk optellen tot een totaal. Alleen die imputaties die de somstructuur intact laten kunnen als plausibel worden beschouwd.

In dit proefschrift worden imputatiemethoden voorgesteld die leiden tot plausibele imputaties, die aan restricties voldoen. De behandelde onderzoekssituaties en restricties komen veelvuldig voor binnen onderzoeksdomeinen waarin de statistiek een prominente rol inneemt, zoals officile statistiek, sociale wetenschappen, geologie en de geneeskunde.

Vink G. (2015). Restrictive imputation of incomplete survey data. Dissertation, Utrecht University, handle:1874/308699.