2. Korte beschrijving van het onderzoek
2.1 Steekproef
De doelpopulatie voor het onderzoek Watergebruik Thuis 2021 bestaat uit alle particuliere huishoudens in Nederland. Voor het steekproefkader is daarom een bestand met (voorlopige) huishoudensgegeven samengesteld. Dit bestand bevat alle actuele personen die in de Basisregistratie Personen (BRP) staan ingeschreven, met gegevens over het huishouden waar zij toe behoren, zoals type huishouden en het aantal personen in het huishouden.
Voor ieder huishouden is een zogenaamde ‘referentiepersoon’ geselecteerd. Een referentiepersoon kan hierbij worden gezien als het ‘hoofd van het huishouden’. Het CBS bepaalt voor ieder huishouden wie de referentiepersoon is. Voor het steekproefkader zijn alleen personen geselecteerd van 16 jaar of ouder bij de start van het veldwerk.
Het steekproefontwerp bestaat uit twee delen. Allereerst is er sprake van een landelijke steekproef. Deze is evenredig over het land verdeeld (en dus over de verzorgingsgebieden van alle waterbedrijven). Bovenop de landelijke steekproef is er in vijf gebieden waar oversampling voor gewenst is een extra steekproef getrokken.
2.2 Benaderingsstrategie
Voor het onderzoek is gebruik gemaakt van de volgende benaderingsstrategie:
- Steekproefpersonen ontvangen een aanschrijfbrief met daarin het verzoek om via internet deel te nemen aan het onderzoek en de bijbehorende inloggegevens. Daarnaast wordt in de brief ingegaan op het doel van het onderzoek.
- Bij de aanschrijfbrief zit een folder specifiek voor WGT toegevoegd.
- Bij de aanschrijfbrief zit een turflijstenboekje bijgevoegd en een doucheklokje.
- Twee weken na de aanschrijfbrief wordt aan steekproefpersonen een eerste rappelbrief verstuurd met daarin opnieuw het verzoek om via internet te reageren. Deze brief wordt alleen verstuurd aan steekproefpersonen, waarvan geen respons is ontvangen via internet en die niet via het Contact Centre Inbound (CCI) hebben aangegeven niet te willen of kunnen deelnemen aan het onderzoek.
- Twee weken na de eerste rappelbrief wordt aan steekproefpersonen een tweede rappelbrief verstuurd met opnieuw het verzoek om via internet te reageren. Deze brief wordt alleen verstuurd aan steekproefpersonen waarvan nog geen respons is ontvangen via internet en die niet via het CCI hebben aangegeven niet te willen of kunnen deelnemen aan het onderzoek. In de brief staat een uiterste datum tot wanneer de vragenlijst kan worden ingevuld.
- Vanwege de achterblijvende respons is de benaderingsstrategie aangevuld met een derde rappelbrief.
2.3 Vragenlijstlijstontwikkeling
Voor het onderzoek Watergebruik Thuis 2021 is een elektronische vragenlijst gebruikt voor internetwaarneming. Het vragenlijstontwerp is door middel van een review en vragenlijstschema’s door de ontwikkelaar afgestemd met Vewin. De vragenlijst is in Blaise geprogrammeerd, de door het CBS ontwikkelde software voor elektronische vragenlijsten.
Naast de digitale vragenlijst is er ook een papieren deel. De papieren vragenlijsten bestaan uit de verschillende turflijsten en een hulpformulier voor het invullen van de watermeterstand. Het turflijstenboekje begint met de watermeter en gaat vervolgens in op de verschillende lijsten voor wc 1, wc 2, badkamer 1, badkamer 2, drinkwater binnen, drinkwater buiten en overig watergebruik (zoals handen wassen). Deze lijsten zijn in samenspraak met de communicatie afdeling van het CBS gemaakt om voor een goede vormgeving te kunnen zorgen.
Er is rekening gehouden met de werkwijze van het CBS. Daarbij is het relevant om te noemen dat er geen informatie is uitgevraagd die al via registers beschikbaar is. In de vragenlijst is gebruik gemaakt van een zogenaamde ‘invuldag’. Dit houdt in dat aan iedere respondent een dag van de week is toegekend waarover de vragen gaan. De respondent kan vervolgens in de vragenlijst kiezen of hij/zij over de meest recente dag van de week de vragen beantwoordt of dat er 1 week wordt teruggekeken. Deze datum wordt in de vragenlijst automatisch aangepast op basis van de systeemdatum bij het zien van de vraag naar invuldag.
De vragenlijsten, de turflijsten en de doucheklokjes zijn voordat ze het veld in gingen onderworpen aan een kwalitatieve test, uitgevoerd door het vragenlab van de afdeling Methodologie. Op basis hiervan zijn er nog enkele verduidelijkingen in de vragenlijst en turflijsten doorgevoerd.
De blokken die aan bod komen in de vragenlijst zijn als volgt:
- Controle persoonsgegevens
- Module onderwijs
- Gemeten watergebruik (turflijst meterstanden)
- WC (turflijst WC)
- Badkamer (turflijst badkamer)
- Vaatwasser
- Wasmachine
- Consumptie (turflijst consumptie)
- Watergebruik voor buiten (turflijst buitenkraan)
- Overig (turflijst overig)
- Evaluatie
- Werving
- Incentive
Bij het opstellen van de vragenlijst is sterk rekening gehouden met de informatie die benodigd zou zijn voor het schatten van het totale watergebruik per persoon en per huishouden. Reden dat onderwijsgegevens zijn uitgevraagd is dat dit een belangrijk achtergrondkenmerk is. Verwachting is namelijk dat het invullen van de vragenlijst samenhangt met het hoogst behaalde onderwijsniveau en dat de respons op dit kenmerk selectief zou zijn. Informatie over het hoogst behaalde onderwijsniveau is niet integraal beschikbaar en je moet het daarom uitvragen om een beeld te hebben van de selectiviteit.
2.4 Veldwerk
Het onderzoek vond plaats van november 2020 tot en met december 2021. De uitgezette steekproef bestond uit 19.143 duizend personen. Om een zo goed mogelijke spreiding over het jaar te krijgen, is de steekproef verdeeld over 12 maandporties. In aanvulling is gebruik gemaakt van een zogenaamde ‘invuldag’ zodat ook sprake is van een zo goed mogelijke spreiding over de weken en dagen van de week. Aan iedere respondent is een dag van de week toegekend waarover de vragen gaan. Overall hebben 2.926 personen gereageerd, dit komt neer op een respons van 15,3%.
Mannen responderen iets beter dan vrouwen en het responspercentage loopt op met de leeftijd. De respons differentieert sterk naar migratieachtergrond: personen met een Nederlandse achtergrond responderen vaker dan personen met een migratieachtergrond. Vooral mensen met een niet-westerse migratieachtergrond responderen minder. Paren zonder kinderen hebben het hoogste responspercentage als uitgesplitst wordt naar de positie in het huishouden. Met name thuiswonende kinderen responderen relatief weinig. Omdat de referentiepersoon in een huishouden is geselecteerd, gaat het hier wel om een erg kleine groep. De respons is het laagst in het westen van Nederland en in de zeer sterk stedelijke gebieden. Hier is sprake van een overlap, met name in West-Nederland zijn veel zeer sterk stedelijke gebieden. Personen in de hoogste inkomenskwintielen responderen vaker dan personen in de groepen met een lager huishoudinkomen.
Van de uitgezette steekproef zijn er 968 personen die hebben aangegeven niet te willen deelnemen aan het onderzoek, dit is de non-respons. Ruim 15 duizend personen hebben niet gereageerd (geen respons).
Aantal | % | |
---|---|---|
Uitgezette steekproef | 19 143 | 100 |
Respons | 2 926 | 15,3 |
w.v. bruikbaar | 2 922 | 15,3 |
Geen respons | 15 249 | 79,7 |
Non-respons | 968 | 5,1 |
Afgebroken vragenlijsten | 408 | 2,1 |
De gemiddelde vragenlijstduur kwam uit op 19 minuten en 6 seconden. Daarnaast hebben respondenten ook tijd besteed aan het invullen van de verschillende turflijsten en het opmeten van de eigen watermeterstanden.
2.5 Databestand
Op basis van de verzamelde data is een databestand samengesteld. In het databestand is de totale respons opgenomen. Dat wil zeggen de landelijke respons en de respons die is verzameld ten behoeve van de oversampling.
In het databestand zijn gewichten opgenomen. Hiermee wordt gecorrigeerd voor selectieve non-respons. Naast het corrigeren voor selectiviteit in de respons kan een weegmodel er ook voor zorgen dat de steekproefvariantie van de schattingen kleiner wordt. Dit is het geval wanneer er samenhang is tussen de doelvariabele en de variabelen in het weegmodel. Tot slot kan een weegmodel ervoor zorgen dat schattingen aansluiten bij de populatietotalen, door deze in het weegmodel op te nemen.
Het weegmodel dat voor WGT is ontwikkeld ziet er als volgt uit:
Met behulp van de gewogen data in het databestand kunnen uitspraken worden gedaan over het watergebruik van huishoudens in Nederland. Het databestand op zichzelf is echter niet toereikend voor de schattingen van het watergebruik per persoon en vandaar dat een modelmatige methode is ontwikkeld waarmee dat wel mogelijk is (zie hoofdstuk 3).
Doordat CBS bij de steekproeftrekking aan iedere respondent een uniek volgnummer toekent, is het mogelijk om aan de gegevens uit de enquête informatie uit andere bronnen (registraties) te koppelen. Het databestand van WGT is bij oplevering verrijkt met informatie over leeftijd, geslacht, type huishouden, woongemeente en inkomen.
Voor het onderzoek is een kwaliteits- en plausibiliteitsanalyse gedaan. Daaruit blijkt dat met name het noteren van de watermeterstand voor problemen zorgde bij de respondenten. 9,1 procent had geen watermeter en 24,4 procent heeft de watermeterstand niet kunnen noteren. Gezien het relatief grote aandeel onbekenden (weet niet, weigert of empty) hadden respondenten verder moeite met het beantwoorden van de vragen hoe oud het toilet is (9,8 procent), of op de invuldag langer of korter is gedoucht dan gebruikelijk (7,4 procent), wat het merk wasmachine of vaatwasmachine is (6,3 procent) en welk(e) wasprogramma(‘s) zijn gebruikt (2,3 procent). Ook de vragen naar de behaalde opleiding zijn relatief vaak niet beantwoord (6,4 procent).
Ten aanzien van de plausibiliteit is opgemerkt dat het vanwege de beperkte vergelijkbaarheid met voortgaande edities lastig is om te concluderen of de uitkomsten voor de geanalyseerde doelvariabelen plausibel zijn. Zeker ook gezien de coronapandemie en de maatregelen die daarbij golden.
Als aandachtspunt kwam naar voren dat naar verhouding hoogopgeleiden oververtegenwoordigd zijn in het onderzoek. Hiervoor is niet volledig te corrigeren met de weging.