Auteur: Jeldrik Bakker, Francis van der Mooren, Harm Jan Boonstra
Watergebruik Thuis (WGT) 2021

3. Methode op hoofdlijnen

3.1 Doelpopulatie

De doelpopulatie bestaat uit particuliere huishoudens in Nederland. Zoals in hoofdstuk 2 is beschreven, is binnen elk huishouden de ‘referentiepersoon’ van het huishouden geselecteerd.

Op basis van registerdata zijn van deze persoon achtergrondgegevens bekend, waaronder de samenstelling van het huishouden en allerlei kenmerken van dat huishouden. Tussen de situatie zoals bekend in de registerdata en die in de praktijk kan (een klein) verschil zitten. Dit heeft er bijvoorbeeld mee te maken dat de gezinssamenstelling veranderlijk is en de registerdata een eerder peilmoment kennen. In de schattingen wordt uitgegaan van het huishouden zoals bekend is op basis van het register.

3.2 Bronnen

Voor de modelmatige methode worden verschillende bronnen gebruikt. Dat is in de eerste plaats het onderzoek Watergebruik Thuis 2021. Daarnaast wordt gebruik gemaakt van informatie in het Stelsel van Sociaal-Statistische Bestanden (SSB) van het CBS. Op hoofdlijnen wordt gebruikt gemaakt van de volgende bestanden:

  • Persoons- en huishoudkenmerken op basis van de Basisregistratie Personen (BRP). Het gaat hierbij om informatie over het aantal personen, de samenstelling van het huishouden en type huishouden, burgerlijke staat, leeftijd, geslacht en migratieachtergrond;
  • Informatie over de woonregio op basis van de BRP;
  • Het hoogst behaalde onderwijsniveau uit het Opleidingsniveaubestand;
  • Informatie over het inkomen en vermogen van particuliere huishoudens op basis van bestanden van de Belastingdienst;
  • Woningkenmerken zoals de WOZ waarde, type woning en het bouwjaar van de woning op basis van de Basisregistratie adressen en gebouwen (BAG), het WOZ-register en het Kadaster.

3.3 Schattingsmethode

Gebruik van verdelingen

In dit onderzoek is ervan uitgegaan dat met behulp van een vragenlijst niet precies te achterhalen is hoeveel water ergens voor gebruikt is. Het watergebruik verschilt tussen apparaten en de programma’s die gebruikt worden. Er zijn verschillen in waterdruk, die is niet voor alle huishoudens hetzelfde en ook binnen een huishouden kunnen er verschillen zijn in waterdruk afhankelijk van het moment of de plek in huis. Een kraan kan volledig open staan, maar ook gedeeltelijk. Tot slot kunnen ook de antwoorden op de vragenlijst afwijken van de werkelijkheid. Om hier zo goed mogelijk mee om te gaan, is binnen dit onderzoek Bayesiaanse statistiek toegepast waarbij onzekerheid meegenomen wordt in de schattingen. Voor alle onderdelen is een zo goed mogelijke inschatting gemaakt van de onzekerheid. Hiervoor is gebruik gemaakt van eerdere onderzoeken over watergebruik, technische documentatie van apparaten en kennis van experts.

De onzekerheid van de metingen is ook terug te vinden in de resultaten van het onderzoek. In dit rapport en de bijbehorende tabellenset worden schattingen van de populatiegemiddeldes, de standaardafwijking en 90%-betrouwbaarheidsintervallen getoond. Op basis hiervan is een beeld te vormen van hoe nauwkeurig de schattingen zijn.

Standaarduitsplitsingen

Voor de schattingen van het watergebruik wordt standaard uitgesplitst naar een aantal persoons- en huishoudenskenmerken. Het gaat hierbij om:

3.3.1 Overzicht standaarduitsplitsingen
KenmerkGebruikte indeling
GeslachtMannen, vrouwen
Leeftijd0 tot 15 jaar, 15 tot 25 jaar, 25 tot 45 jaar, 45 tot 65, 65 jaar en ouder
Migratieachtergrond1)Nederlandse, westerse, niet-westerse
Hoogst behaald onderwijsniveauLaag (basisonderwijs, vmbo, mbo1), middelbaar (havo, vwo, mbo2-4), hoog (hbo, wo)
Burgerlijke staatGehuwd, gescheiden, verweduwd, nooit gehuwd geweest
StedelijkheidZeer sterk, sterk, matig, weinig, niet
Gestandaardiseerd huishoudeninkomenKwintielen
Type huishoudenEenpersoonshuishouden, paar zonder kinderen, paar met kinderen, eenouderhuishouden
Grootte huishouden1 persoon, 2 personen, 3 personen, 4 personen, 5 personen of meer
1) In 2022 is het CBS overgegaan op een nieuwe indeling naar herkomst. Deze nieuwe indeling was niet op tijd beschikbaar om ook al in dit rapport en de gedane analyses op te nemen. Vandaar dat de oude indeling naar migratieachtergrond nog is opgenomen.

Model op hoofdlijnen

Het watergebruik per persoon en per huishouden per dag is op twee manieren geschat, namelijk als totaalschatting en als som van de schattingen per watergebruikscomponent.

Voor het berekenen van de totaalschatting is gebruik gemaakt van de watermeterstanden zoals die door respondenten zijn opgegeven. Op basis van de watermeterstanden is het watergebruik bepaald en dit is vervolgens gecontroleerd op plausibiliteit. De niet plausibele watergebruiken zijn vervolgens handmatig gecontroleerd en waar mogelijk verbeterd. Voor alle responsen zonder een plausibel watergebruik, is modelmatig een plausibel watergebruik geschat met behulp van de beschikbare bronnen (zie paragraaf 3.2). Vervolgens zijn de totaalschattingen per persoon en per huishouden per dag naar de verschillende kenmerken met een lineair regressiemodel geschat.

Voor de schattingen per watergebruikscomponent is een model ontwikkeld dat op te delen is in vijf verschillende onderdelen: presentiegraad, frequentie, duur, capaciteit en hoeveelheid.

Het eerste onderdeel, de presentiegraad, geeft aan welk deel van de huishoudens in Nederland beschikt over de watergebruikscomponent. Een voorbeeld hiervan is het aandeel huishoudens met een vaatwasmachine. De presentiegraad is geschat met behulp van Bayesiaanse binomiale regressietechnieken. Voor elke persoons- en huishoudenscomponent wordt geschat hoe waarschijnlijk het is dat bepaalde type personen/huishoudens van de Nederlandse populatie beschikken over een specifieke watergebruikscomponent.

Het tweede en derde onderdeel, de frequentie en duur, is op een vergelijkbare manier geschat. Het grote verschil is dat de frequentie en de duur geschat zijn met behulp van lineaire Bayesiaanse regressietechnieken. In de meeste gevallen zijn er modellen gemaakt waarbij alle kenmerken uit de bovenstaande tabel meegenomen zijn als verklarende variabelen, maar bij enkele laagfrequente onderdelen was het noodzakelijk om het aantal kenmerken te reduceren.

Het vierde onderdeel, de capaciteit, is het meest ingewikkelde onderdeel en bestaat uit 4 stappen:

a. Priori verdelingen vaststellen
b. Plausibiliteitscheck van de gemeten waterstanden, inclusief handmatige aanpassingen
c. Totale watergebruik simuleren voor niet-plausibele en missende waardes
d. Posterior verdelingen berekenen

Vooraf is voor elk onderdeel een inschatting gemaakt van hoeveel liter er per keer, of per minuut gebruikt wordt. In bijlage 2 zijn de verschillende gedane aannames opgenomen. In sommige gevallen kan vooraf al een vrij nauwkeurige inschatting gemaakt worden op basis van eerdere metingen of op basis van bestaande kennis, maar in andere gevallen is er teveel onzekerheid. Zo zijn er onder andere fluctuaties in de druk op de kranen, hoe ver een kraan wordt opengedraaid, en hoe groot de capaciteit is. Vandaar dat begonnen is met een ruwe schatting van de capaciteit die vervolgens verder verfijnd is. Deze eerste grove inschatting van het verwachte watergebruik wordt in de Bayesiaanse statistiek een priori verdeling genoemd.

Tijdens de tweede stap zijn de watergebruiken voor de meetdag gecontroleerd op plausibiliteit, zoals eerder beschreven. De niet-plausibele watergebruiken zijn waar mogelijk handmatig verbeterd. Indien handmatige aanpassing niet mogelijk was, is modelmatig een plausibel watergebruik geschat met behulp van de beschikbare bronnen (zie paragraaf 3.2).

Tot slot worden de priori verdelingen samen met de duren en frequenties gebruikt om tot een schatting te komen van de capaciteit per component (de posterior verdelingen).

Bij de laatste stap worden alle componenten bij elkaar gevoegd om tot een geschat gemiddeld aantal liter per dag te komen.

3.4 Aandachtspunten

De bruikbare respons van dit onderzoek was 15,3% en is selectief. Dit betekent dat bepaalde groepen mensen minder goed vertegenwoordigd zijn in dit onderzoek. Dit verschil is zo goed mogelijk modelmatig gecorrigeerd voor de kenmerken die voor de hele populatie beschikbaar zijn. Dit neemt niet weg dat de resultaten enigszins af kunnen wijken van de werkelijkheid. Zo is het denkbaar dat mensen met meer affiniteit voor het onderwerp water eerder geneigd zijn om mee te doen met dit onderzoek.

Doordat het modelmatige schattingen zijn, kan het voorkomen dat er negatieve waarden zijn. In de praktijk is dit uiteraard niet mogelijk en deze waarden zijn in die gevallen op nul gezet.