7. Bijlagen

7.1 Bepaling van de Energetische Kwaliteit van een woning

7.1.1 Stap 1: model schatten

Er wordt een regressiemodel geschat met als afhankelijke variabele de berekende energierekening (zie 4.1.1) in het basisjaar, op basis van temperatuur gecorrigeerd energieverbruik in het peiljaar en de prijzen van 2019. Het resultaat van deze regressieanalyse is een formule waarmee voor elke woning een energiebedrag berekend kan worden op basis van bepaalde woningkenmerken.

De onafhankelijke variabelen in het model zijn in de eerste plaats woningkenmerken die sterk samenhangen met het energieverbruik²⁴⁾, met name: oppervlakte, bouwjaar, woningtype (vrijstaand, 2-onder-1 kap, hoekwoning tussenwoning, appartement), energielabel (A, B, C, D, E, F, G of onbekend), hoofdverwarmingsbron (cv, blokverwarming, warmtenet, elektriciteit) en de aanwezigheid van zonnepanelen.

Naast woningkenmerken zijn er ook nog enkele kenmerken van de bewoners meegenomen. Dat hebben we gedaan om beter de effecten van de bewoners en de woning te kunnen scheiden. Appartementen hebben bijvoorbeeld gemiddeld minder bewoners dan rijtjeshuizen, waardoor de gemiddelde energierekening lager is. Voor het bepalen van de kwaliteit willen we daarom een appartement met één bewoner vergelijken met een rijtjeswoning met één bewoner. Dit doen we door het effect van een extra bewoner expliciet mee te nemen in het model. Om dezelfde reden nemen we de volgende bewonerskenmerken mee: inkomen (besteedbaar huishoudinkomen in decielen), en aantal personen in het huishouden.

Omdat de verschillende woning- en bewonerskenmerken soms met elkaar samenhangen, bevat het regressiemodel ook combinaties van variabelen (i.e. interactietermen). Zie bijlage 7.2 voor een compleet overzicht van alle gebruikte variabelen en een volledige specificatie van het gebruikte model.

Bij het schatten van het model worden alleen woningen meegenomen die gedurende het hele peiljaar door hetzelfde huishouden bewoond zijn.

7.1.2 Stap 2: theoretisch energiebedrag berekenen

Nadat het model bepaald is, kan dit gebruiken worden om voor elke willekeurige woning op basis van de kenmerken in het model een energiebedrag te schatten. Deze schatting is gebaseerd op de gemiddelde energierekening van woningen met vergelijkbare kenmerken.
Voor het berekenen van de energetische kwaliteit maken we een schatting die gecorrigeerd is voor oppervlakte en de bewoners. Dat doen we door in de formule niet de echte oppervlakte en bewonerskenmerken mee te nemen, maar een standaardwaarde. Voor oppervlakte is dat 100 m², en voor de bewoners gaat het om twee personen met een inkomen in het 50e percentiel.

Om op deze manier een energiebedrag te kunnen schatten hebben we dus enkel informatie nodig over de woningkenmerken exclusief oppervlakte (dus: bouwjaar, woningtype, eigendom, energielabel (inclusief ‘onbekend’), verwarming en zon-pv). Hierdoor kunnen we voor alle woningen de kwaliteit schatten, ook voor onbewoonde woningen of woningen zonder bekende energierekening.

De uitkomst van bovengenoemde berekening is een genormaliseerde verwachte energierekening. Deze hangt enkel af van de eigenschappen van de woning, en is onafhankelijk van het aantal bewoners of de oppervlakte van een woning.

7.1.3 Stap 3: LEK afleiden

De laatste stap in de berekening bestaat uit het vertalen van de genormaliseerde verwachte energierekening naar een lage energetische kwaliteit (LEK), of zeer lage energetische kwaliteit (ZLEK). De drempelwaarden worden vastgesteld in verslagjaar 2019. De woningen met de 50% hoogste geschatte energiebedragen in 2019 is de LEK-grens, en de hoogste 15% is de ZLEK-grens.

7.1.4 Voordelen en beperkingen

De huidige methode heeft een aantal sterke kanten, en wel:

De uitkomst hangt niet af van toevallige schommelingen in het winterweer, omdat de berekening gebruik maakt van het energiebedrag op basis van een temperatuur gecorrigeerd gasverbruik.
De uitkomst hangt niet af van de energieprijzen, omdat in de berekening gebruik wordt gemaakt van de prijzen in 2019.
Veranderingen in de waargenomen kenmerken, met name energielabel, aanwezigheid van zonnepanelen, of het type verwarmingsinstallatie zijn in de uitkomsten terug te zien als kwaliteitsverbetering.Als het energieverbruik verandert zonder dat de waargenomen woningkenmerken veranderen, dan heeft dat geen effect op de (L)EK. Als grote groepen huishoudens meer energie verbruiken omdat ze bijvoorbeeld vaker thuis zijn of een grotere televisie hebben, of juist minder energie verbruiken doordat huishoudens massaal de thermostaat lager zetten vanwege het milieu of hoge energieprijzen, dan heeft dat geen effect op de (L)EK.

Er zitten echter ook enkele beperkingen aan de methode, namelijk:

De relatie tussen energieverbruik en woningkenmerken wordt in het basisjaar bepaald, en ligt daarna vast. Als deze relatie verandert, zie je dat niet terug in LEK. Als bijvoorbeeld huishoudens hun woning isoleren zonder een nieuw label aan te vragen (of zonder dat dit effect heeft op het label, bv. tochtstrips of radiatorfolie), zie je dat niet terug in LEK. De facto leiden we de LEK af van de woningkenmerken zoals die zijn geregistreerd op een bepaalde peildatum. Sommige registraties pikken veranderingen relatief snel op (zoals voor zonnestroominstallaties), terwijl van andere registraties bekend is dat deze vertraagd reageren (zoals energielabels). Dit heeft invloed op de snelheid waarmee veranderingen doorwerken in de LEK.
Structurele veranderingen in gedrag, waardoor het energieverbruik bij ‘normaal’ gebruik van een woning verandert zijn niet meegenomen. Bijvoorbeeld een hoger verbruik door meer thuiswerken, of een lager verbruik doordat huishoudens de thermostaat lager zetten of slaapkamers minder verwarmen zie je dat niet terug in LEK.
Er is nog geen rekening gehouden met enkele factoren die waarschijnlijk ook het energieverbruik beïnvloeden en waar inmiddels ook gegevens over zijn, zoals het totale vermogen aan zonnepanelen of het thuishopladen van elektrische auto’s. Dit volgt in een latere versie.

7.1.5 Basisverlegging

Omdat we verwachten dat het verband tussen het energieverbruik en waargenomen woningkenmerken in de loop der tijd verandert, en omdat het CBS steeds meer en betere data tot haar beschikking krijgt, is het belangrijk om het model met enige regelmaat opnieuw te schatten. Dit noemen we een basisverlegging. Voor de jaren 2019-2022 gebruiken we basisjaar 2019. We verwachten dat we voor het verslagjaar 2024 een nieuw basisjaar moeten bepalenomdat er structurele veranderingen in de beschikbare data en de energieprijzen (terugleverkosten) op komst zijn die invloed hebben op de relatie tussen de woningkenmerken, het energiegedrag en de energiekosten. Afhankelijk van de daadwerkelijke ontwikkelingen en de beschikbare data kan het nieuwe basisjaar ook iets eerder of later nodig zijn.

Bij een basisverlegging schatten we niet alleen het model opnieuw. Daarnaast nemen we de nieuwste varianten van de achtergrondvariabelen mee, eventuele relevante nieuwe variabelen (zoals het vermogen aan zonnepanelen of aanwezigheid van een elektrische auto). Tot slot toetsen we het model: zijn de gebruikte variabelen en interacties allemaal nog relevant? En zijn er misschien variabelen of interacties die eerder minder relevant leken, maar dat nu wel zijn?

Na een basisverlegging is het belangrijk om de reeksen op elkaar aan te laten sluiten. Daarom berekenen we de geschatte energiebedragen in een basisjaar op twee methoden, namelijk volgens het oude en het nieuwe basisjaar. Deze twee berekeningen gebruiken we om de grenzen voor (Z)LEK aan te passen op de nieuwe berekening.

7.2 Variabelen en modelspecificatie voor energetische kwaliteit

In sectie 4.1.4 is op hoofdlijnen uitgelegd hoe de energetische kwaliteit geschat wordt, middels een model dat de energierekening schat aan de hand van woningkenmerken. Deze bijlage bevat een volledige beschrijving van de gebruikte variabelen en de model specificatie.

7.2.1 Modelvariabelen

Het model om de energierekening te schatten bevat de volgende variabelen:

Energiebedrag2019_temp: het berekende energiebedrag uit gas en elektriciteitsverbruik met prijzen van het jaar 2019 op basis van temperatuur gecorrigeerd gasverbruik in het peiljaar.
Zonpv: 0/1 variabele die aangeeft of een woning zonpv heeft; uit energieverbruik huishoudens.
VBOWoningtype: vrijstaande woning, hoekwoning, twee-onder-een kapwoning, rijwoning, meergezinswoning, of onbekend.
Bouwjaar_cat: jaar waarin de woning eerst opgeleverd is (gebaseerd op VBOBOUWJAAR), ingedeeld in 9 categorieën, en wel: 1924 of eerder, 1925-1947, 1948-1963, 1964-1981, 1982-1995, 1996-2002, 2003-2015, 2016-2017, 2018 of later.
label_dik: energielabel, maar dan zijn alle varianten van A (A+, A++, etc) samengevoegd, plus extra categorie ‘onbekend’.
oppervlakte_lin: een bijna lineaire variabele voor het oppervlakte (gebaseerd op VBOOPPERVLAKTE). Deze is gelijk aan het daadwerkelijke oppervlakte voor woningen tussen de 14 en 302 is gelijk, onbekend wordt 98, oppervlaktes boven de 302 worden afgekapt op 302..
n_personen: het aantal personen in de woning, naar boven afgekapt op 5; gebaseerd op AantalPersonenPerVSLKlasse31Dec in WoonbasePopulatieWoonruimten.
oppervlakte_pwl: 12 variabelen die samen een piece wise lineair (pwl) specificatie geven van de oppervlakte. Dit betekent dat het verband tussen energierekening en oppervlakte gemodelleerd wordt door 12 schuine lijnstukken die op elkaar aansluiten.
Verwarming: categoriale variabele voor het type verwarming. Gebaseerd op ‘gastype_samengesteld’. Categorieën: individuele CV, blokverwarming, stadsverwarming, elektrisch of onbekend.
bestinkh_cat: ggestandaardiseerd besteedbaar huishoudinkomen (gebaseerd op BESTINKWONING uit WoonbaseKenmerkenWoonruimten) in 9 categorieën: 1 of onbekend, 2-4, 5-19, 20-53, 54-68, 69-89, 90-96, 97-99, 100.

NB: de categoriale variabelen worden bij de regressie omgezet naar een verzameling dummies. Zo wordt de variabele label_dik (met categorieën A, B, C, D, E, F, G, onbekend) omgezet naar 8 losse dummievariabelen label_A, Label_B, .. label_G, en label_onbekend.

7.2.2 Modelspecificatie

Voor dit onderzoek is een groot aantal modellen uitgetest, met steeds andere variabelen en interacties. Startpunt was hierbij het PBL/TNO model met volledige interactie van bouwjaarklasse, oppervlakteklasse, woningtype, energielabel en type eigenaar. Uiteindelijk is een model uitgekozen met een goede balans tussen een hoge voorspelkracht (R²) en een eenvoudig model dat goed kan generaliseren (laag risico op overspecificatie/overfitting).
Het uiteindelijke model is een lineaire functie van de modelvariabelen en bepaalde interacties tussen de modelvariabelen. Het model heeft de volgende vorm:
Energiebedrag2019_temp =
oppervlakte_pwl + bouwjaar_cat + label_dik + woningtype + bestinkh_cat + n_personen + verwarmingsbron + zonpv + oppervlakte_lin*zonpv + oppervlakte_lin*bestinkh_cat + oppervlakte_lin*verwarmingsbron + oppervlakte_lin*n_personen + oppervlakte_lin*label_dik2 + oppervlakte_lin*bouwjaar_cat2 + zonpv*woningtype + zonpv*verwarmingsbron + zonpv*n_personen + zonpv*label_dik2 + verwarmingsbron*n_personen + bouwjaar_cat2*label_dik.
Waarbij:

varA*varB staat voor een volledige interactie tussen twee variabelen;
label_dik2 staat voor een verder ingedikte variant van de energielabels, waarbij B en C zijn samengevoegd en ook E en F.
bouwjaar_cat2 staat voor een ingedikte variant van bouwjaar_cat, met categorieën: 1947 of eerder, 1948-1981, 1982-2002, 2003-2015, 2016-2017, 2018 of later.

²⁴⁾ Het CBS werkt aan een onderzoeksartikel waarin te zien is welke kenmerken zijn onderzocht, en hoe het huidige model is afgeleid.