2. Data en methode
2.1 Data
Het doel van het project was om meetgegevens over elektriciteitsproductie, -aanvoer en -aflevering per aansluiting op het openbaar net te koppelen aan locaties van glastuinbouwbedrijven in de Gecombineerde Opgave (GO) van de Rijksdienst voor Ondernemend Nederland (RVO). Op die manier kan de elektriciteitshuishouding van de glastuinbouw onderzocht worden in relatie tot diverse kenmerken zoals geteelde gewassen, bedrijfsomvang of regio. Hieronder worden de databronnen nader beschreven. De wijze van koppelen wordt toegelicht in 2.2.1.
2.1.1 Gecombineerde Opgave
De GO is enquête die door RVO jaarlijks wordt uitgezet onder alle agrarische bedrijven met een totale standaardopbrengst van 3 000 euro of meer op jaarbasis. In GO worden gegevens voor verschillende doeleinden uitgevraagd, waaronder de landbouwtelling, het CO2-sectorsysteem en diverse subsidieregelingen. Het formulier zoals ingevuld door de deelnemers is te vinden op de website van het CBS.
De algemene en teeltgerelateerde gegevens uit de GO die voor dit project het meest relevant zijn, zijn de volgende:
- Adres per vestigingslocatie van glastuinbouwbedrijven (kaslocatie)
- Arealen (m2) per gewas per kaslocatie (bij bollenbroei: kg of stuks)
- Totaal aantal m2 belichte teelt van gewassen op bedrijfsniveau (dus niet per kaslocatie), met onderscheid tussen groenten en bloemkwekerijgewassen
Daarnaast is van alle aangeschreven bedrijven, inclusief non-respondenten, de bedrijfsnaam en het aanschrijfadres bekend.
In de GO worden ook energiegegevens uitgevraagd, waaronder:
- Elektrisch vermogen aardgasgestookte WKK-installaties per kaslocatie
- EAN-code aardgasaansluiting per kaslocatie (inclusief eigen energie-BV), uitgezonderd bedrijven die onder het Europese emissiehandelsysteem (ETS) vallen
Tuinders brengen soms hun energieactiviteiten (zoals de productie en verkoop van elektriciteit en warmte) onder in een aparte BV die bij de Kamer van Koophandel wordt ingeschreven als energiebedrijf. In de GO wordt gevraagd om ook EAN-codes die op naam van de (eigen) energie-BV staan op te geven. Ook het CBS kent deze aansluitingen toe aan de glastuinbouw. EAN-codes van elektriciteitsaansluitingen worden niet uitgevraagd in de GO, omdat daarvoor geen juridische basis is.
Voor dit onderzoek is gebruikgemaakt van gegevens uit de GO 2022. De GO 2022 heeft de teelt in 2022 en het energieverbruik in 2021 geïnventariseerd. De peildata zijn dus verschillend voor verschillende onderdelen van de uitvraag. Voor de arealen per gewas en gegevens over belichting is de peildatum 15 mei 2022. Indien de grond op 15 mei nog niet beteeld is, dient de eerstvolgende teelt die voor eind augustus wordt ingezet opgegeven te worden. Voor het WKK-vermogen is de peildatum 31 december 2021. De EAN-codes van de aardgasaansluitingen hebben ook betrekking op 2021.
In de GO 2022 zijn voor het eerst gegevens per kaslocatie (waaronder arealen per gewas, EAN-codes aardgas, vermogen aardgas-WKK) uitgevraagd die voorheen enkel op bedrijfsniveau aangeleverd werden. Dat geldt ook voor latere jaren en de verwachting is dat het ook de komende jaren zo zal zijn.
2.1.2 Netbeheerdersdata
Het CBS ontvangt van de netbeheerders meetdata per kalenderjaar over de aanvoer (levering) en aflevering (teruglevering) van elektriciteit en aardgas voor elke aansluiting op het openbaar net in Nederland. Aan iedere aansluiting is een unieke EAN-code toegekend. Bij bijna elke aansluiting is ook het adres en de naam van de gebruiker bekend. Voor alle terugleverende netaansluitingen (en vanaf april 2022 ook voor de niet-terugleverende aansluitingen) ontvangt het CBS ook gegevens op maandbasis over de levering en teruglevering, de pieklevering en piekteruglevering en de bruto productie van elektriciteit. In navolging van het eerdere project over aardgas (CBS, 2023) is ervoor gekozen om in eerste instantie gebruik te maken van de netbeheerdersdata over 2021, omdat de in de GO 2022 opgegeven EAN-codes voor aardgas betrekking hebben op 2021.
In tegenstelling tot gegevens over levering, teruglevering en piek(terug)levering, zijn de gegevens over bruto productie niet voor alle terugleverende aansluitingen en alle maanden bekend. Voor 2021 was de bruto productie in ongeveer 40 procent van de gevallen gevuld. Voor een klein deel (ongeveer 1 procent) was de bruto productie wel opgegeven, maar was de waarde hoger dan de teruglevering en dus niet plausibel. Die datapunten zijn verwijderd. De ontbrekende data over bruto productie worden door CBS bijgeschat, de methode daarvoor staat beschreven in 2.2.2 en de impact van de bijschatting wordt nader besproken in 3.2.2.
2.1.3 Energieclusters
Op enkele plekken in Nederland maken tuinders gebruik van private elektriciteitsnetten. In die gevallen is bij CBS enkel de aanvoer en aflevering op de hoofdaansluiting en de totale bruto productie bekend. Er is geen zicht op de uitwisseling van elektriciteit binnen het net. Er is één cluster bekend waar naast glastuinders ook andere bedrijven zoals datacenters op zijn aangesloten. Voor dit cluster heeft CBS naast de aanvoer en aflevering op de hoofdaansluiting en de bruto productie van elektriciteit per bron (WKK-installaties, zon, wind) ook gegevens over het totaal finaal elektriciteitsverbruik van de glastuinders in het cluster. Ook deze gegevens zijn echter alleen bekend op geaggregeerd niveau, en niet per individuele locatie. In 3.2.5 gaan we dieper in op welke impact clusters op de datakwaliteit hebben.
2.1.4 Populatieafbakening
Kaslocaties
De populatie van kaslocaties is gebaseerd op de opgave in de GO. De populatie bestaat uit alle kaslocaties die volgens de respons op de GO in 2022 in gebruik waren. Bedrijven die zijn aangeschreven voor de GO responderen niet altijd. Als er geen respons is, zijn er ook geen kaslocaties bekend. Deze bedrijven tellen dus niet mee in de populatie van kaslocaties. In de landbouwtelling wordt voor het areaal van non-respondenten een bijschatting gedaan op basis van opgaven van een of twee jaar eerder. In 2021 kwam die bijschatting uit op 250 ha, dat is 2,4 procent van het totaal areaal glastuinbouw. In dit rapport doen we geen bijschatting voor het areaal.
Elektriciteitsaansluitingen
In de brondata van de netbeheerders zit geen informatie over de (economische) activiteit die plaatsvindt achter de aansluiting. Om aan elke aansluiting een sector toe te kennen, maakt het CBS gebruik van een combinatie van bronnen. In deze standaard sectortypering wordt de landbouw als geheel als aparte sector onderscheiden, maar wordt vooralsnog geen onderscheid gemaakt worden tussen subsectoren binnen de landbouw. Omdat er enige onzekerheid zit in de sectortypering, hebben we ervoor gekozen om de input voor het koppelproces binnen dit project niet te beperken tot aansluitingen die getypeerd zijn als landbouw. We nemen alle aansluitingen mee, behalve die die zijn toegekend aan woningen of waarvan we weten dat ze aan een windmolen toebehoren.
Voor de terugleverende aansluitingen is ook een classificatie gemaakt naar de bron van de teruglevering: aardgas-WKK, zon, wind, bio-WKK. Daarvoor is gekeken of er op die aansluiting productie van (gecertificeerde) hernieuwbare elektriciteit bekend is in de registers van VertiCer. Soms kan er sprake zijn van een combinatie van verschillende bronnen van elektriciteitsproductie achter een aansluiting. Dat kan zorgen voor enige onzekerheid en komt nader aan bod in 3.2.
De uiteindelijk populatie van aansluitingen die worden toegewezen aan de glastuinbouw bestaat drie groepen: 1) aansluitingen die gekoppeld konden worden aan een kaslocatie uit de GO (zie 2.2.1), 2) terugleverende aansluitingen die eerder getypeerd zijn als glastuinbouw met aardgas-WKK, maar niet gekoppeld konden worden aan een kaslocatie uit de GO en 3) aansluitingen die gekoppeld zijn aan de naam en het GO-aanschrijfadres van non-respondenten in de glastuinbouw (zie 2.2.1). In 3.1 gaan we dieper in op het onderscheid tussen gekoppelde en ongekoppelde aansluitingen.
2.2 Methode
2.2.1 Koppelstrategie
Bij het identificeren van elektriciteitsaansluitingen die toebehoren aan glastuinders en het koppelen van deze aansluitingen op vestigingsniveau zijn verschillende koppelstappen doorlopen. Tabel 2.1 geeft een overzicht van de koppelstappen en de onderlinge hiërarchie, te beginnen met de meest betrouwbare koppelmethode. Elke elektriciteitsaansluiting wordt bij voorkeur via de meest betrouwbare koppelmethode gekoppeld aan een kaslocatie. Daarom worden reeds gekoppelde aansluitingen bij volgende koppelstappen niet meer meegenomen.
Koppelvariabele | Naammatch vereist? | Welke kaslocaties? | Welke aansluitingen? | |
---|---|---|---|---|
1 | Handmatig | Nee | - | - |
2a | Adres kas | Ja | Alle kaslocaties | Alle ongekoppelde aansluitingen |
2b | Adres gasaansluiting | Ja | Alle kaslocaties | Alle ongekoppelde aansluitingen |
3 | Ruimtelijk (< 500m) | Ja | Alle kaslocaties | Alle ongekoppelde aansluitingen |
4a | Adres kas | Nee | Alle kaslocaties | Ongekoppelde aansluitingen eerder getypeerd als WKK-glastuinbouw |
4b | Adres gasaansluiting | Nee | Alle kaslocaties | Ongekoppelde aansluitingen eerder getypeerd als WKK-glastuinbouw |
5a | Adres kas | Nee | Ongekoppelde kaslocaties | Alle ongekoppelde aansluitingen |
5a | Adres gasaansluiting | Nee | Ongekoppelde kaslocaties | Alle ongekoppelde aansluitingen |
6 | Aanschrijfadres | Ja | Geen, enkel non-respondenten | Alle ongekoppelde aansluitingen |
Handmatig koppelen staat bovenaan in de hiërarchie, hoewel het uitgangspunt is om het aantal handmatige koppelingen zoveel mogelijk te beperken, omdat handmatig koppelen een arbeidsintensief proces is. Als blijkt dat een bepaalde (grote) aansluiting niet of niet goed gekoppeld wordt volgens het geautomatiseerde proces dan wordt er een handmatige correctie uitgevoerd die de geautomatiseerde koppeling overschrijft. In die zin staat handmatig koppelen dus bovenaan in de hiërarchie, ondanks dat het niet de voorkeursmethode is.
Hieronder volgt als eerste een toelichting van punten die voor meerdere koppelstappen van toepassing zijn. Daarna wordt elke koppelstap individueel toegelicht.
Koppelen op adres
Adressen met toevoegingen kennen verschillende schrijfwijzen. Om te kunnen koppelen op adres, worden de adressen daarom ten eerste gestandaardiseerd. Dat wil zeggen dat veelvoorkomende toevoegingen zoveel mogelijk uniform gemaakt worden. Bijvoorbeeld: “-II” wordt “-2”; “-a”, “a” en “-A” worden “A” etc.
Bij het koppelen op adres (in stappen 2, 4, 5 en 6) worden verschillende substappen doorlopen. Als eerste kijken we naar het volledige adres, dat wil zeggen: postcode, huisnummer, huisletter en eventuele toevoegingen. Vervolgens wordt de toevoeging weggelaten en als laatste wordt ook de huisletter weggelaten. Zo kunnen ook koppelingen tot stand komen als de adressen niet exact overeenkomen, bijvoorbeeld als een kas geregistreerd is op huisnummer 4-A en de bijbehorende elektriciteitsaansluiting op huisnummer 4.
Koppelen op naam
Bij elke elektriciteitsaansluiting staat in de netbeheerdersdata de naam van de gebruiker van die aansluiting. Om de koppelkwaliteit te verhogen, wordt bij het koppelen op naam (in stappen 2, 3 en 6) die naam vergeleken met 1) de in de GO bekende bedrijfsnaam en 2) de naam die volgens de netbeheerdersdata hoort bij de in het eerdere project (CBS, 2023) aan de kaslocatie gekoppelde aardgasaansluiting. Voorwaarde bij 2) is dat de aardgaskoppeling is gelegd op basis van de meest betrouwbare koppelmethoden (EAN-code opgegeven in GO of handmatig gekoppeld). Als de koppeling tussen kaslocatie en aardgasaansluiting op minder zekere gronden tot stand gekomen is, wordt de koppeling voor dit doeleinde niet overgenomen. De reden om de naam van de aardgasaansluiting mee te nemen bij het koppelen van elektriciteitsaansluitingen is dat glastuinbouwbedrijven hun energieactiviteiten soms onderbrengen in een energie-BV met een andere naam dan de landbouw-BV. Ook om andere redenen kan de naam bij de elektriciteitsaansluiting enigszins afwijken van de in de GO bekende bedrijfsnaam.
Om te bepalen of de naam van de elektriciteitsaansluiting voldoende vergelijkbaar is met 1) of 2) wordt een score berekend. Als deze score boven de grenswaarde uitkomt, komt de koppeling tot stand. De namen hoeven dus niet volledig identiek te zijn. Hiervoor maken we gebruik van het python package fuzzywuzzy, waarbij gekozen is voor de maat ‘token set ratio’ en een grenswaarde van 65. Deze grens is bepaald door voor een steekproef van potentiële koppelingen de scores te berekenen en handmatig de optimale grenswaarde te bepalen.
Stap 1: handmatige koppelingen
Bovenaan in de hiërarchie staan handmatige koppelingen. Handmatige koppelingen worden bijvoorbeeld toegepast bij clusters waarbij er meerdere bedrijven achter een aansluiting zitten, maar kunnen ook gebruikt worden om geautomatiseerde koppelingen te corrigeren.
Stap 2: koppelen op adres in combinatie met naam
De eerste geautomatiseerde koppelstap bestaat uit het koppelen op adres in combinatie met naam. Per kaslocatie wordt gekeken of er op het adres van de kas een elektriciteitsaansluiting geregistreerd staat, waarbij ook de naam overeen moet komen. Bij het koppelen op adres worden de bovengenoemde stappen doorlopen. Na het koppelen op kasadres wordt er ook nog gekoppeld op basis van het adres van de bijbehorende aardgasaansluiting. Ook hier wordt weer gekeken naar de naam.
Binnen deze koppelstap zijn dus in totaal zes substappen te onderscheiden:
a. Adres kas:
i. Postcode + huisnummer + huisletter + toevoeging
ii. Postcode + huisnummer + huisletter
iii. Postcode + huisnummer
b. Adres gasaansluiting:
i. Postcode + huisnummer + huisletter + toevoeging
ii. Postcode + huisnummer + huisletter
iii. Postcode + huisnummer
Bij elke volgende stap worden enkel de elektriciteitsaansluitingen meegenomen die nog niet eerder gekoppeld zijn aan een kaslocatie. Het uitgangspunt is dat, afgezien van de bekende clusters, er nooit meerdere vestigingslocaties of bedrijven achter een aansluiting zitten. Andersom kan een vestiging wel over meerdere elektriciteitsaansluitingen beschikken.
Stap 3: ruimtelijk koppelen
Het kan voorkomen dat de elektriciteitsaansluiting van een kas zich op een ander huisnummer of zelfs in een andere straat bevindt dan het opgegeven kasadres, bijvoorbeeld als de aansluiting zich aan de ‘achterzijde’ van het perceel bevindt. Daarom wordt er in stap 3 ruimtelijk gekoppeld. De kasadressen uit de GO worden vertaald naar x/y-coördinaten. Vervolgens wordt er binnen een straal van 500 meter gezocht naar elektriciteitsaansluitingen waarvoor er een naammatch is zoals hierboven beschreven. Indien er meerdere koppelingen hebben plaatsgevonden met dezelfde elektriciteitsaansluiting nemen we alleen de koppeling mee met de kortste afstand tussen kas en aansluiting.
Stap 4: WKK-aansluitingen koppelen op adres, zonder naammatch
De (terugleverende) aansluitingen die eerder geclassificeerd zijn als ‘WKK-glastuinbouw’, maar nog niet in een van de voorgaande stappen aan een kaslocatie uit de GO gekoppeld zijn, worden in stap 4 op basis van adres gekoppeld. In tegenstelling tot de voorgaande stappen hoeft de naam niet overeen te komen. Wel moeten minimaal de postcode en het huisnummer overeen komen.
Stap 5: koppelen op adres, zonder naammatch
Stap 5 is uitsluitend van toepassing op kaslocaties uit de GO waaraan in de voorgaande stappen nog geen enkele elektriciteitsaansluiting gekoppeld is. In deze gevallen wordt er op adres gekoppeld zonder dat er naar de naam gekeken wordt.
Stap 6: non-respondenten koppelen op aanschrijfadres
Als laatste stap wordt voor bedrijven die de GO niet hebben ingevuld gekeken of er zich op het aanschrijfadres een elektriciteitsaansluiting bevindt die qua naam overeenkomt met de bedrijfsnaam van de non-respondent. Als dat zo is, wordt deze aansluiting geïdentificeerd als glastuinbouw. Omdat van non-respondenten geen kasgegevens bekend zijn in de GO, kan de aansluiting niet aan een kaslocatie gekoppeld worden. Er is hier dus geen sprake van koppeling op kasniveau.
2.2.2 Energiestromen en vermogens
De netbeheerdersdata bevatten meetgegevens over de (piek)levering , (piek)teruglevering en bruto productie van elektriciteit per netaansluiting. De (piek)levering en (piek)teruglevering (indien van toepassing) zijn altijd gevuld, de bruto productie in ongeveer 40 procent van de gevallen. Hieronder wordt beschreven hoe de energiestromen en het opgesteld WKK-vermogen afgeleid en geschat worden.
WKK-vermogen
Het WKK-vermogen wordt door de netbeheerders niet direct waargenomen. Wel is op maandbasis de piekteruglevering per aansluiting bekend. Deze blijkt voor de meeste aansluitingen behoorlijk constant te zijn van maand tot maand. Het CBS gebruikt de piekteruglevering om een inschatting te maken van het opgesteld elektrisch vermogen van de WKK-installaties. Tot op heden werd hierbij aangenomen dat het vermogen 105 procent van de piekteruglevering bedraagt. Daarbij gaan we uit van de maximale piekteruglevering over een jaar. In de GO geven de tuinders zelf ook het elektrisch vermogen van WKK-installaties per kaslocatie op. Omdat we in dit onderzoek de koppeling hebben gelegd tussen netbeheerdersdata en de GO, konden we de aanname dat het vermogen 105 procent van de piekteruglevering bedraagt toetsen. Uit een vergelijking tussen het opgegeven vermogen en de piekteruglevering (zie 3.1.3 voor details) hebben we geconcludeerd dat 102 procent een betere aanname zou zijn. Daarom berekenen we in dit onderzoek het opgesteld elektrisch vermogen van WKK-installaties als 102 procent van de maximale piekteruglevering.
Uit analyse is gebleken dat in de GO enkele extreme uitbijters voorkomen voor wat betreft het opgegeven WKK-vermogen. Deze uitbijters vertekenen het totaalbeeld. Bovendien lijkt het te gaan om foutieve opgaven. Daarom is ervoor gekozen om opgaven van 20 MWe of meer op één kaslocatie buiten beschouwing te laten. Zowel in absolute zin als in termen van W/m2 zijn deze opgaven niet plausibel. In totaal gaat het om 17 kaslocaties die gezamenlijk een vermogen van 860 MWe hebben opgegeven. Extreem lage WKK-vermogens in de GO zijn niet verwijderd, hoewel ook die niet plausibel zijn.
Bruto elektriciteitsproductie
Zoals eerder benoemd is voor 2021 de bruto productie in ongeveer 40 procent van de gevallen bekend. Als de bruto elektriciteitsproductie ontbreekt of niet plausibel is, wordt er een schatting gedaan met behulp van de piekteruglevering. De relatie tussen piekteruglevering en bruto productie wordt gemodelleerd als een lineaire functie, waarvan de parameters bepaald worden op basis van de gegevens die wel zijn waargenomen. Op basis van de gemodelleerde relatie wordt vervolgens de bruto productie geschat die hoort bij de gemeten piekteruglevering. De parameters worden op maandbasis en per vermogensklasse (0-2 MW, 2-5 MW en > 5 MW) geschat, zodat de dynamiek van het WKK-gebruik (denk aan weerseffecten of schommelingen in energieprijzen) meegenomen wordt in de schatting. De methode van schatten is ontwikkeld in samenspraak met de afdeling methodologie van het CBS en staat bekend als de ratioschatter. In 3.2.2 gaan we dieper in op de effecten van deze schattingsmethode.
Schatting verbruik en elektriciteitsbalans
Het finaal elektriciteitsverbruik wordt berekend als:
finaal verbruik = bruto productie WKK - eigen verbruik WKK + aanvoer - aflevering
De aanvoer en aflevering zijn gemeten, de bruto productie is deels gemeten en deels bijgeschat en het eigen verbruik van de (aardgas-)WKK wordt geschat op 2 procent van de bruto elektriciteitsproductie.
De productie van hernieuwbare elektriciteit wordt in deze berekening nog niet meegenomen, hoewel dit wel meeloopt in de gemeten aflevering. Op totaalniveau is de impact hiervan waarschijnlijk nog relatief beperkt, maar bij uitsplitsingen kan het effect groter zijn (zie ook 3.2). De productie van hernieuwbare elektriciteit kan wel in kaart gebracht worden op microniveau, door koppeling met aanvullende bronnen zoals registerdata van VertiCer (gecertificeerde hernieuwbare elektriciteit). Dat valt echter buiten de scope van het huidige onderzoek.
2.2.3 Bepaling hoofdgewas per kaslocatie
Om inzicht te krijgen in de kwaliteit van koppeling uitgesplitst naar gewassen is per kaslocatie het hoofdgewas bepaald. We onderscheiden 27 verschillende gewassen, zie Bijlage 1. De omvang van de teelt per kaslocatie wordt in de GO opgegeven in m2, behalve bij bollenbroei, waar de hoeveelheden worden opgegeven in aantallen of kg.
Voor gewassen die in m2 worden opgegeven geldt dat als één gewas meer dan 60 procent van het areaal beslaat, dat gewas benoemd wordt tot hoofdgewas voor de kaslocatie. Als er geen gewas boven de 60 procent uitkomt, kijken we ook naar de hoofdcategorie van de gewassen (groenten, fruit, boomkwekerij, bloemkwekerij). Als de gewassen allemaal tot dezelfde hoofdcategorie behoren, classificeren we de kaslocatie als ‘gemengd hoofdcategorie’ (bijvoorbeeld ‘gemengd groenten’). Als alle gewassen onder de 60 procent zitten en niet tot dezelfde hoofdcategorie behoren dan wordt de kaslocatie geclassificeerd als ‘niet ingedeeld’.
Bij bollenbroei worden in de GO de hoeveelheden opgegeven in aantallen of kg en niet in m2. Als op een locatie alleen bollenbroei plaatsvindt wordt de kas ingedeeld in de categorie ‘bollenbroei’. Als er ook arealen in m2 zijn opgegeven, kan er geen hoofdgewas bepaald worden volgens deze methode, omdat de eenheden (m2 en kg of aantallen) niet onderling vergelijkbaar zijn. Dit komt in de praktijk weinig voor.
Aan 121 kaslocaties kon geen hoofdgewas worden toegekend. Dit zijn 2,7 procent van het totaal aantal kassen. 59 van die 121 kassen zijn niet ingedeeld omdat ze op een kaslocatie zowel bollen als andere gewassen telen waardoor er geen hoofdgewas bepaald kon worden. De andere kassen zijn niet ingedeeld, omdat er meerdere gewassen van verschillende hoofdcategorieën geteeld worden, waarbij geen van de gewassen meer dan 60 procent beslaat.
In een aantal van de analyses in dit rapport wordt het gekoppelde areaal met het ongekoppelde areaal vergeleken, waarbij het areaal wordt uitgedrukt in m2 of ha. In die analyses tellen kassen van bollenbroeiers niet mee, omdat die niet in m2 (kunnen) worden uitgedrukt. In totaal gaat het om 8,5 procent van het totaal aantal kaslocaties, maar in areaal is dat vermoedelijk veel minder, omdat de bollenbroei in relatief kleine kassen plaats vindt.