5. Data
In dit hoofdstuk beschrijven we op hoofdlijnen de data die worden gebruikt om indicatoren te berekenen.
Data op macro- en mesoniveau
Voor het volgen van de hoofddoelen van het beleid worden primair bestaande data op macroniveau en mesoniveau gebruikt. Het macroniveau is dat van de hele industrie. Het mesoniveau betreft een uitsplitsing naar bedrijfstakken op sbi-2-niveau. De macro- en mesocijfers zijn consistent met de voornaamste statistische standaarden (zoals de Nationale Rekeningen en de IPCC), worden nauwgezet onderhouden en regelmatig gereviseerd, zijn internationaal vergelijkbaar en worden alom herkend.
De volgende indicatoren zijn opgenomen in de tabellenset van de Monitor Verduurzaming Industrie 2023 op macro- en mesoniveau:
- Toegevoegde waarde, aantal gewerkte uren en arbeidsproductiviteit
- Broeikasgasemissies (volgens IPCC-definities en Nationale Rekeningen) en emissie-intensiteit
- Energieverbruik en energie-intensiteit
- Aandeel hernieuwbare energie, fossiele brandstoffen en elektriciteit in finaal energieverbruik
- Aandeel energiekosten in productiekosten
- Aantal ingeleverde emissierechten
- Milieu-investeringen
- Bedrijfsafval, totaal en aandeel met een nuttige toepassing als bestemming
Data-infrastructuur voor microdata
Voor het monitoren van de activiteiten die bedrijven ondernemen om te verduurzamen zijn allerlei microdatabestanden nodig. Macro- en meso-cijfers geven geen inzicht in veranderingen binnen bedrijven (zoals de investeringen die bedrijven doen in nieuwe technologieën). Ook is het doorgaans niet mogelijk om cijfers uit te splitsen naar bedrijfsgrootte en regionaal cluster.
Het onderliggende principe is dat meerdere dimensies van veranderingen binnen bedrijven kunnen worden gemonitord door koppelingen te maken tussen microdatabestanden die ieder een ander deel van de bedrijfsactiviteiten meten.
Ieder microdatabestand geeft inzicht in een specifiek deel van de activiteiten. Bijvoorbeeld, de Productiestatistiek (PS) geeft cijfers over omzet en productiekosten, de Investeringsenquête geeft cijfers over investeringen naar type, en voor energieverbruik en CO2-emissies moest een maatwerktabel gemaakt worden.
Ieder microdatabestand vertegenwoordigt een bepaald deel van het totale bedrijvenbestand. Sommige variabelen zijn integraal beschikbaar (zoals omzet). De meeste bestanden zijn gevuld op basis van enquêtes onder een steekproef van bedrijven. In hoofdstuk 6 wordt ingegaan op de methodologische uitdagingen die dit met zich meebrengt.
Figuur 5.1 geeft een overzicht van de thema’s die relevant zijn voor de MVI. Voor alle groen gekleurde thema’s zijn microdatabestanden verzameld en aan het ABR gekoppeld. De databestanden van de energieverduurzamingsregelingen zijn door RVO aan het CBS geleverd en zijn aan het ABR gekoppeld. Dit betreft de SDE++, EIA, ISDE en MIA/VAMIL.
Figuur 5.1. Beschrijving van de data-infrastructuur
bron | periode (zonder breuk) | populatie en bijzonderheden | type data | kennisinstellingen | toegankelijkheid |
---|---|---|---|---|---|
ABR | 2006-2022 | Alle in Nederland geregistreerde bedrijven en instellingen (incl. zelfstandigen). | Integraal | Ja | Beschikbaar in RA |
BDK | 2007-2022 | Alle in Nederland geregistreerde bedrijven en instellingen (incl. zelfstandigen). | Integraal | Ja | Beschikbaar in RA |
DRT | 2014-2022 | Actieve bedrijfseenheden met als hoofdactiviteit groothandel en handelsbemiddeling, vervoer en opslag, horeca, informatie en communicatie, specialistische zakelijke diensten, overige zakelijke dienstverlening en overige diensten. | Analysebestand op basis van verschillende bronnen van omzetgegevens | Geen hoger onderwijs of UMC’s, wel overige kennisinstellingen | CBS-intern. Derden kunnen een verzoek voor maatwerk doen. |
IHG | 2009-2022 | Alle bedrijfseenheden die in een jaar actief zijn geweest en internationale handel in goederen hadden, alleen ‘marktgerichte eenheden’, bedrijven die aan het ABR gekoppeld kunnen worden. | Integraal | Nee | Beschikbaar in RA |
Investeringen | 1995-2022 | Alle bedrijven in SBI-range B tot en met J en L tot en met N. | Steekproef tot 20 wp, daarna integraal. Bedrijven buiten de steekproef zijn geïmputeerd. | Nee | Beschikbaar in RA |
Microdata CO2-emissies en energieverbruik | 2015-2022 | Bedrijven in industrie (SBI 10 t/m 33) en energie (SBI 35), waaronder alle ETS-bedrijven | Steekproef | Nee | Beschikbaar in RA |
MKB | 2012-2022 | Bedrijven in delfstoffenwinning (SBI 6 t/m 9), industrie (SBI 10 t/m 33) en energie (SBI 35) | Steekproef | Nee | Beschikbaar in RA |
Prodcom | 1993-2022 | Delfstoffenwinning en industrie | Steekproef | Nee | Beschikbaar in RA |
PS | 1993-2022 | Bedrijven in: landbouw, winning van delfstoffen, industrie, productie en distributie van energie en water, bouwnijverheid, reparatie van consumentenartikelen, groothandel en detailhandel, horeca, vervoer, opslag en communicatie, zakelijke en persoonlijke dienstverlening, milieudienstverlening en gezondheids- en welzijnszorg. | Steekproef | Nee | Beschikbaar in RA |
NEA | 2011-2021 | ETS installaties (gekoppeld aan het ABR) | Integraal | Nee | Beschikbaar in RA |
5.1 RVO-databases
RVO heeft ten behoeve van de ontwikkeling en productie van de MVI microdatabestanden geleverd voor de energieverduurzamingsregelingen. Dit betreft de EIA, SDE++, ISDE, MIA/VAMIL en VEKI. Het is de bedoeling dat op termijn ook microdata uit innovatieregelingen in de MVI-data-infrastructuur wordt ondergebracht (figuur 5.2).
Figuur 5.2. Regelingen per fase van innovatietraject
De afspraken over de levering van de RVO-databases is onderdeel gemaakt van de werkafspraken tussen CBS en RVO (“Procesdocument koppelingen beleidsinstrumenten B&I”, december 2019). Daarin is een structurele koppelsystematiek wordt beschreven waarmee de administratieve uitvoeringsgegevens van RVO jaarlijks worden gekoppeld aan de statistische data-infrastructuur van het CBS. Vanaf het begin is zorgvuldig afgestemd met RVO (bijvoorbeeld over het koppelen van bestanden en het classificeren van bedrijven en technologieën) en met werkzaamheden binnen het CBS die zich op hetzelfde terrein begeven. Zo zijn processen en statistieken op elkaar afgestemd en wordt dubbel werk zoveel mogelijk vermeden.
Binnen het CBS zijn de microbestanden op bedrijfsniveau aan elkaar te koppelen middels een bedrijfsidentificatienummer dat onderhouden wordt in het ABR. Het ABR houdt zich bezig met het vaststellen en registreren van de identificatie- en structuurgegevens van de bedrijven en instellingen in Nederland. Voor deze werkzaamheden gebruikt het ABR onder andere data van de Kamer van Koophandel (KVK). Op deze manier kan een koppeling worden gemaakt tussen de interne CBS-microdata en de externe bedrijfseenheden.
Om de koppeling tussen de CBS-microdata en de RVO-databases tot stand te brengen is zo een koppeling vereist. De RVO-databases zijn alle voorzien van een KVK-nummer. Dit KVK-nummer is opgegeven tijdens de aanvraag voor de desbetreffende RVO-regeling. Met behulp van het ABR kan in de meeste gevallen een koppeling met de CBS-microbestanden worden gemaakt.
Het koppelen van de bedrijfseenheden is echter geen sinecure. Eenvoudige bedrijfsstructuren zijn gemakkelijk aan de bedrijfsidentificatie te koppelen. Maar complexe bedrijfsstructuren maken het in sommige gevallen minder eenduidig welke bedrijfsidentificatie gekozen dient te worden.
Er is een beslisboom opgesteld om per jaar op een gestandaardiseerde manier tot de juiste koppeling te komen. Om zoveel mogelijk aan te sluiten bij reeds bestaande CBS-methodes voor het koppelen van bedrijven is er voor de MVI gekozen om gebruik te maken van de methode van het CBS Centrum voor Beleidsstatistiek. Zo worden alle RVO-regelingen die het CBS gebruikt volgens dezelfde systematiek gekoppeld.
De beslisboom bepaalt voor zowel de eenvoudige als voor de complexe bedrijfsstructuren welke koppeling het beste gebruikt kan worden. Zo worden bedrijven met een SBI in de onderstaande lijst uitgesloten indien meer dan één koppeling beschikbaar is:
- SBI '64' Financiële instellingen (geen verzekeringen en pensioenfondsen
- SBI '65' Verzekeringen en pensioenfondsen (geen verplichte sociale verzekeringen)
- SBI '68' Verhuur van en handel in onroerend goed
- SBI '69' Rechtskundige dienstverlening, accountancy, belastingadvisering en administratie
- SBI '70' Holdings (geen financiële), concerndiensten binnen eigen concern en managementadvisering
- SBI '82' Overige zakelijke dienstverlening
Indien na deze selectie nog altijd meerdere koppelingen beschikbaar zijn per uniek KVK-nummer, zal met behulp van de microbestanden een score per bedrijfsidentificatie worden berekend om zo tot de beste koppeling te komen. Aan ieder microbestand is een weging toegekend al naar gelang het belang van de microdata voor de MVI. Deze weging wordt toegekend indien het interne bedrijfsidentificatienummer beschikbaar is in het microbestand. Uiteindelijk worden de scores opgeteld en wordt de koppeling met de hoogste score gekozen.
De beslisboom is universeel te gebruiken voor iedere lijst met KVK-nummers. Nieuwe regelingen kunnen eenvoudig door de beslisboom worden gehaald. De beslisboom corrigeert automatisch voor ontbrekende voorloopnullen indien die aanwezig zijn in de lijst. Uitdagingen doen zich voornamelijk voor wanneer in de lijst foutieve KVK-nummers voorkomen. Wanneer een KVK-nummer niet voorkomt in het ABR kan dat bedrijf niet automatisch worden gekoppeld. In dit soort gevallen valt er nog een koppeling te maken op basis van postcode, huisnummer en plaats. Dit is echter handwerk en geen onderdeel van de beslisboom.