Zonnepanelen automatisch detecteren met luchtfoto’s
Zonnestroom is een belangrijke hernieuwbare energiebron. In dit artikel wordt het onderzoek toegelicht dat het CBS uitvoert om de aantallen en de locaties van zonnepanelen met behulp van deep learning methoden nauwkeuriger in kaart te brengen.
Ontwikkelingen
De CBS statistiek over zonnestroom is het afgelopen jaar op een aantal punten verbeterd. Het CBS heeft hierover gepubliceerd in een uitgebreid artikel. Tot voor kort was de CBS statistiek over zonnestroom gebaseerd op een enquête onder ongeveer 300 leveranciers en importeurs van zonnepanelen. Inmiddels is er overgestapt op een werkwijze waarbij het geïnstalleerd vermogen wordt afgeleid uit registers, waaronder het Productie Installatie Register (PIR) en data van CertiQ. Het resultaat van de nieuwe methode is dat cijfers op een lager detailniveau kunnen worden gerapporteerd.
Het aanmelden van zonnepanelen is in de praktijk niet verplicht in Nederland. Het PIR dat het CBS hanteert is dan ook niet volledig dekkend, zie bijvoorbeeld de recente publicatie hierover door Netbeheerder Stedin. Met een nieuwe studie wil het CBS in Europees verband onderzoeken of de aantallen en locaties van zonnepanelen nauwkeuriger kunnen worden vastgesteld door aanvullend gebruik te maken van analyse van luchtfoto’s.
Deep Solaris
In het onderzoeksproject “Deep Solaris” werkt het CBS samen met de Open Universiteit en de statistische bureaus van Vlaanderen en Duitsland om een zo compleet en gedetailleerd mogelijk beeld te krijgen van geïnstalleerde zonnepanelen. Onderdeel van dit project is het opleveren van een interactieve kaart met de locaties van zonnepanelen in Vlaanderen, Noordrijn-Westfalen en Limburg. Deze locaties worden automatisch bepaald op basis van luchtfoto’s. Van deze locaties kunnen regionale statistieken met aantallen zonnepanelen worden gemaakt.
In dit artikel wordt toegelicht welke experimenten er zijn uitgevoerd met het toepassen van verschillende modellen op luchtfoto’s van onder meer de staat Californië (VS), de deelstaat Noordrijn-Westfalen (Duitsland) en de provincie Limburg (Nederland). Het resultaat van deze experimenten is dat er twee modellen als beste naar voren zijn gekomen. Deze modellen zullen in het vervolg van het project gebruikt worden om de eerste interactieve kaart op te leveren, waarbij ook luchtfoto’s van Vlaanderen zullen worden gebruikt.
Project aanpak
In dit onderzoeksproject zijn diverse machine learning technieken onderzocht, zoals random forest (RF), support vector machine (SVM) en convolutional deep neural networks (CNN). Het doel van deze technieken is om geautomatiseerd afbeeldingen te kunnen classificeren, zie figuur 1.
In dit artikel worden de resultaten toegelicht van de toepassing van vijf CNN-modellen: VGG16, InceptionV3, InceptionResNetV2, DenseNet en Xception. Deze modellen zijn publiekelijk beschikbaar in de Keras bibliotheek. De modellen zijn getraind op luchtfoto’s van verschillende stedelijke landschappen, waarbij onder meer bestaande registers worden gebruikt om de ontwikkelde algoritmen te trainen en valideren.
Als startpunt voor de modellen zijn gewichten gebruikt van de ImageNet Large Scale Visual Recognition Competition (ILSVRC). In deze competitie worden verschillende algoritmen getest op hoe goed ze presteren in de detectie van objecten en het classificeren van verschillende afbeeldingen. Detectie van zonnepanelen is overigens geen onderdeel van deze competitie.
Project aanpak
Met eerder genoemde selectie van CNN-modellen zijn 3 experimenten uitgevoerd, waarbij de modellen op verschillende eigenschappen worden beoordeeld:
- Accuracy: Hoeveel procent van de daken wordt op de juiste manier (positief of negatief) herkend;
- Precision: Hoeveel procent van de herkende zonnepanelen is daadwerkelijk een zonnepaneel;
- Recall: Hoeveel procent van de daadwerkelijke zonnepanelen als zodanig wordt herkend;
- F1-score: Getal tussen 0 en 1, gebaseerd op de precision én recall. 1 betekent een perfecte precision en recall.
Experiment 1 – Transfer learning
Onderzoeksdoel
Onderzoeken in hoeverre modellen die reeds getraind zijn voor andere toepassingen, ook gebruikt kunnen worden voor de detectie van zonnepanelen.
Gebruikte modellen
InceptionV3, InceptionResNetV2, DenseNet en Xception in verschillende varianten: zonder, met gedeeltelijke en met volledige ‘transfer learning’. De modellen zijn getraind en getest op een dataset van Noord-Rijn Westfalen.
Resultaten
Het Xception model met volledige ‘transfer learning’ leverde de beste resultaten (hoogste f1-score)op, zie figuur 3. De accuracy is weergegeven voor het verkregen resultaat bij toepassing op zowel de training-set als de test-set.
Transfer learning approach | Test accuracy | Training accuracy | F1score |
---|---|---|---|
No transfer learning | 0,8 | 0,79 | 0,83 |
Full transfer learning | 0,82 | 0,81 | 0,84 |
Partial transfer learning | 0,81 | 0,81 | 0,82 |
Experiment 2 – Generalization
Onderzoeksdoel
Onderzoeken hoe goed reeds getrainde modellen presteren bij toepassing op luchtfoto’s van andere gebieden
Gebruikte modellen
Xception uit experiment 1 (full transfer learning), getraind en gebruikt op luchtfoto’s van Noord-Rijn Westfalen en Californië.
Resultaten
Het Xception model uit experiment 1 is getraind op foto’s van Noord-Rijn Westfalen. De resultaten bij toepassing op een dataset van Californië zijn – zonder aanvullende training – duidelijk slechter. Door het model volledig opnieuw te trainen worden de resultaten al iets beter, maar verrassend genoeg wordt het beste resultaat verkregen als het model slechts gedeeltelijk (enkele lagen) opnieuw wordt getraind. Hetzelfde geldt voor de toepassing bij NRW. Bij een gedeeltelijke en met name bij een volledige hertraining gaat het model slechter presteren, waarschijnlijk doordat er ‘overfitting’ optreeft. De accuracy is weergegeven voor het verkregen resultaat bij toepassing op zowel de training-set als de test-set.
Training approach | Test accuracy | Training accuracy | F1score |
---|---|---|---|
No retraining | 0,82 | 0,81 | 0,84 |
Full retraining | 0,65 | 0,66 | 0,74 |
Partial retraining | 0,78 | 0,77 | 0,81 |
Test accuracy | Training accuracy | F1score | |
---|---|---|---|
No retraining | 0,72 | 0,73 | 0,73 |
Full retraining | 0,72 | 0,73 | 0,78 |
Partial retraining | 0,81 | 0,81 | 0,83 |
Experiment 3 – Generalization en cross-validation
Onderzoeksdoel
Onderzoeken of het eindresultaat beter wordt als er twee modellen worden toegepast en de resultaten van de modellen onderling worden vergeleken.
Gebruikte modellen
Xception uit experiment 1 (full transfer learning) evenals VGG16 (gedeeltelijk ‘transfer learning’). De modellen zijn getraind op Bradbury (Californië) en toegepast op Aachen (Noord-Rijn Westfalen), Fresno (Californië) en Limburg.
Resultaten
Het Xception model heeft een betere precision, recall en f-score dan het VGG16 model. Het VGG16 model generaliseert daarentegen beter dan Xception omdat het laatste model de data lijkt te ‘overfitten’. Bij het toepassen van Xception op de dataset van Aachen gaat de nauwkeurigheid en precisie hard achteruit.
Bradbury | Fresno | Aachen | |
---|---|---|---|
Xception | 0,98 | 0,98 | 0,53 |
VGG16 | 0,93 | 0,94 | 0,82 |
Voorlopige conclusie
De resultaten van de experimenten tonen aan dat de gebruikte modellen succesvol kunnen worden toegepast om zonnepanelen uit luchtfoto’s te classificeren. De best presterende modellen, Xception en VGG16, behalen training- en test accuracy van meer dan 90%.
Vervolgstappen
De eerste interactieve map wordt in februari 2019 verwacht. Daarnaast wordt er gewerkt aan een wetenschappelijke peer-reviewed paper die eind Q1 2019 zal worden ingediend. Een van de vervolgstappen in het onderzoek is te onderzoeken in hoeverre satelliet data toepasbaar is voor de detectie van (grootschalige) zonne-installaties.
Privacy maatregelen
Het CBS publiceert gegevens altijd zodanig dat daaraan geen herkenbare gegevens over een afzonderlijk persoon, huishouden, onderneming of instelling kunnen worden ontleend. Hoewel in dit project openbare gegevens (luchtfoto’s, satellietbeelden) als basis voor de analyse worden gebruikt, zullen de interactieve kaarten enkel op geaggregeerd niveau aantallen zonnepanelen laten zien.
Erkenning
Dit onderzoek wordt uitgevoerd onder de ESS actie 'Merging Geostatistics and Geospatial Information in Member States' (grant agreement no.: 08143.2017.001-2017.408) en een CBS investering voor de ontwikkeling van een Deep Learning algoritme.
Voor meer informatie over de inspanningen die CBS verricht om haar zonnestroom statistiek te verbeteren, zie de publicatie ‘Slim zonnestroom in kaart brengen’.