Inzicht in consumptie bij supermarkten, project VIPS
Hergebruik aanwezige databronnen: scannerdata
Scannerdata van supermarkten wordt al jaren binnen het CBS verwerkt voor de prijswaarneming van producten voor de consumentprijsindex (CPI). Het merendeel van de supermarkten levert voor de CPI scannerdata aan: dit bevat meer dan 90 procent van de totale supermarktomzet. De scannerdata bevat alle kassaregistraties en is daarmee een rijke bron van informatie omdat het omzetten, verkoopaantallen, productinformatie en productclassificaties bevat. Naast de mogelijkheid die het biedt om prijzen af te leiden, is de scannerdata in dit onderzoek dus als bron ingezet voor het maken van omzetstatistieken.Methode in een notendop
De scannerdata bevat per product (‘streepjescode’) per week de verkoopgegevens. Als eerste worden verkoopgegevens van de producten verdeeld over de 62 productgroepen van voedings- en genotmiddelen die de CPI hanteert, de COICOP. Door per productgroep de omzetten van alle individuele producten bij elkaar op te tellen kan een weekomzet per productgroep worden berekend. Deze weekomzetten worden vervolgens opgeteld tot maandomzetten, waarbij voor weken die niet volledig binnen een maand vallen gebruik wordt gemaakt van wegingsfactoren per dag. Vervolgens worden op deze maandomzetten twee correcties uitgevoerd. Eerst wordt er gecorrigeerd voor de omzet van ontbrekende supermarkten, een ‘marktaandeelcorrectie’. Deze correctie is nodig om de tijdreeks robuust te maken voor de veranderende samenstelling van supermarkten die scannerdata aanleveren. De tweede correctie heeft betrekking op de prijsontwikkeling, waardoor verkoopvolumes kunnen worden afgeleid. Door te corrigeren voor prijseffecten kan beter inzicht gekregen worden in de daadwerkelijke consumptie.Resultaten: verkopen hamsterpiek maart 2020
De uitkomsten laten goed zien welke voedings- en genotmiddelen voornamelijk in trek waren in de maand waarin volop werd ‘gehamsterd’ naar aanleiding van de eerste lockdown (maart 2020): dit waren veelal de rijst-, pasta- en graanproducten, langer houdbare groenten (zowel conserven als diepvries) en oliën.Voor bijna alle productcategorieën steeg de omzet in maart. Ook de tweede lockdown, in oktober 2020, is zichtbaar in de stijgende verkopen van de supermarkten. Naast de lockdowns zijn ook verkooppieken zichtbaar rond de feestdagen in december.
Jaar | Maand | Diepvries groenten behalve aardappelen en andere knollen (2018=100) | Gedroogde groenten, andere bereidingen en conserven van groenten (2018=100) | Olijfolie (2018=100) | Overige eetbare olie (2018=100) | Overige graanproducten (2018=100) | Pastaproducten en couscous (2018=100) | Rijst (2018=100) |
---|---|---|---|---|---|---|---|---|
2019 | januari | 109,39 | 114,57 | 103,45 | 97,70 | 98,40 | 104,36 | 107,35 |
2019 | februari | 102,78 | 95,49 | 91,90 | 90,48 | 104,04 | 94,69 | 96,14 |
2019 | maart | 108,16 | 108,50 | 98,94 | 97,54 | 100,58 | 107,42 | 109,53 |
2019 | april | 97,36 | 99,70 | 105,22 | 95,09 | 106,38 | 100,55 | 100,99 |
2019 | mei | 105,33 | 107,84 | 111,23 | 96,44 | 107,27 | 108,73 | 111,21 |
2019 | juni | 86,97 | 99,48 | 97,27 | 88,44 | 84,06 | 94,34 | 102,17 |
2019 | juli | 86,69 | 97,85 | 99,75 | 85,78 | 81,54 | 96,69 | 100,02 |
2019 | augustus | 95,00 | 102,58 | 98,54 | 90,56 | 90,88 | 97,37 | 109,90 |
2019 | september | 92,94 | 101,96 | 95,45 | 96,75 | 101,70 | 107,57 | 104,14 |
2019 | oktober | 102,95 | 113,29 | 99,13 | 102,63 | 126,64 | 105,66 | 116,91 |
2019 | november | 100,70 | 115,47 | 111,87 | 103,72 | 130,50 | 107,93 | 114,50 |
2019 | december | 93,52 | 104,07 | 113,19 | 144,15 | 156,57 | 91,15 | 94,98 |
2020 | januari | 114,06 | 127,56 | 108,15 | 111,60 | 109,72 | 116,75 | 121,91 |
2020 | februari | 105,43 | 117,80 | 100,65 | 105,91 | 124,46 | 100,80 | 122,96 |
2020 | maart | 160,27 | 173,91 | 148,75 | 143,47 | 178,89 | 160,44 | 181,21 |
2020 | april | 106,99 | 111,71 | 126,33 | 123,08 | 168,92 | 94,31 | 107,93 |
2020 | mei | 101,86 | 118,11 | 130,30 | 122,37 | 144,58 | 105,08 | 112,68 |
2020 | juni | 98,93 | 114,22 | 117,25 | 117,34 | 108,03 | 100,89 | 109,40 |
2020 | juli | 92,81 | 113,20 | 119,51 | 108,10 | 111,10 | 110,49 | 113,22 |
2020 | augustus | 83,58 | 109,05 | 108,02 | 102,28 | 94,86 | 104,25 | 108,67 |
2020 | september | 94,30 | 117,19 | 117,13 | 110,40 | 122,72 | 109,43 | 112,76 |
2020 | oktober | 114,80 | 136,25 | 120,49 | 125,28 | 172,39 | 126,73 | 126,56 |
2020 | november | 93,29 | 116,98 | 116,31 | 114,07 | 134,38 | 106,85 | 115,19 |
2020 | december | 90,87 | 118,20 | 134,81 | 166,09 | 189,86 | 106,45 | 103,18 |
Resultaten: ‘ongezonde voeding’, alcohol en tabak
De cijfers geven ook een beeld van de verkoop van ‘ongezonde voeding’ over de hele periode (2018-2021). Zo was het volume van chips marginaal hoger (2 procent), werd er ruim 7 procent meer snoepgoed verkocht en bijna 12 procent meer frisdrank. De verkoop van alcoholhoudende dranken steeg ook: de verkoop van pils en wijn nam met zo’n 10 procent toe, terwijl de verkoop van speciaalbieren en van gedistilleerde dranken en likeur met respectievelijk 30 en 40 procent toenam. Ook werd er meer tabak verkocht: ruim 10 procent meer sigaretten en bijna 30 procent meer sigaren. De verkoop van shag nam echter wel af.Product | Percentage (% verandering t.o.v. 2018) |
---|---|
Gedistilleerde dranken en likeuren | 37,1 |
Overig alcoholhoudend bier | 31,0 |
Sigaren | 28,4 |
Pils | 12,0 |
Frisdranken | 11,9 |
Sigaretten | 11,6 |
Wijn van druiven | 9,6 |
Snoepgoed | 7,4 |
Chips | 1,9 |
Shag en andere tabaksproducten | -2,9 |
Discussie en vervolgonderzoek
VIPS laat zien dat met de grote hoeveelheid scannerdata waarover het CBS beschikt het mogelijk is om tijdreeksen te maken voor ruim zestig productgroepen. De tijdreeksen geven de effecten van hamsteren, de feestdagen, seizoenen en aanbiedingen op de verkoopcijfers duidelijk weer. Omdat het CBS over een substantieel aandeel van supermarktdata in Nederland beschikt, kunnen de uitkomsten consumptiegedrag van Nederlanders bij de supermarkten weergeven. Ook zouden effecten van beleid, zoals bijvoorbeeld accijnsverhogingen op tabak, inzichtelijk gemaakt kunnen worden. De methode achter VIPS is echter nog volop in ontwikkeling en daarom zullen de resultaten in eerste instantie alleen worden gepubliceerd op de innovatiepagina van het CBS.Verbeterpunten
Vanuit het project is al een aantal verbeterpunten genoteerd die in vervolgonderzoek mogelijk verder worden opgepakt. In de huidige methode is ervoor gekozen om volumes op indirecte wijze af te leiden, namelijk door middel van correctie voor prijseffecten. Voor deze berekening worden prijsontwikkelingen van de CPI gebruikt en die beschrijven de gemiddelde prijsontwikkeling binnen een productgroep. Door met de CPI te corrigeren drukt het volumecijfer niet alleen uit hoeveel er verkocht is, maar kan het ook een substitutie-effect bevatten. In sommige perioden, bijvoorbeeld rond de feestdagen wanneer het consumptiepatroon typisch verandert, kan het substitutie-effect zwaarder doorwegen dan in andere perioden: er worden in deze periode doorgaans luxere artikelen gekocht. In vervolgonderzoek zal bekeken worden of de verkoopaantallen in de scannerdata direct gebruikt kunnen worden voor het berekenen van verkoopvolumes.
De marktaandeelcorrectie zorgt ervoor dat de omzetreeksen een stuk robuuster zijn: de waargenomen omzet wordt namelijk opgehoogd naar de ‘totale markt’. De onderliggende aanname is echter wel dat de omzet van het ontbrekende deel van de supermarkten eenzelfde verdeling kent als het deel dat waargenomen wordt. Het lijkt aannemelijk dat het deel van de supermarkten dat nu niet via scannerdata wordt waargenomen een andere omzetverdeling kent. Echter, de omzetdekking van de supermarkten die scannerdata aanleveren is zo hoog dat het effect op de omzetcijfers uiteindelijk beperkt is.
Verder betreft dit een ‘big data’-aanpak en zijn classificatiefouten niet uit te sluiten. Dat wil zeggen, het is onmogelijk om alle verkoopgegevens te controleren op fouten. Iedere berichtgever levert data aan volgens een eigen datamodel en classificatie die door het CBS worden gestandaardiseerd. In de vertaling van de productindelingen die de supermarkten hanteren naar de CBS classificaties kan het voorkomen dat een product in een verkeerde productgroep terechtkomt. Hiervoor is een methode uitgewerkt om ervoor te zorgen dat één product altijd maar in één productgroep geplaatst kan worden. De kans op classificatiefouten is geminimaliseerd doordat productgroepen zijn nagelopen op ‘bloopers’: de verkeerd geclassificeerde producten met een hoge omzet. Het aantal bloopers was overigens beperkt.
Tot slot zal in vervolgonderzoek ook een ‘koopdagcorrectie’ worden meegenomen, waarbij de omzetcijfers gecorrigeerd worden voor de samenstelling van dagen in een maand. Deze correctie is nu nog niet toegepast, waardoor de omzetcijfers van maart bijna zonder uitzondering hoger zijn dan in februari. Dit heeft te maken met het feit dat maart 31 dagen telt en februari 3 van de 4 jaar 28 dagen. Grofweg zorgt dit voor een omzetverschil van ruim 10 procent (31/28). Door te corrigeren voor de samenstelling van koopdagen zouden de omzetontwikkelingen wat vloeiender zijn en beter het consumptieniveau in de betreffende maand reflecteren.
Geef uw mening
We zouden graag uw mening willen over deze cijfers. Dat kan een algemene indruk zijn, maar ook meer specifieke punten die u goed of niet goed vindt. We horen het graag als u suggesties heeft, u kunt dit doen door onderstaand reactieformulier in te vullen.