Bijlage A Gebruik van ODiN-data
In deze bijlage worden een aantal zaken toegelicht die van belang zijn bij het gebruik van het ODiN-databestand en de interpretatie van de kerntabellen in bijlage D en op StatLine.
A.1 Definitie ODiN
ODiN omvat de dagelijkse mobiliteit van de Nederlandse bevolking van 6 jaar of ouder, exclusief personen in instellingen, inrichtingen en tehuizen, op Nederlands grondgebied in een jaar4).
“De dagelijkse mobiliteit…”
De dagelijkse mobiliteit is de reguliere mobiliteit inclusief vakantiemobiliteit en exclusief (werkgerelateerde) serieverplaatsingen, exclusief mobiliteit met zware vrachtvoertuigen en exclusief mobiliteit met vliegtuigen.
“van de Nederlandse bevolking van 6 jaar of ouder, exclusief personen in instellingen, inrichtingen en tehuizen…”
De doelpopulatie van het ODiN bestaat uit alle in Nederland woonachtige personen van 6 jaar en ouder die deel uitmaken van particuliere huishoudens en ingeschreven zijn bij de Basisregistratie Persoonsgegevens. Bewoners van instellingen, inrichtingen en tehuizen (IIT) worden buiten beschouwing gelaten, omdat zij in hun verplaatsingsgedrag beperkt zijn of beperkt worden.
“in Nederland…”
Met het ODiN worden alleen de verplaatsingen op Nederlands grondgebied onderzocht. Verplaatsingen die geheel in het buitenland plaatsvinden, zijn niet in het databestand opgenomen. Grensoverschrijdende verplaatsingen zijn wel in het databestand opgenomen. Voor de ritten van deze verplaatsingen zijn de ritafstand en de ritreisduur deels toegekend aan Nederland en deels aan het buitenland. In publicaties over de resultaten van het ODiN wordt dit buitenlandse deel buiten beschouwing gelaten5).
“in een jaar.”
Een ODiN-jaar is gelijk aan een kalenderjaar.
A.2 Betrouwbaarheidsmarges
ODiN is een steekproefonderzoek. Dat wil zeggen dat slechts een gedeelte van de totale doelpopulatie wordt onderzocht. Uitspraken op populatieniveau gaan daardoor gepaard met een bepaalde onzekerheid. Met behulp van betrouwbaarheidsmarges kan deze onzekerheid worden uitgedrukt. De betrouwbaarheidsmarges zijn afhankelijk van de omvang van de steekproef. In het algemeen geldt: hoe groter de omvang van de steekproef, hoe groter de betrouwbaarheid en dus hoe kleiner de betrouwbaarheidsmarges.
Bij het uitvoeren van analyses met het databestand van ODiN kan blijken dat de resultaten onvoldoende betrouwbaar zijn voor publicatie. Dit is voornamelijk het geval als er op een laag aggregatieniveau wordt geanalyseerd. Het aantal waarnemingen is dan te klein. Een voorbeeld hiervan is een analyse naar bromfietsgebruik op gemeenteniveau. Ook bij situaties die in de praktijk zelden voorkomen, zoals een analyse naar de afgelegde afstand van personen van 75 jaar en ouder op een motorfiets, is de betrouwbaarheid meestal onvoldoende. Bij dergelijke analyses is het aantal waarnemingen vaak zo klein dat de betrouwbaarheid onacceptabel laag wordt. De vuistregels die doorgaans worden toegepast zijn: 1) het aantal ongewogen, unieke respondenten waarop een cijfer is gebaseerd bedraagt minimaal 50. 2) de relatieve marge op een schatting is kleiner is dan 50%. Voor sommige analyses is het mogelijk het aantal waarnemingen te vergroten door meerdere ODiN-jaren samen te nemen. Een nadeel van het stapelen van jaren is echter dat recente ontwikkelingen minder duidelijk naar voren komen, omdat de uitkomsten gesmooth worden door de stapeling.
A.3 Ondervertegenwoordiging en vertekening van bepaalde gegevens
A.3.1 Vrachtautoverplaatsingen
Een speciale vorm van beroepsmatige verplaatsingen zijn de (serie)verplaatsingen per vrachtauto. Deze hebben in het ODiN voor de variabele Verpl de waarde 7 of 8. De beroepsmatige verplaatsingen per vrachtauto zijn in het algemeen ondervertegenwoordigd en worden daarom ook niet meegenomen in de berekeningen van de resultaten die het CBS publiceert. Vrachtautoverplaatsingen voor privédoeleinden (als ze al voor komen) zijn als reguliere verplaatsingen in het databestand opgenomen.
A.3.2 Toeren/wandelen
Verplaatsingen met als doel toeren of wandelen zijn in ODiN, net als bij OViN, als gehele verplaatsing in het bestand opgenomen. In de periode van het OVG en MON van 1999 t/m 2009 werden deze verplaatsingen gesplitst in twee verplaatsingen (een heen- en een terugreis).
A.4 Gebruik weegfactoren
Het databestand bevat de gemeten verplaatsingsgegevens (steekproefdata) en drie weegfactoren: één voor personen (FactorP), één voor verplaatsingen (factorV) en één voor huishoudens (FactorH). Door gebruik te maken van deze weegfactoren kunnen de steekproefdata representatief worden gemaakt voor de totale populatie.
De ophoogfactoren worden door middel van het proces van weging berekend. Daarbij wordt gewogen naar (veelal combinaties van) verschillende kenmerken, zoals leeftijdsklasse en provincie. In het bestand zijn veel van deze kenmerken ook als variabele vertegenwoordigd en soms ook op een gedetailleerder niveau, zoals leeftijd en gemeente. Omdat voor het bepalen van de ophoogfactoren voor sommige kenmerken klassen (bijvoorbeeld leeftijdsklasse) zijn gebruikt, zal toepassing van de ophoogfactoren op gedetailleerdere kenmerken (in dit geval leeftijd), kunnen leiden tot vertekening. Een gedetailleerde schatting met de data in het ODiN-bestand is dan mogelijk geen goede afspiegeling van de populatie op dat detailniveau.
A.5 Gebruik cijfers voertuigbezit
In het bestand is informatie aanwezig over voertuigbezit. Hierdoor kan met het bestand een totaal aantal voertuigen in Nederland worden berekend. Dit geschatte totaal op basis van ODiN-gegevens wijkt mogelijk af van totalen die men op StatLine vindt over het voertuigenpark op basis van registers. Dit komt omdat de informatie in het ODiN-bestand een combinatie is van register- en responsinformatie en omdat er andere definities gehanteerd worden. Tevens zijn in het weegmodel niet alle detailkenmerken met betrekking tot voertuigbezit opgenomen. ODiN-schattingen van opgehoogde aantallen vervoermiddelen worden berekend met de ophoogfactoren die volgen uit het weegmodel waardoor ook afwijkingen ten opzichte van StatLine-informatie over het voertuigpark kunnen ontstaan.
A.6 Gebruik OV-cijfers
Reizigerskilometers met de trein en met de bus, tram en metro op basis van ODiN hebben grote betrouwbaarheidsmarges. Het totaal aantal reizigerskilometers met bus, tram en metro is mogelijk betrouwbaarder af te leiden uit de jaarverslagen van de openbaar vervoerbedrijven. Ook voor het totaal aantal reizigerskilometers met de trein zijn de jaarverslagen van de spoorwegbedrijven de meest geschikte bron. De cijfers van ODiN over het openbaar vervoer zijn wel geschikt voor (trendmatige) analyses van de modal split6).
A.7 Gebruik geografische variabelen
In het databestand ODiN zijn op persoonsniveau een aantal geografische variabelen opgenomen, zoals gemeente, provincie en Corop-gebied. Het gaat hier om geografische indelingen die het gebied aanduiden waar de respondent woont. Daarmee is dus de mobiliteit van de bewoners van zo’n gebied te berekenen. Deze variabelen kunnen echter niet zomaar gebruikt worden om de totale mobiliteit in een bepaald gebied te berekenen. Verplaatsingen vinden tenslotte niet alleen binnen het (woon)gebied plaats. Er dient dus rekening te worden gehouden met reizigers die het gebied verlaten en reizigers die het gebied binnenkomen. Dit kan door gebruik te maken van vertrek- en aankomstpostcodes en geografische variabelen op verplaatsingsniveau en door aannames te doen voor routeberekening.
A.8 Verschillen tussen jaren
Gezien het karakter van het onderzoek (steekproefonderzoek) gaf vergelijking van mobiliteitsgegevens van jaar tot jaar al gedurende de OVG en MON jaren een beperkt inzicht in de ontwikkeling van de mobiliteit. Voor ODiN is het vergelijken van cijfers met eerdere OViN, MON en OVG jaren niet mogelijk aangezien de methodebreuk niet gekwantificeerd is. Datzelfde geldt voor de vergelijking van OViN met MON en OVG. Met voortgezet onderzoek naar trendmodellering is in 2020 voor het eerst een trend geschat voor de reeks OVG 1999 t/m 2003 – MON 2004 t/m 2009 – OViN 2010 t/m 2017 en ODiN vanaf 2018. Deze reeks is op StatLine gepubliceerd (onder het thema 'verkeer en vervoer / mobiliteit van personen') en wordt vooralsnog jaarlijks geüpdatet na het beschikbaar komen van een nieuwe jaargang van ODiN.
A.9 Per persoon per dag (p.p.p.d.)
De mobiliteitscijfers over het aantal verplaatsingen en de afgelegde afstand worden vaak uitgedrukt in gemiddelden per persoon per dag (p.p.p.d.). De betekenis van het begrip p.p.p.d. kan het best uitgelegd worden aan de hand van een voorbeeld. We nemen daarvoor het gemiddeld aantal afgelegde kilometers per persoon per dag voor het motief 'Van en naar het werk'. Dit is niet hetzelfde als de gemiddelde afstand die men aflegt van de vertreklocatie naar het werk en van het werk naar de aankomstlocatie, want de totale afgelegde afstand voor het motief ‘Van en naar het werk’ is niet gedeeld door het aantal werkenden, maar door de totale doelpopulatie van ODiN (inwoners van Nederland van 6 jaar of ouder in particuliere huishoudens) en geldt dus bijvoorbeeld ook voor een 6-jarige die uiteraard niet werkt. Dezelfde parallel is te trekken voor alle andere cijfers uit het ODiN waar p.p.p.d. achter staat: bij p.p.p.d. is gedeeld door de totale doelpopulatie in plaats van door de voor dat cijfer ‘relevante’ populatie. De achterliggende gedachte hiervan is dat, conform de realiteit, alle ontwikkelingen binnen de gehele doelpopulatie het totale verplaatsingsgedrag beïnvloeden. Dus is niet alleen de ‘relevante’ populatie van belang bij het bepalen van het mobiliteitscijfer, maar de totale doelpopulatie. Daarnaast is het door het gebruik van het gemiddelde p.p.p.d. mogelijk om eenvoudiger te berekeningen of mobiliteit toe of afneemt als enkel de bevolking (in een gebied) toe of afneemt.
5) Het buitenlandse ritdeel is onder aparte variabelen opgenomen in het databestand, dus deze worden niet automatisch meegenomen in de analyses die men uitvoert.
6) Modal split is de verdeling tussen de verschillende vervoerwijzen.