Technische toelichting
Selecties
Alle paren die in het jaar 2000 gingen samenwonen, ongeacht of zij direct trouwden of niet, zijn geselecteerd (N = 214 840). Vervolgens zijn partners van hetzelfde geslacht uitgesloten (resterend N = 180 478), omdat de demografische dynamiek binnen deze groep een specifieke analyse verdient. Zo verschillen homoseksuele stellen van heteroseksuele stellen in de zin dat de overgang naar ouderschap gepaard kan gaan met de betrokkenheid van een andere persoon (als biologische ouder). Ten tweede zijn alleen degenen geselecteerd die qua leeftijd de grootste kans had om een eerste kind te krijgen. Personen waren minimaal 18 jaar en maximaal 40 (vrouwelijke partner) of 45 (mannelijke partner) jaar toen ze gingen samenwonen (resterende N = 146 179). Er zijn alleen stellen geselecteerd waarvan beide partners nooit eerder (gehuwd of ongehuwd) samenwoonden en kinderloos waren (resterend N = 63 324). Ten vierde zijn alle registerdata eenmalig op maandniveau teruggebracht voordat met de jaar-op-jaaranalyses kon worden begonnen.Hierdoor konden relaties die binnen dezelfde maand beginnen en eindigen worden uitgesloten van de analyses (N = 1 360). Nadat deze groep nader is bekeken, bleek dat de partners relatief jong waren, een relatief laag inkomen hadden en uit een onevenredig groot aantal studenten bestond (44 procent). Ten slotte zijn paren die meer dan een jaar vóór het begin van samenwonen al getrouwd waren, uitgesloten. (N = 2 693). Zo kon de start van de relatie binnen een vergelijkbare tijdspanne worden gehouden (resterende N = 59 257).Controlevariabelen
Inkomen
De informatie die is gebruikt om een indicator voor inkomen te construeren,houdt rekening met alle geregistreerde inkomstenbronnen van een bepaalde maand, zoals lonen en allerlei sociale uitkeringen. Er is gebruik gemaakt van het inkomen gemeten in september van elk jaar. Omdat het de netto som van alle verschillende bronnen is, kan deze ook negatief zijn (bijvoorbeeld in het geval van verliezen, gerelateerd aan het werken als zelfstandige). Het inkomen van de partners is bij elkaar opgeteld om het gezamenlijke maandinkomen te verkrijgen. Vanzelfsprekend leidt dit tot een onregelmatige verdeling van waarden met een groot aantal uitschieters. Daarom zijn inkomenskwintielen geconstrueerd (vijf groepen van gelijke grootte op basis van de geordende gegevens van het inkomen): het laagste kwintiel (1) geeft de 20 procent van de paren met het laagste netto-inkomen weer en het hoogste kwintiel (5) de 20 procent met het hoogste inkomen.Ook deze variabele is lagged: de waarde daarvan is gebaseerd op het inkomen dat in het voorgaande jaar is gemeten. Zowel de inkomensverdeling als de voortgang in de tijd verschilt sterk tussen de verschillende onderwijsgroepen. Daarom zijn de kwintielen voor elk observatiejaar en per opleidingsgroep apart geconstrueerd.Leeftijd
Van de vrouwelijke partner aan het begin van de samenwoonrelatie. Door de geboortedatum van de vrouwelijke partner en de datum van samenwonen te gebruiken, is de (tijdconstante) leeftijd bij het begin verkregen.
Leeftijdsverschil
Met behulp van de geboortedatum van de mannelijke en de vrouwelijke partner is een (tijdconstante) variabele geconstrueerd.
Student
Deze (tijdconstante) variabele geeft aan of ten minste één van de partners aan het begin van het samenwonen een student was.
Zie de bijlage (tabel B4) voor de beschrijving van de variabelen die zijn gebruikt in de uiteindelijke analyse, inclusief verschillende andere variabelen zoals het aandeel van de vrouw in het gezinsinkomen, etniciteit en de belangrijkste bronnen van inkomsten. De hieronder gerapporteerde resultaten voor wat betreft de onderwijsverschillen bleven bestaan wanneer voor deze variabelen werd gecontroleerd.
Methode
Er is gebruikt gemaakt van discrete-tijd-logistische-regressiemodellen (survivalanalyses; Blossfeld en Rohwer, 2002) om de kans te schatten dat samenwonende paren gaan trouwen, paren hun eerste kind krijgen en paren uit elkaar gaan. Er is gecontroleerd voor demografische (burgerlijke staat, wel/geen gezamenlijk(e) kind(eren)), sociaaleconomische (opleidingsniveau, inkomen) en overige achtergrondvariabelen (leeftijd bij begin relatie, leeftijdsverschil, wel/niet studerend). In aanvullende modellen is ook gecontroleerd voor verschillende andere factoren, zoals het aandeel van de vrouw in het gezinsinkomen, migratieachtergrond of meer gedetailleerde informatie over de belangrijkste bron van inkomsten. Dit heeft echter niet geleid tot een wezenlijke verandering van de resultaten wat betreft de onderwijsgradiënt.
Aangezien duureffecten werden verwacht, wat betekent dat de kans op een overgang in opeenvolgende jaren niet gelijk zal zijn, zijn zogenaamde piecewise-constant-hazard-modellen geschat en is gebruik gemaakt van tijdsintervallen van een jaar met 1 september als peildatum. Deze specifieke datum is gekozen omdat het de referentiedatum is van de inkomens- en andere sociaaleconomische variabelen. Zo loopt jaar 0 van 1 september 1999 tot 31 augustus 2000, jaar 1 van 1 september 2000 tot 31 augustus 2001, enz. De dataset heeft een persoon-periode structuur; elk record vertegenwoordigt een jaar van een intacte samenwoonrelatie (gehuwd of ongehuwd) meteen maximum van 15.
Zodra het paar samenwoont, is de kans geschat op een huwelijk (voor alleen ongehuwde stellen, analyse 1), een eerste kind (voor kinderloze stellen, analyse 2) en (echt)scheiding,analyse 3). Aan het einde van het jaar t van observatie wordt de waarneming gekoppeld aan de waarde (1) als de specifieke gebeurtenis plaatsvond en de waarde (0) indien niet.Als de gebeurtenis niet heeft plaatsgevonden, wordt het stel geobserveerd op jaar t + 1. Dit proces gaat door totdat huwelijk, eerste geboorte of relatieontbinding plaatsvindt,of tot het eind van het analysevenster (op 31 december 2014). Een zeer klein deel van de stellen wordt rechts gecensureerd. Dat betekent dat de observatie van de stellen die meededen in de analyses gecontinueerd wordt tot het moment dat ze emigreerden of één van de twee partners overleed.