Inkomensontwikkeling van startende zelfstandigen

Technische toelichting

Competing risk duuranalyse met discrete duurvariabelen

Voor het schatten van de kans op een transitie naar een voldoende zelfstandigeninkomen, de uitstroom naar werk in loondienst, of de uitstroom naar geen werk in de jaren na de start van de zelfstandigenbaan wordt gebruikgemaakt van een logistische regressiebenadering met drie kanscategorieën. Deze transities, die in paragraaf 2.2. uitvoeriger worden beschreven, worden hier aangeduid met de indices A, B en C.

Opzet van de schattingsmethode

De kans dat persoon i een transitie (A) in jaar k na het startjaar doormaakt, gegeven dat er nog geen enkele transitie voorafgaand aan jaar k heeft plaatsgevonden, is hierbij als volgt (Jenkins, 2005):

\( h_{A,i}(k) = \frac{ \exp{(\boldsymbol{\beta}'_A \cdot \boldsymbol{X}_{k,i})} }{ 1 \, + \, \exp{(\boldsymbol{\beta}'_A \cdot \boldsymbol{X}_{k,i})} \, + \, \exp{(\boldsymbol{\beta}'_B \cdot \boldsymbol{X}_{k,i})} \, + \, \exp{(\boldsymbol{\beta}'_C \cdot \boldsymbol{X}_{k,i})}} \)

Voor de transities B en C gelden vergelijkbare uitdrukkingen. Hierbij is \( \exp{(\boldsymbol{\beta}'_A \cdot \boldsymbol{X}_{k,i})} \) de ratio van de kans op een transitie A ten opzichte van de kans op geen transitie.  De vector \(\boldsymbol{X}_{k,i}\) bevat de score op de verklarende kenmerken van persoon i in jaar k na de start als zelfstandige. Hiertoe behoort ook een dummy variabele die het jaar na het startjaar aanduidt; alle andere verklarende kenmerken zijn in deze studie tijdsonafhankelijk. De vector \(\boldsymbol{\beta}'_A\) is de met \(\boldsymbol{X}_{k,i}\) corresponderende vector met de vaste effecten.

De likelihood bijdrage van persoon i bestaat uit j periodes (= het aantal periodes tot een transitie of tot de maximale waarneemperiode bij geen transitie) en heeft de volgende structuur:

\(\mathcal{L}_i = h^{\delta_A}_{A,i}(j) \cdot h^{\delta_B}_{B,i}(j) \cdot h^{\delta_C}_{C,i}(j) \cdot \left( 1 - \textstyle\sum_{l=A,B,C}h_{l,i}(j)\right)^{1-\delta_A-\delta_B-\delta_C} \times \textstyle\prod^{j-1}_{k=1}\left(1-\sum_{l=A,B,C}h_{l,i}(k)\right)
\)

Hiermee heeft de likelihood dezelfde vorm als die van een standaard multinomiale logistische regressie, toegepast op een dataset waarbij de records worden gevormd door unieke persoon-jaar combinaties. De opbouw van het analysebestand voor de duuranalyses moet zodoende passen bij de likelihood van de transitiekansen. In (Jenkins, 2005) worden de stappen gegeven die voor de uitvoering van de duuranalyses op basis van dit model nodig zijn:

  1. Breng het bestand in persoon-jaar vorm.
  2. Maak een afhankelijke variabele aan voor ieder persoon-jaar record. Deze krijgt de waarde 0 voor geen transitie, 1 voor de transitie naar een voldoende inkomen, 2 voor de transitie naar werk in loondienst en 3 voor de transitie naar geen werk. Het aantal jaarrecords van een persoon wordt bepaald door het jaar waarin de eerste transitie plaats vindt (records van latere jaren worden hierbij weggelaten). Als er geen enkele transitie bij een persoon plaatsvindt is het aantal records gelijk aan de lengte van de waarneemperiode (hier: vijf jaar).
  3. Construeer de verklarende variabelen (al dan niet tijdsafhankelijk), inclusief de dummyvariabelen die de duur van de periode na de start weergeven.
  4. Schat het model met een multinomiaal logistische regressie programma. In deze studie wordt gebruik gemaakt van R en meer in het bijzonder van het nnet-package.

Log-odds en de interpretatie van parameters
De odds bestaat uit de kansverhouding: de kans op een transitie (A, B, of C) gedeeld door de kans op geen transitie. In formulevorm (voor transitie A):

\(\frac{h_{A,i}(j)}{\left(1-\sum_{l=A,B,C}h_{l,i}(j)\right)} = \exp{(\boldsymbol{\beta}'_A \cdot \boldsymbol{X}_{j,i})}\)

De natuurlijke logaritme van deze kansverhouding (log-odds) is dan gelijk aan \(  
\boldsymbol{\beta}'_A \cdot \boldsymbol{X}_{j,i}
\).

Een voorbeeld van een log-odds parameterwaarde is te zien in tabel 3.3.1. De parameterwaarde van  -0.99 bij het tweede jaar na de start van de onderneming (categorie: Duur: 2 jaar) in de kolom ‘bereikt brutominimumloon’ vertegenwoordigt de bijdrage van deze categorie aan de log-odds. Oftewel, in het tweede jaar na de start als zelfstandige is de kansverhouding van een transitie naar voldoende inkomen ten opzichte van geen transitie nog ongeveer 100 x  exp(-0,99) = 37 procent van dezelfde kansverhouding in het eerste (referentie)jaar.