Page Title

Publicaties

Om de transparantie en informatieverstrekking te bevorderen, publiceert het FPB regelmatig de methoden en resultaten van zijn werkzaamheden. De publicaties verschijnen in verschillende reeksen, zoals de Vooruitzichten, de Working Papers en de Planning Papers. Sommige rapporten kunnen ook hier geraadpleegd worden, evenals de nieuwsbrieven van de Short Term Update die tot 2015 werden gepubliceerd. U kunt op thema, publicatietype, auteur en jaar zoeken.

Modelling unobserved heterogeneity in distribution - Finite mixtures of the Johnson family of distributions [Working Paper 14-17]

Deze paper introduceert een nieuw model om rekening te houden met niet-geobserveerde heterogeniteit in empirische modellen. Het model breidt het welbekende « latente klassen model » uit door gebruik te maken van de Johnson familie van verdelingen. Als gevolg van de grote variëteit aan vormen die deze verdelingen kunnen aannemen, legt ze niet de gebruikelijke a priori restricties op betreffende de aard van de gecombineerde verdelingen.

Met de toenemende beschikbaarheid van microdata voor empirisch onderzoek worden ‘finite mixture‘ modellen (FMM) een steeds populairder werktuig om niet-geobserveerde heterogeniteit tussen subjecten te modelleren. FMMs (die ook ‘latent class’ modellen worden genoemd, afgekort LCM) gaan uit van de veronderstelling dat de observaties in een steekproef afkomstig zijn uit een (onbekend) aantal heterogene subgroepen of klassen, en laten toe de parameters van deze subgroepen te schatten. Ze zijn in diverse domeinen van het economisch onderzoek gebruikt, onder meer voor de analyse van het gebruik en de uitgaven van medische zorg, het arbeidsaanbod, productiviteit, en marktsegmentatie. De modellen worden ook frequent toegepast in andere onderzoeksgebieden zoals biologie, psychologie, biostatistiek en zo verder. De niet-geobserveerde heterogeniteit die wordt gemodelleerd met FMMs heeft gewoonlijk betrekking op de verwachtingswaarde van de verdeling, hoewel soms ook de variantie wordt gemodelleerd (soms impliciet, zoals in het geval van de gamma-verdeling). De huidige praktijk in toegepast economisch onderzoek komt neer op het kiezen van een kansverdeling (normaal, lognormaal, gamma, Poisson, enz.) voor de componenten gebaseerd op a priori overwegingen betreffende het domein en de vorm van de populatieverdeling.

Een nadeel van deze benadering is dat ze a priori beperkingen oplegt over de aard van de niet-geobserveerde heterogeniteit, op tenminste twee manieren. Ten eerste is de keuze van de verdeling over het algemeen nogal arbitrair en wordt ze gewoonlijk niet getest tegen meer algemene (minder restrictieve) alternatieven. Ten tweede wordt, los van de vraag hoeveel latente klassen er in werkelijk bestaan, stelselmatig verondersteld dat de componenten dezelfde verdeling volgen. Met andere woorden, men veronderstelt dat de componenten enkel van elkaar verschillen wat de parameters van de verdeling betreft, maar niet in termen van de verdeling zelf.

Deze paper poogt deze problemen aan te pakken door sommige van de gebruikelijke veronderstellingen te versoepelen. Dit wordt bereikt uit te gaan van een flexibele vorm voor de component-verdelingen. Diverse zulke flexibele vormen zijn in het verleden bestudeerd, waaronder de zogenaamde Pearson en Johnson families van verdelingen. Deze families delen de eigenschap dat ze, afhankelijk van de waarden van hun parameters, heel diverse vormen kunnen aannemen. Bovendien zijn de verdelingen die courant worden gebruikt speciale gevallen van beide families. De paper beschrijft een algoritme waarmee de parameters van de Johnson familie van verdelingen kunnen worden geschat en levert een ‘proof of principle’ dat de methode werkt en een potentiële verbetering is ten opzichte van de huidige gangbare praktijk voor latente klassen-modellen.

De methode werd getest op gegevens gegenereerd met verschillende verdelingen die een groot bereik van scheefheid en kurtosis omvatten. De eerste resultaten zijn bemoedigend. De methode convergeert ongeveer even snel als de standaardmethoden met een mix van normale of gamma-verdelingen. Nog belangrijker, wanneer de data werden gegenereerd met verdelingen die ver afwijken van de standaardveronderstellingen (identieke componentverdelingen en ‘reguliere’ scheefheid en kurtosis), geeft de nieuwe methode in het algemeen betere resultaten (‘goodness-of-fit’) dan de standaardmodellen.

De methode werd nog niet getest in de context van een mix van regressiemodellen. Dit is de voor de hand liggende volgende stap om ze bruikbaar te maken als een praktisch onderzoeksinstrument.

  Verwante documenten

None

  PDF & Download

  Auteurs

Peter Willemé (A)
 
A : Auteur, C : Contribuant

Datum

31/08/2017

  Publicatietype

Planning & Working Papers

Please do not visit, its a trap for bots