Dette notat undersøger, om valget mellem simultan og sekventiel modellering påvirker prædiktionsnøjagtigheden ved estimation af overgangssandsynligheder for boligvalg. Konkret sammenlignes modeller for valg af boligtype og boliganvendelse estimeret enten som en simultan fordeling eller vha. sekventielle modeller, der modellerer boligtype og dernæst boliganvendelse betinget på boligtype (eller omvendt). Alle modeller estimeres med LightGBM på individdata fra Danmarks Statistik, og sammenligningen baseres på out-of-sample log-loss samt visuelle vurderinger af marginale fordelinger fra modellen og simultane fordelinger fra simulationer.
Resultaterne viser, at prædiktionsnøjagtigheden er stort set identisk på tværs af modeller med log-loss i intervallet 1,77–1,78 og uden systematiske forskelle i de estimerede eller simulerede fordelinger. Til gengæld er der betydelige forskelle i beregningstid: den simultane model er væsentligt mere tidskrævende både i træning og prædiktion end de sekventielle modeller. Således tager det den simultane model 4-5 gange længere tid at prædiktere boligtype og boligvalg, end hvis de blev prædikteret fra en sekventiel model. Samlet set findes der derfor ingen empirisk evidens for, at simultan modellering giver bedre prædiktioner i denne kontekst, mens de sekventielle modeller fremstår som et mere beregningseffektivt alternativ.