Illustrationsbillede indhold

Monte Carlo simulation

I SMILE bestemmes den egentlige klassifikation af Monte Carlo-simulation i kombination med de estimerede sandsynligheder. Det vil sige, at der trækkes et tilfældigt tal mellem 0 og 1 for hver observation. Givet den tilfældige værdi er mindre end klassesandsynligheden, tildeles den givne klasse.

I figuren nedenfor illustreres mekanismen for en situation for to klasser og en for flere klasser. I eksemplet med to klasser er estimeret en sandsynlighed på 30 pct. for, at en person højest har en grundskole uddannelse, mens sandsynligheder for personen har en højere uddannelse er 70 pct. Her trækkes et tilfældigt tal til 0.18 og agentens uddannelsesniveau klassificeres derfor som ”Grundskole”. Hvis der er mere end to klasser, lægges de estimerede sandsynligheder sammen, så intervallerne danner udgangspunkt for, hvilken klasse, der tildeles ved Monte Carlo simulation. I eksemplet udtrækkes værdien 0.62 og individet tildeles klassen ”Erhvervsfaglig uddannelse”.

I figuren illustreres mekanismen for en situation for to klasser og en for flere klasser

Jo større antal personer, der udsættes for Monte Carlo simulationen for de givne karakteristika, der er brugt til at estimere de pågældende sandsynligheder, jo mere vil fordelingen af personerne tilnærme sig de estimerede sandsynligheder. Eller omvendt, hvis der kun er få personer, der udsættes for en hændelse, jo større vil afvigelsen fra de estimerede sandsynligheder typisk være.