En sak som går igjen i nesten enhver debatt jeg har hatt om statistikk for innvandring og kriminalitet de siste årene, er en manglede forståelse hos motdebattanter for hvorfor det er viktig å bruke tall som er justert for sosiodemografiske faktorer.
Som jeg skrev i gårsdagens bloggpost kan man argumentere med at sosioøkonomiske faktorer er mindre interessante enn de kjønn og alder. De slår også vesentlig mindre ut på tallene enn hva kjønn og alder gjør. Så la oss fokusere på dette.
M1 og M2
Dette er et bilde fra den nyeste SSB-rapporten om innvandring og kriminalitet:
Med utgangspunkt i dette skrev jeg blant annet følgende tweet:
Hvordan fikk jeg disse tallene? Jo, som man ser i tabellen var 44,9 per tusen norske bosatte, 15 år eller eldre, siktet i en kriminalsak i løpet av perioden 2010-2013. Det betyr at 955,1 per 1000 ikke var siktet, ergo 95,5 % av befolkningen.
Samme øvelse kan man gjøre med innvandrere. Men her oppstår debatten, fordi noen mener jeg burde brukt tallet 67 per 1000, kalt M1 i tabellen, heller enn 58,4, kalt M2. M2 er det tallet hvor man har justert for kjønn og alder, og bruker man det finner man at 94,2 % av innvandrere totalt ikke var siktet i løpet av de aktuelle årene.
Men hvorfor brukes ikke M1? Det viser jo hvor mange som faktisk var siktet?
Vel, det kommer an på hvilket spørsmål man ønsker å besvare. Hvis spørsmålet er:
Hva betyr innvandring for kriminalitetsbildet?
- da er M1 interessant. Det sier oss noe om hvor mange som faktisk ble siktet. Hvor mange som har utøvd kriminalitet.
Men hvem er dette interessant for? Hva kan vi gjøre med dette tallet? Ikke mye. Det sier ikke noe om risiko. Det sier ikke noe om hvor man må rette tiltak for å bekjempe kriminalitet. Det eneste det sier noe om er hvem politiet identifiserte og siktet. Det er bare tall, men kan ikke brukes til noe konstruktivt.
Et spørsmål som derfor er mer interessant, er:
Er innvandrere mer kriminelle enn befolkningen for øvrig?
Hvis man ønsker svar på dette spørsmålet, må man bruke M2. Og her blander mange kortene. De går inn i debatter som stiller det siste spørsmålet, men bruker tallene som er relevante for det første spørsmålet. Det gir ingen mening.
Om innvandring og livorhalskreft
La meg demonstrere dette tydelig. Livmorhalskreft rammer bare kvinner, fordi bare kvinner har livmor. Hvis man ønsket å se om innvandrere var mer eller mindre utsatt for livmorhalskreft enn nordmenn uten innvandrerbakgrunn, så måtte man først innhentet tallene for antall tilfeller livmorhalskreft hos de to gruppene.
La oss si at 3 per 1000 innvandrere hadde livmorhalskreft, og 2 per 1000 i øvrig befolkning hadde det. Disse tallene ville man kalt M1 i tabellen over. Ujusterte tall. Råtall. Eller "kald statistikk", som jeg kaller det i "Håndbok i krisemaksimering".
Ville man på det grunnlag kunne si noe om livmorhalskreft var mer vanlig hos innvandrere enn hos andre? Vel, i følge de som ønsker å debattere kriminalitet med ujusterte tall, M1, kunne vi det. Men jeg tror de fort skjønner at det er feil. Disse tallene i seg selv forteller oss ikke noe med mindre vi også vet noe om hvor mange menn og kvinner det er i de to gruppene.
Hvis det (for eksemplets skyld) var 50% mer kvinner hos innvandrere enn i befolkningen ellers, så måtte man korrigert for dette, og ville da funnet at det egentlig bare var 2 per 1000 tilfeller også hos innvandrere. Altså M2. Dette er det tallet som egentlig forteller oss noe om virkeligheten. M1 er en unyttig fiksjon. M2 er virkelighet.
M1 ville ikke gitt oss noe informasjon om hvor vanlig livmorhalskreft er i de to gruppene. Den ville ikke kunne danne grunnlag for helsepolitiske beslutninger. Den har ingen informativ kraft. Det er et dødt tall som kun er starten på jakten for å finne sannheten, som er M2. M2 kan man bruke politisk. Det kan brukes for å vurdere risiko. Det kan brukes for å ta beslutninger. Det kan brukes til å informere. M2 er nyttig.
Om innvandring og RCTer
Dette er statistisk analyse 101. Alle som har fulgt denne bloggen vet at når man skal gjenomføre testing av behandling og legemidler, må man bruke en randomisert, dobbeltblindet studie, en såkalt RCT, for å få noenlunde sikre data.
Hvorfor randomisert? Jo, fordi hvis man lager to grupper hvor en gruppe får placebo og en annen får ekte behandling, så er det viktig at disse to gruppene er sammenlignbare.
La oss si at vi skal teste medisinen Innvandrium. Vi deler testpersonene inn i to grupper, uten randomisering, og gir den ene gruppen Innvandrium, og den andre en narremedisin.
(Dobbeltblindingen er kritisk i en god studie, men det er ikke relevant for denne saken, så jeg skal ikke gå inn i det nå.)
Når studien er ferdig, finner man at Innvandrium hadde en veldig god effekt. Vesentlig bedre enn det kontrollgruppen opplevde. Ergo virker Innvandrium.
Eller gjør den det? For la oss se litt nærmere på gruppene. En analyse finner at i gruppen som fikk Innvandrium var det en stor overvekt av unge menn. Hvis man fokuserer kun på resultatet, altså M1, ville man kanskje si at Innvandrium virker. Men strengt tatt vet man bare at det kanskje virker best for unge menn. Kan hende det var det at det var så mange unge menn i behandlingsgruppen som gjorde at det fremstod som at Innvandrium var effektiv behandling?
Vi vet ikke. Resultatet M1 er plaget av for mange ukjente variabler knyttet til alder og kjønn. Derfor må studien gjøres på nytt. Denne gangen må gruppene randomiseres. Det betyr at man fordeler personene så tilfeldig at de skal ha samme fordeling av kjønn og alder i begge gruppene.
Når studien da kjøres på nytt, finner man at effekten er like god i begge gruppene. Innvandrium virket ikke likevel. M2 viser virkeligheten. M1 var en forvrengning basert på at det var skjevheter mellom gruppene.
Ergo er det igjen M2, som baserer seg på at man først har sørget for at de to gruppene man sammenligner er mest mulig like i fordeling av alder og kjønn, som gir det korrekte svaret.
Konklusjon
I innvandrerbefolkningen er 2 av 3 personer under 25 år. Det er ganske dramatisk. Kun 6,8% er over 40 år. Det avviker svært mye fra befolkningen ellers.
Vi vet samtidig at kriminalitet utøves oftest av unge menn. Gitt et scenario hvor innvandrere og befolkningen forøvrig var nøyaktig like kriminelle, så ville likevel statistikken vise mer kriminalitet hos innvandrere. Ikke fordi de er innvandrere, men fordi de har flere unge enn resten av befolkningen. Dette er M1. Og det forteller oss veldig lite. Det gir et falskt bilde av virkeligheten, akkurat som med livmorhalskreft-eksemplet.
Vi må først justere for forskjellene i befolkningssammensetningen. Da kan vi finne ut om innvandrere faktisk er mer kriminelle. Og vi kan starte arbeidet med å i så fall forsøke å finne ut hvorfor de er det. Da kan vi ta politiske beslutninger. Vi kan inverksette tiltak. Vi kan vurdere risiko. Men kun med M2.
Så la oss nå glemme M1 i debatten videre. Det tallet er kun et starttall som man bruker for å komme seg til M2. M1 i seg selv forteller oss ikke noe nyttig om virkeligheten hvis målet er å sammenligne grupper, og det meste av debatten handler nettopp om å sammenligne.
Skal man sammenligne, identifisere risiko og årsaker, er man nødt til å bruke M2. Noe annet er en oppskrift på å koke sammen falske data.
Oppdatering 13.12.2017: Faktisk.no har snakket med flere fagpersoner som støtter at man er nødt til å bruke justerte tall for å besvare de interessante spørsmålene.