tisdag 29 mars 2011

Hur många barn har du?

Vem ska man tro på?

Min dotter kom hem efter en föreläsning i höstas då politiker från olika partier debatterat på hennes skola. Hon var irriterad över deras påståenden om arbetslösheten bland ungdomar. Siffrorna stämde inte med varandra – Hur kan det vara så att man inte vet hur många arbetslösa som finns i Sverige?

Problemet är att "Antalet arbetslösa ungdomar" innehåller tre vaga ord:

-          Antal, Arbetslösa och Ungdomar.

Om vi tar det bakifrån: Ungdomar. SCB särredovisar åldersgruppen 15-24 år, men kan man egentligen säga att en 15-19 åring som normalt går i skolan (15-16 har skolplikt) är arbetslös om den inte förvärvsarbetar. Och vad säger att en 24-åring är ”ungdom” men inte en 25-åring. Tiden att nå arbetsmarknaden är längre och längre, vilket betyder att den instabila tiden mellan gymnasiet och fast anställning blir längre och det leder till att ”ungdomsbeteendet” fortsätter i högre åldrar.

Arbetslösa, Vad är det? Är man arbetslös om man är föräldraledig men saknar fast anställning? Frilansare utan uppdrag, när upphör den att vara i en svacka till att vara arbetslös? Om man studerar på halvtid, för att man inte får ett jobb, är man arbetslös då? Speciellt brukar man bråka om ”arbetsmarknadspolitiska åtgärder”, alltså studier, praktik etc som erbjuds arbetslösa, är de arbetslösa eller sysselsatta?

Slutligen antal: Om jag jobbar 50% men vill jobba 75% är jag en arbetslös eller 1/4? Eller 1/2?

Allt handlar bara om definitioner. SCB har en entydig definition som man naturligtvis kan diskutera, men det är ett sätt att mäta på.

Andra vaga mått är t.ex. ”frisk”. Om jag tar en medicin när kan jag anses vara ”Frisk”? Frisk kan betyda ”avsaknad av sjukdom”, men alla har ju några krämpor. Skulle man kunna betrakta något slags normaltillstånd, med antalet krämpor ställda i relation till ålder så att man förväntas må sämre med ökande ålder? Frisk kan också betyda att en viss given åkomma är borta (helt eller delvis), men den kanske bara ersatts med en annan - kanske värre. Lite som skämtet med kirurgen som sa "Operationen lyckades men patienten dog".

WHO definierar ”Hälsa” enligt följande:

  • Health is a state of complete physical, mental and social well-being and not merely the absence of disease or infirmity.
Med en sådan definition är det I princip ingen som har hälsa.

En så enkel fråga som ”Hur många barn har du?” kan leda till total förvirring. Hur gör man med utflyttade eller avlidna barn – Har man dem? Plastbarn, ska de räknas? Och om man delar boendet med barnets andra förälder hur räknar man då? Ett barn som bor växelvis är det ett halvt barn eller ett helt barn, t.ex.? Svaret måste i detta fall bero på vad syftet med att ta reda på antalet barn är, men för att frågan ska kunna besvaras måste detta framgå.

Dagens citat: "Vem i hela världen kan man lita på…"

/Magnus

torsdag 24 mars 2011

Hur små grupper kan studeras - Droger och felmarginaler


Ett statistikt begrepp många hört är "inom felmarginalen". Tidningarnas väljarundersökningar brukar alltid lägga till att skillnaderna mellan två mätningar är inom eller större än felmarginalen.

Felmarginalen beror på flera komponenter, men den viktigaste är antalet personer som svarat på enkäten och proportionen som svarat ja eller nej. En sak som intresserar läsare och tillverkare av undersökningar är hur olika delgrupper ser ut inom den stora, man vill t.ex. jämföra sin arbetsplats med hela företaget, sin kommun mot hela landet eller män i socialgrupp 2 som röstar på (s) och bor i en mellansvensk stad. Dessa delgrupper blir tyvärr ännu mindre än hela undersökningen vilket leder till att felmarginalerna blir ännu större. Om man vill ha en ”mellan tummen och pekfingret” så ökar felmarginalen med 1 genom roten på antalet. Halva antalet leder till 41% bredare felmarginal.

Häromkvällen var jag på ett möte som handlade om ungdomar på mina barns skola. Man presenterade också en undersökning av kommunens 9:or kallad "drogvaneundersökningen": Denna innehöll ett stort antal ja/nej frågor om ungdomarnas drogvanor. Dessa resultat presenterades med en mängd stapeldiagram som visade utvecklingen över de senaste 4 åren samt skillnaden mellan pojkar och flickor. Presentationen utgick från att drogvanorna ändrats, än hade de gått upp än hade de gått ner - Andelen ja-svar mellan 5% och 20% och variationen låg mellan 1% och 2% (se Drogvaneundersökningen2009)

Undersökningen är väl genomförd på nationell nivå och omfattar då tusentals barn, men de barn som dessutom bor i Lerum och går på en viss skola är endast 471 stycken i siffrorna ovan. Det framgår inte hur många pojkar respektive flickor som deltagit, men vi kan anta att det är 50/50 vilket betyder att det rör sig om 230 barn. Detta betyder att om EN av dessa byter svar eller råkar vara hemma den dagen enkäten genomfördesså blir det skillnad – Varje enskilt barn utgör 1/230 = 0,4%.

I tabellen nedan kan vi se hur stor felmarginalen för ett svar är. Om man t.ex. har c:a 15% ja på en fråga så är felmarginalen +/- 4,6% vilket betyder att sanningen ligger mellan 10,4% och 19,6.


Andel JA
Felmarginal
5%
2,8%
10%
3,9%
15%
4,6%
20%
5,2%
25%
5,6%
30%
5,9%
35%
6,2%
40%
6,3%
45%
6,4%
50%
6,5%


Skillnader på 1-2% är alltså gott och väl inom felmarginalen och kan anses bero på tillfällig variation. Att dra slutsatser om faktiska förändringar i detta material är inte möjligt.

Det är naturligtvis intressant att se förändringar, men man ska inte överskatta det man ser i sina figurer. Slutsatsen man kan dra från dessa data är att det förmodligen inte skett något de senaste åren utan drogvanorna ligger stabilt på dessa nivåer.

/Magnus 

onsdag 23 mars 2011

Örebro...

Hej Statistikvänner,

Jag är i Örebro i dagarna två för att träffa kollegor och lyssna på föredrag om statistik.

Hälsningar

Magnus

tisdag 1 mars 2011

Barn och kön

Medan vi väntar på HD:s utslag i pokerfallet passar jag på att svara på en fråga från min svåger om barn.

Det är ett välkänt (?) faktum att det föds fler pojkar än flickor, nämare bestämt är det 51,4% pojkar bland levande födda och 48,6% flickor. Denna lilla skillnad kan säkert ha en logisk förklaring, t.ex. spekuleras det i att Y-kromosomen är lättare än X vilket skulle göra att pojkspermier helt enkelt simmar snabbare... Denna skillnad jämnar ut sig men först runt 60 års ålder.

Figuren nedan visar andelen män per ålder.


En vanlig uppfattning är att OM man har fått en dotter så kommer sannolikheten för en dotter till att öka. Detta skulle i så fall betyda att familjer med 2 barn skule ha 50% chans att ha två barn av samma kön. I familjer med 3 barn är denna sannolikhet 25% o.s.v. Denna fråga har undersökts av Statistiska Centralbyrån med hjälp av data från RTB.

Resultaten tillsammans med mina förväntade andelar anges i tabellen nedan. Skillnaden mellan det väntade antalet och det verkliga antalet är nästan skrämmande litet.


Detta är inte den enda myten som brukar florera om barnafödslar. Ett annat vanligt påstående är att stridspiloter oftare får döttrar, men det har jag inte hört någon som verifierar.

Skillnaderna mellan pojkar och flickor är relativt liten i Sverige. Enligt Gapminder finns det i Sverige ett överskott på 105 pojkar per 100 flickor i ålder 0-14 år. I botten ligger flera afrikanska länderm Rwanda (98,3), Centralafrika, Angola och Sierra Leone. Lägst i Europa är Moldavien (103,7). I den andra änden hittar vi Kina (120,8). Där har enbarnspolitiken lett till ett mycket stort pojköverskott.

Här finns det mycket mer att säga, men jag skickar med ett par länkar för den som vill läsa mer:

Länkar:

SCB om syskons kön: http://www.scb.se/statistik/_publikationer/BE0801_2006K01_TI_10_A05ST0601.pdf
Forskning och Framsteg om Kina:
http://www.fof.se/tidning/2007/4/pojke-i-ost-flicka-i-vast
Databaser och verktyg för visualisering av världen:
http://http://www.gapminder.org/