fredag 23 november 2012

Big mac index

Hej Statistikvänner,

Hemma igen från vårt västra broderland Norge. Det finns mycket statistiskt att undersöka vad gäller Norge så jag hoppas återkomma till det fler gånger.

En sak som svenskar noterar i Norge är att det är ”så dyrt” där. För oss svenskar handlar det om att våra pengar inte räcker så långt som vi är vana vid. Vi reser hellre till andra länder, t.ex. Thailand där plånboken känns tjockare.

 Dyrhet kan analyseras från två aspekter: Dels relativt olika länder dels relativt det arbete som krävs för att kunna köpa varor och tjänster. Många nationalekonomer har lagt pannor i djupa veck för att reda ut vilka länder som är dyra respektive billigast, det handlar om ”Purchasing Power Parity” (PPP). Olika avancerade mätningar används, men ibland är det enklare än man tror…

The Economist brukar presentera en jämförelse på vad en Big Mac kostar i olika länder, omräknat till USD. En Big Mac består av en blandning av livsmedel, men även andra varor och tjänster som alla kostar pengar. Detta brukar i ekonomiska sammanhang kallas för en ”korg” av varor och tjänster. Om bröd är dyrt blir en Big Mac dyr. Om arbetskraft är billig så blir en Big Mac billigare.

I januari 2012 kostade en Big Mac 41 SEK i Sverige, vilket motsvarar USD 5,91. Detta placerar oss på fjärde plats efter Venezuela (USD 15,12), Schweiz (USD 6,81) och Norge (USD 6,79). Billigast är Ukraina, där en Big Mac kostar USD 2,11. Med detta som grund kan vi se att priser – generellt – i Norge är 15% högre. En reskassa på 100 SEK ”smälter” alltså ner till ett värde motsvarande 86,95 efter växling.

 Detta är naturligtvis en kraftig förenkling, men lustigt nog visar det sig dessa mått fungerar riktigt bra jämfört med mer avancerade. Ett av skälen till att det fungerar så bra är bl.a. att Big Mac är så standardiserad internationellt sett och består av en blandning av viktiga varor och tjänster som påverkar mycket av våra omkostnader.

Liknande jämförelser brukar blanda in stora och komplicerade beräkningar, undersökningar och framför allt val av vad som ska ingå i en varukorg. Flera gånger har sådana korgar haft stora brister. En sådan korg jämförde konsumentpriser mellan EU:s medlemsländer och kom fram till att Sverige var oerhört dyrt (bl.a. jämfört med Frankrike). Vid en analys av korgen visade det sig snabbt varför: I varukorgen ingick vatten köpt i en affär. Så gör man i många sydeuropeiska länder, där en dunk på 10 liter kan kosta runt 0,1 EUR per liter. Flaskvatten i Sverige kostar kanske 4 EUR för en liter, men å andra sidan kostar kranvatten runt 0,02 EUR per liter. Så det handlar om hur vi handlar.

 Det blir helt enkelt äpplen och päron.

onsdag 7 november 2012

Är bollen rund?

Hej Statistikvänner,

Så var årets allsvenska ut och vi säger STORT GRATTIS till Elfsborg!

Bollen är rund brukar det heta… Men hur rund är den egentligen? Alltså, hur mycket av resultaten i en fotbollsmatch kan förutsägas och hur mycket beror på slumpen? Klart är att det finns olika inslag av tur (eller flyt) i olika sporter. Vi vill gärna att det ska vara så att ett lag som är bättre också vinner oftare. Rent allmänt så är det så, men risken finns alltid för skrällar.

Kan detta analyseras statistiskt? Man kan i alla fall försöka… För att ta reda på lite mer om detta har jag analyserat herrallsvenskan 2012, efter omgång 29 och före omgång 30.

(Nu blir det lite teoretiskt: Vi antar att ett lag gör mål i en jämn och slumpmässig ström. De statistiker som läser detta förstår att jag menar en poissonprocess. Dessa används för köer, haverier, trasiga glödlampor m.m. som brukar inträffa i en slumpmässig följd av oberoende händelser. Just oberoendet är att lite svagt antagande i sammanhanget då man kan anta att det aktuella resultatet och tiden kvar att spela påverkar spelet, men vi utgår från detta denna gång.

Jag testade följande modell:

Antal mål = Snitt + Lagfaktor + Motståndarfaktor + Borta/Hemma + slump

Vi kan konstatera flera intressanta saker. Först ser man att Motståndaren inte har signifikant effekt. Om GAIS förväntas göra ett visst antal mål i en match så spelar det inte så stor roll vilka de möter. Detta skulle kunna tolkas på flera sätt, men en möjlighet är att träning och taktik fokuserar på anfall i första hand.

Däremot spelar det roll om man spelar hemma eller borta. Bortalaget förlorar 0,29 mål per match mot om de spelar hemma. Totalt sett görs 1,56 mål per hemma match mot 1 per bortamatch. Detta kan man naturligtvis spekulera i orsakerna till. Om man bara analyserar derbyn (AIK, Djurgården, GAIS, Häcken och IFK Göteborg) så är skillnaden den omvända, 0,875 till hemmalaget mot 1,0 till bortalaget. Skillnaden är dock för liten för att dra några slutsatser.

Målfarliga lag tenderar, som väntat, att hamna högt i Allsvenskan. Målfarligast är Häcken följt av Helsingborg (2 och 6 i Allsvenskan). Elfsborg hamnade på 6:e plats och gjorde alltså mål i ”rätt” matcher…

Om man förenklar analysen lite kan man även räknar ut förklaringsgraden, d.v.s. hur mycket som förklaras av slumpen respektive modellen. Det visar sig att mellan 20 och 25% av resultatet kan förklaras av denna enkla modell, men det är alltså nästan 80% av resultatet som beror på slumpen. Genom att använda modellen kunde jag tippa rätt 6 gången av 8.

Charmen med sport är såklart att resultatet inte ska vara helt klart på förhand. Det blir liksom inte roligare då man räknar sönder det hela. Eftersom så stor del av resultatet beror på annat än min modell bör man vara försiktig om man försöker bli rik… Jag satsade 1-0 eller 2-0 i matchen Örebro-GAIS, vilket var en rimlig gissning, men det gick som det gick. Matchen slutade med vinst till Örebro, men med 4-0.

Så: Bollen är rund - till 80%.

/Magnus

onsdag 27 juni 2012

Statistik om fattigdom

Hej Statistikvänner!

Hur många barn i Sverige riskerar att leva i fattigdom? Och hur fördelas detta per kommun? Jag fick ett tips om en artikel i Sveriges Radio - Dagens eko där frågan diskuteras. Tyvärr är inte detta inslag så vederhäftigt som man skulle önska.

Jag vill inte ge mig in i en debatt om skillnaden mellan "Absolut" och "Relativ" fattigdom. Artikeln refererar till "Relativ fattigdom" enligt definitionen:

Risk för fattigdom är att familjen har en inkomst, inklusive kapitalinkomster och bidrag som är lägre än 60% av medianinkomsten i Sverige räknat per konsumtionsenhet (En vuxen i varje familj tilldelas en konsumtionsenhet, varje övrig vuxen 0,5 konsumtionsenheter och varje barn under 14 år räknas som 0,3 konsumtionsenheter)

Man kan notera att landets mest "blåa" kommuner (alltså de med stadig majoritet för Alliansens partier) ligger i topp. Dandery, Täby och min egen hemkommun Lerum ligger på 10 i topp! Malmö å andra sidan är fattigast i landet. Här får man passa sig för att blanda ihop orsak och verkan... Man kan möjligen se det som ett mått på segregering, att i vissa kommuner bor höginomsttagare, vilka röstar blått.

I artikeln konstaterar man att man inte har data för inkomster från utlandet. Detta leder till att familjer bosatt i kommuner med stor utpendling till grannländer kommer att se fattiga ut. Detta förklarar varför just Pajala, Torsby m.fl. kommuner är lika fattiga som Burlöv. Burlöv är en relativt välmående Malmöförort med stor risk för barnfattigdom... Bara denna faktor stör siffrorna ganska mycket.

Nämnaren i uträkningen är också intressant. I en kommun med många stora familjer kommer att ha relativt hög fattigdom. Visserligen är det så att större familj kostar mer, men om förhållandet 1, 0,5, 0,3 verkligen stämmer kan man ifrågsätta.

En vuxen till i hushållet kan nästan fördubbla inkomsten. Men ökar bara konsumtionsenheten med 38% eller mindre. Det leder till att fler barnfamiljer med singelföräldrar kommer att se fattigare ut. Men om vi betraktar större familjer (t.ex. 3 barn) så är skillnaden i konsumtionsenheter 26% Fattigdomen för frånskilda blir alltså överskattad för små familjer!

En kärnfamilj med 3 små barn har t.ex. 2,4 konsumtionsenheter medan en frånskild med tre tonåringar ligger på 2,5. Gott om småbarnsfamiljer ger färre konsumtionsenheter vilket får t.ex. Lerum att se mindre fattigt ut.

Sedan kan jag inte låta bli att kommentera det relativa måttet. Medianen påverkas inte på samma sätt som medelvärdet. Betrakta två hushåll som ligger precis över fattigdomsgränsen. Antag att deras inkomst höjs kraftigt, så att de går över medianen. Medianen kommer i så fall att höjas. Då kommer tröskelvärdet att höjas och det andra hushållet som har samma inkomst som förut kommer nu att "bli" fattiga. Fattigdomen ökade fast det som faktiskt hände var att den minskade.

Hälsningar

Magnus

onsdag 15 februari 2012

Rättvisa jämförelser

Hej Statistikvänner,

Hur ska man göra rättvisa jämförelser mellan skolor? Det är rätt enkelt att bara räkna samman betyg eller resultat, och då borde väl en ”dålig” skola få dåliga resultat, eller?

Detta är inte alltid helt rätt. Lärare i min bekantskapskrets har påpekat att det handlar minst lika mycket om hurdana elever man har att utgå från. Så att jämföra betygen rakt av ger inte alltid rätt bild utan man måste standardisera data utifrån en normalpopulation. I de flesta fall saknas information om elevernas bakgrund, men man kan komma en bit på väg om man betraktar de olika gymnasieprogrammen.

Här kommer ett exempel: Stockholms tekniska gymnasium (STG) fick relativt dåliga resultat i jämförelse med nationen som helhet. Meritvärdet (som är ett sammanlagt mått på betyg i alla ämnen) låg på 14,8 för STG jämfört med 14,9 i riket som helhet. Det ser alltså ut som att STG ligger något under medel. Är detta en rättvis jämförelse?

En faktor som finns är att STG har ett ganska litet antal elever på endast tre program: EC, NV och TE. Speciellt EC är kraftigt överrepresenterat på STG. EC är dessutom ett program med generellt låga resultat. NV däremot har generellt goda resultat, men är underrepresenterat på STG.

Så här ser data ut:


Notera att STG har högre betyg på samtliga program jämfört med riket, men att de har större andel av EC-programmet, som har låga betyg även nationellt. Det rättvisa är att räkna ut ett s.k. standardiserat medelvärde. Detta är rätt enkelt: Istället för att använda STG:s fördelning mellan programmen, så utgår vi från samma fördelning som riket i stort. Vi räknar alltså om STG:s meritpoäng som om STG hade haft samma andel för programmen som riket totalt.

Om du gillar formler så kommer en här:


Sätter man in data får man STG:s standardiserade meritvärde blir 15,3, alltså högre än motsvarande nationella siffra. Slutsatsen som man måste dra ifrån detta är att STG:s elever är jämförelsevis bättre än motsvarande blandning av elever i Sverige totalt.

Hälsningar

Magnus

Tack till Åke Dahllöf på STG för data. Jämförande data har hämtats från Skolverkets hemsida.

söndag 15 januari 2012

Missa inte Hans Rosling

SVT sänder en dokumentär ikväll/eftermiddag från BBC som heter Hans Roslings statistik.

Hans Rosling har arbetat med att visualisera data om vär värld, utbildning, överlevnad, hälsa, fattigdom, ekonomi och en massa annat. Prestationen ligger i dels att han lyckats samla in dessa data - över en lång tidsrymd dessutom, dels att han skapat ett verktyg som gör det lätt att se och förstå för vem som helst.

Dokumentären lär säkert ligga på SVT Play också, men om du redan nu vill se exempel på hur man kan göra siffror både medryckande och fascinerande kan du kolla nedanstående länkar:

Rosling: Let my dataset change your mindset

/Magnus