Statistikvänner!
Dagens blogg kommer att handla om ”man-spreading”, d.v.s. beteendet
att män sitter bredbent i offentliga miljöer. Eftersom jag hade en stund i
väntan på ett tåg kl 0605 på morgonen passade jag på att samla in data på
Göteborg C.
Kön Ihop Isär Summa
Män 17 20 37
Kvinnor 10 5 15
Som synes verkar männen oftare sitta med benen isär, medan
kvinnorna oftare sitter med benen ihop. Man kan räkna på detta och konstatera
att skillnaden inte är signifikant, utan har uppkommit av en slump med sannolikheten
22,7%. Min första slutsats från denna snabba undersökning blir alltså att det
inte finns skillnader mellan män och kvinnor.
Men, innan vi avfärdar fenomenet statistiskt, måste vi göra
ett par betraktelser till. Denna enkla undersökning innehåller nämligen flera
ganska enkla fallgropar som man inte kan bortse ifrån.
Jag gick ett varv runt på centralen och räknade på
sammanlagt sex olika platser. I undersökningen räknade jag inte in gäster på
ett morgonöppet café (borden var i vägen för observation). Jag har heller inte
skiljt på om man suttit i en av de stora hallarna eller i gångarna, mot
gångområdena eller mot en bänk mittemot eller om man haft stående eller
sittande sällskap. Men jag noterade att sitt-stil kan variera beroende på
platsen som man valde att sitta på. Dessa faktorer kan påverka resultaten, men kan inte skattas i detta lilla material.
Risken att en person räknats flera gånger
genom att hen flyttat sig bedömer jag som liten.
Är dessa 52 personer
som deltog i undersökningen representativa för Göteborgs
befolkning. Vilka är det som befinner sig på Göteborg C? Tidigt på morgonen?
Sittandes? Som exempel kan jag ta att jag såg två barn totalt på hela tiden jag
gick runt och kanske runt en handfull personer i pensionsålder. Utan att räkna
kunde jag även konstatera att det var ganska många kvinnor som stod upp.
Inom
statistiken talar man om ”målpopulation”, som är den grupp man vill dra
slutsatser om. Så frågan är om min undersökning handlar om alla Göteborgares
beteenden, eller om alla Göteborgare som åker tåg? Och kan man generalisera detta till hela Sverige? Eller hela världen? I undersökningen ingick mer
än dubbelt så många män som kvinnor, trots att det är känt från tidigare
undersökningar att kvinnor reser mer kollektivt än män, men mindre totalt sett.
Det var även svårt att definiera om man satt ihop eller
isär med benen. Jag definierade att om ena benet korsade det andra så satt man ”ihop”
och i annat fall satt man ”isär”, men denna definition kan man ifrågasätta. Man
kan fundera över om man ska beräkna hur stor yta passagerarna tar upp eller
vilket beteende de visar mot sin omgivning – Är undersökningen en fråga om
logistik eller sociala normer? Jag bestämde det senare och då fick ”korsläggning”
fälla avgörandet. Detta ledde till att några fall (samtliga var kvinnor) med
smalbenen/fotlederna korsade fick betraktas som ”ihop”. Medan ett antal personer
med knäna i kontakt med varandra betraktades som ”isär”. En (man) med vristen på knäet tog upp två platser, men blev "ihop" med denna definition.
Jag strök även en kvinna som satt med fötterna på bänken under sig och en man som
låg på en bänk med korslagda ben.
Men den viktigaste invändningen mot slutsatsen handlar om
stickprovsstorlek. Utgångspunkten i en vetenskaplig undersökning är att det
inte finns skillnader till dess att motsatsen bevisats, d.v.s. män och kvinnor
har samma beteende till dess att tillräckligt med data finns att analysera. I
detta fall är det 54% av männen och 33% av kvinnorna som sitter med benen isär,
men det räcker inte. Trots att männen är dubbelt så benägna till ”spreading” så
behöver man ungefär 2,5 gånger så många observationer. Faran med att
publicera denna snabba slutsats är alltså att vi inte har letat tillräckligt
mycket. Den statistiska termen är att vi gör ett fel av typ 2 eller att vår
undersökning har för låg styrka (28% för att vara exakt).
Det är en felaktig slutsats att ”Män och kvinnor sitter lika
ofta med benen ihop”. Den korrekta slutsatsen är ”Det finns inte tillräckliga
bevis för att män och kvinnor sitter olika ofta med benen ihop”. Jämför detta
med slutsatser om t.ex. risken för cancer från mobiltelefoner: ”Det är bevisat
att mobiltelefoner INTE orsaker cancer” eller ”Det finns inte tillräckliga
bevis för att mobiltelefoner orsakar cancer - än”.
Innan man samlar in mer data måste man också komma på sätt
att undvika s.k. ”selection bias”. Detta innebär att jag får det resultat jag
vill därför att jag väljer att bara se (eller minnas) det jag vill se. Om jag
t.ex. står på stationen och irriterar mig över några ”spreaders” så kommer jag
ihåg just dem, men inte alla som sitter ”ihop”. För att undvika detta måste jag
välja observationstidpunkt före undersökningen och inte observera då det passar
mig och mina syften.
Selection bias finns det gott om exempel på. T.ex. de
enstaka fall där personer ”botats” av homeopatiska läkemedel, vilket är
önsketänkande i förening med placeboeffekt. Eller när invandrare får skulden
för brottslighet, vilket beror på att man kommer ihåg att en person inte
är etnisk svensk men glömmer att räkna alla andra.
Så nästa gång ni läser ett "vetenskapligt" påstående: Granska
detta kritiskt!
/Magnus