Kvartil och percentil

Definition: För ett statistiskt material är kvartilerna, vardagligt, de tre variabelvärden som, när det är möjligt, delar upp materialet i fyra lika stora delar. Det förutsätts att observationerna först ordnats efter storlek [7].

Förklaring: Den första kvartilen, vanligen kallad den undre, ibland den nedre, underskrids av högst 25 procent av observationerna samtidigt som den överskrids av högst 75 procent av dem. Den skrivs vanligen Q1 (q ett), där Q är den första bokstaven i engelskans quartile. Ibland används symbolen q1, ibland P25 (p tjugofem), där P står för percentil. Detta illustrerar att percentiler också delar in materialet men i finare delar, närmare bestämt 100 delar. Den 10:e percentilen (P10) är alltså det värde som underskrids av högst 10 procent av observationerna samtidigt som den överskrids av högst 90 procent av dem.

Den andra kvartilen, som är lika med medianen, underskrids av högst 50 procent av observationerna samtidigt som den överskrids av högst 50 procent av dem. Kvartilen kan skrivas Q2 (q två), men detta sker sällan. I stället används vanligen termen median eller någon av symbolerna Md eller P50 (p femtio).

Den tredje kvartilen, vanligen kallad den övre, underskrids av högst 75 procent av observationerna samtidigt som den överskrids av högst 25 procent av dem. Den skrivs vanligen Q3 (q tre). Ibland används symbolen q3, ibland P75 (p sjuttiofem).

Den otympliga definitionen med både underskrids och överskrids behövs för datamaterial som inte kan delas upp i lika stora delar. I stora datamaterial kan det räcka att säga om exempelvis den 10:e percentilen (P10) att 10 procent av observationerna är mindre än eller lika med detta värde och underförstå att 90 procent är större.

Exempel: Kvartiler och percentiler används ofta i lönesammanhang. I tabellen nedan från SCB (avseende 2022) visas lönenivån med fem olika percentiler, samt den genomsnittliga månadslönen (det aritmetiska medelvärdet).

Tolkningen av exempelvis den 10:e percentilen (P10) är att 10 procent av alla kvinnor tjänade 24 600 kr per månad eller mindre, och att 90 procent följaktligen tjänade mer än 24 600 kr. Man kan notera att medianlönen (P50) är lägre än den genomsnittliga månadslönen. Detta är naturligt i lönesammanhang eftersom genomsnittet ”dras upp” av ett fåtal höga eller mycket höga löner. Dessa höga värden påverkar genomsnittslönen men märks inte i medianlönen. Detta är en av anledningarna till att medianen, samt kvartiler och percentiler, ofta används för att beskriva löner.

 Percentil 
 1025507590Genomsnittlig månadslön
Kvinnor24 60028 00033 00040 50050 30036 200
Män25 60029 60035 50045 00059 30040 200
Totalt25 00028 70034 20042 60055 00038 300

Här hittar du fler ord i ordlistan.