Morten Pettersson er adjunkt ved UCL Erhvervsakademi og Professionshøjskole, Center for Anvendt Skoleforskning, og tilknyttet Læremiddel.dk. I Læremiddel.dk har han tidligere været involveret i et projektet ’Adaptive Læremidler’ og ’Kvalitet i dansk og matematik’. I øjeblikket arbejder han med en ny læsevaneundersøgelse kaldet Børn og unges læsning 2021 samt en ny international undersøgelse kaldet ICILS Teacher Panel Study.
Del 2: Analyse af én variabel
I dette afsnit introduceres du til deskriptiv statistik, måleniveauer og analyse af både kategorisk og metriske variable.
Af Morten Pettersson, UCL Erhvervsakademi og Professionshøjskole
Når man har indsamlet data og står med et datasæt, er det et naturligt første skridt at beskrive én variabels fordeling. Med det mener vi, hvordan variablens værdier (fx ”mand”, ”enig” eller alderskategorier) fordeler sig blandt de enheder, vi har indsamlet data fra. Denne type analyse falder under det, der kaldes deskriptiv statistik, dvs. at man opsummerer informationen om variablen (Agresti & Finlay, 2009, s. 4).
Der er forskellige metoder til at beskrive en variabels fordeling afhængigt af dens måleniveau. Hvis variablen er kategorisk, dvs. at værdierne opdeler data i klare grupper, hvor det er umuligt at måle afstande mellem kategorierne – såsom køn eller enighed – beskrives fordelingen normalt ved optælling af observationer inden for hver kategori og at beregne procenter. Dette kunne eksempelvis være antallet af enige og uenige i din undersøgelse.
Hvis variablen derimod er metrisk[1], dvs. at værdierne er reelle numeriske værdier, hvor afstande kan måles præcist – såsom alder eller indkomst – beskrives fordelingen ofte ved hjælp af statistiske mål såsom gennemsnit og standardafvigelse (Agresti & Finlay, 2009, s. 39-48). Eksempelvis kan man beregne gennemsnitsalderen for de adspurgte. Det er dog også muligt at opdele metriske variable i kategorier, såsom aldersintervaller, og analysere dem på samme måde som kategoriske variable (Hansen & Hansen, 2020, s. 373).
Det er dog ikke altid helt nemt at afgøre en variabels måleniveau. Der er fx debat om, hvordan man bør behandle svar på skalaer, som når respondenter placerer deres politiske ideologi fra 0 (yderste venstre) til 10 (yderste højre) (Hansen & Hansen, 2020, s. 372). Selvom afstanden mellem værdierne ser ens ud, er spørgsmålet om det giver reel mening? Vi ved eksempelvis ikke, om folk ser værdien 9 på samme måde, eller om springet fra 0 til 1 opfattes som det samme som fra 4 til 5. Indenfor nogle fagområder tager man ofte en sådan skala for pålydende og lægger hovedet på blokken, men det er i sidste ende en trossag. Denne forfatter mener, at det er en problematisk antagelse. Det kan nemlig fordreje resultaterne – især ved beregning af gennemsnit (og sammenligning af forskellige gruppers gennemsnit). Det bør derfor betragtes som en kategorisk variabel.
[1] Det kaldes også en kvantitativ variabel (Agresti & Finlay, 2009, s. 12)
I denne ressource ser vi kun på, hvordan man analyserer og rapporterer data ved hjælp af optælling og frekvenser, både for en kategorisk og en metrisk variabel. Dette vil give dig et udmærket fundament til at kunne lave analyser og fortolkninger af indsamlet data.
Reflektionsspørgsmål
- Hvordan vil du beskrive forskellen mellem en kategorisk og en metrisk variabel?
- Hvorfor er det vigtigt at tage højde for en variabels måleniveau, når du skal analysere data, og hvilke konsekvenser kan det få, hvis du vælger en forkert metode?
- Hvis du har en Likert-skala med både værdier og labels som 1 “Helt uenig”, 2 “Lidt uenig”, 3 “Hverken/eller”, 4 “Lidt enig”, og 5 “Helt enig”, hvilket måleniveau vil du sige, skalaen befinder sig på?
Flere artikler i denne serie
Introduktion til Statistisk analyse af kvantitative data
Del 1: Begrebsgymnastik: Variabel, enheder og værdier
Del 2.a: Analyse af én variabel: Kategorisk variabel
Del 2.b: Analyse af én variabel: Metrisk variabel
Del 3: Beregn statistisk usikkerhed for kategoriske variable
Del 4: Analyse af to variable: Krydstabel
Litteratur
Aagerup, L. C. (2015). Pædagogens undersøgelsesmetoder. Hans Reitzels Forlag.
Aagerup, L. C., & Willaa, K. C. W. (2016). Lærerens undersøgelsesmetoder. Hans Reitzels Forlag.
Agresti, A. (2018). Statistical methods for the social sciences (5. udgave). London: Pearson Education Limited.
Agresti, A., & Finlay, B. (2009). Statistical methods for the social sciences (4. udgave). New Jersey: Pearson Education.
Hansen, K. M. & Hansen, S. W. (2020). Univariat analyse. Side 368-392 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.
Hansen, N.-H. M., Marckmann, B., Nørregård-Nielsen, E., Rosenmeier, S. L., & Østergaard, J. (2015). Spørgeskemaer i virkeligheden. Frederiksberg C: Samfundslitteratur.
Thomsen, S. R., & Hansen, K. M. (2020). Stikprøveudvælgelse. Side 352-367 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.