Morten Pettersson er adjunkt ved UCL Erhvervsakademi og Professionshøjskole, Center for Anvendt Skoleforskning, og tilknyttet Læremiddel.dk. I Læremiddel.dk har han tidligere været involveret i et projektet ’Adaptive Læremidler’ og ’Kvalitet i dansk og matematik’. I øjeblikket arbejder han med en ny læsevaneundersøgelse kaldet Børn og unges læsning 2021 samt en ny international undersøgelse kaldet ICILS Teacher Panel Study.
Del 1: Begrebsgymnastik: Variabel, enheder og værdier
Dette afsnit forklarer de grundlæggende begreber inden for dataanalyse som variabler, enheder og værdier, hvilket hjælper dig med at forstå opbygningen af kvantitative datasæt.
Af Morten Pettersson, UCL Erhvervsakademi og Professionshøjskole
Når du har indsamlet data fra et spørgeskema eller en anden kvantitativ datakilde, såsom databaser eller registerdata, har du typisk data organiseret i et format med rækker og kolonner, som illustreret nedenfor i Figur 1. For at introducere nogle centrale begreber, lad os bruge et eksempel fra en fiktiv undersøgelse om køn og holdninger blandt danske borgere over 18 år:
Variabel:
En variabel er en egenskab, du ønsker at undersøge blandt nogen eller noget (enheder) og som varierer. I vores eksempel er både køn og holdninger variable. De repræsenterer egenskaber ved nogle, som vi er interesseret i at forstå bedre, såsom udbredelsen af specifikke holdninger i befolkningen. De er i vores datasæt placeret på kolonnerne.
Enheder:
Enheder refererer til de individer, objekter eller situationer, som du undersøger. Hver række i dit datasæt repræsenterer en enhed. I vores eksempel er enheden en person over 18 år, der har deltaget i undersøgelsen.
Værdier:
Værdier er de specifikke oplysninger, du har indsamlet for hver enhed under hver variabel. For variablen køn kan værdierne være kategorierne ”mand” eller ”kvinde”. For variablen holdning kan værdierne være forskellige svarmuligheder, f.eks. ”helt enig”, ”helt uenig”. Værdier udfylder cellerne i dit datasæt.
Figur 1. Eksempel på datasæt fra Excel.
Flere artikler i denne serie
Introduktion til Statistisk analyse af kvantitative data
Del 2.a: Analyse af én variabel: Kategorisk variabel
Del 2.b: Analyse af én variabel: Metrisk variabel
Del 3: Beregn statistisk usikkerhed for kategoriske variable
Del 4: Analyse af to variable: Krydstabel
Litteratur
Aagerup, L. C. (2015). Pædagogens undersøgelsesmetoder. Hans Reitzels Forlag.
Aagerup, L. C., & Willaa, K. C. W. (2016). Lærerens undersøgelsesmetoder. Hans Reitzels Forlag.
Agresti, A. (2018). Statistical methods for the social sciences (5. udgave). London: Pearson Education Limited.
Agresti, A., & Finlay, B. (2009). Statistical methods for the social sciences (4. udgave). New Jersey: Pearson Education.
Hansen, K. M. & Hansen, S. W. (2020). Univariat analyse. Side 368-392 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.
Hansen, N.-H. M., Marckmann, B., Nørregård-Nielsen, E., Rosenmeier, S. L., & Østergaard, J. (2015). Spørgeskemaer i virkeligheden. Frederiksberg C: Samfundslitteratur.
Thomsen, S. R., & Hansen, K. M. (2020). Stikprøveudvælgelse. Side 352-367 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.