Del 2: Analyse af én variabel

I dette afsnit introduceres du til deskriptiv statistik, måleniveauer og analyse af både kategorisk og metriske variable.

Af Morten Pettersson, UCL Erhvervsakademi og Professionshøjskole

Når man har indsamlet data og står med et datasæt, er det et naturligt første skridt at beskrive én variabels fordeling. Med det mener vi, hvordan variablens værdier (fx ”mand”, ”enig” eller alderskategorier) fordeler sig blandt de enheder, vi har indsamlet data fra. Denne type analyse falder under det, der kaldes deskriptiv statistik, dvs. at man opsummerer informationen om variablen (Agresti & Finlay, 2009, s. 4).

Der er forskellige metoder til at beskrive en variabels fordeling afhængigt af dens måleniveau. Hvis variablen er kategorisk, dvs. at værdierne opdeler data i klare grupper, hvor det er umuligt at måle afstande mellem kategorierne – såsom køn eller enighed – beskrives fordelingen normalt ved optælling af observationer inden for hver kategori og at beregne procenter. Dette kunne eksempelvis være antallet af enige og uenige i din undersøgelse.

Hvis variablen derimod er metrisk[1], dvs. at værdierne er reelle numeriske værdier, hvor afstande kan måles præcist – såsom alder eller indkomst – beskrives fordelingen ofte ved hjælp af statistiske mål såsom gennemsnit og standardafvigelse (Agresti & Finlay, 2009, s. 39-48). Eksempelvis kan man beregne gennemsnitsalderen for de adspurgte. Det er dog også muligt at opdele metriske variable i kategorier, såsom aldersintervaller, og analysere dem på samme måde som kategoriske variable (Hansen & Hansen, 2020, s. 373).

Det er dog ikke altid helt nemt at afgøre en variabels måleniveau. Der er fx debat om, hvordan man bør behandle svar på skalaer, som når respondenter placerer deres politiske ideologi fra 0 (yderste venstre) til 10 (yderste højre) (Hansen & Hansen, 2020, s. 372). Selvom afstanden mellem værdierne ser ens ud, er spørgsmålet om det giver reel mening? Vi ved eksempelvis ikke, om folk ser værdien 9 på samme måde, eller om springet fra 0 til 1 opfattes som det samme som fra 4 til 5. Indenfor nogle fagområder tager man ofte en sådan skala for pålydende og lægger hovedet på blokken, men det er i sidste ende en trossag. Denne forfatter mener, at det er en problematisk antagelse. Det kan nemlig fordreje resultaterne – især ved beregning af gennemsnit (og sammenligning af forskellige gruppers gennemsnit). Det bør derfor betragtes som en kategorisk variabel.

[1] Det kaldes også en kvantitativ variabel (Agresti & Finlay, 2009, s. 12)

Læs mere om måleniveauer

En variabels måleniveau er afgørende for, hvilke analyser du kan udføre. Måleniveauet fortæller, hvilken type information variablen giver, fx om værdierne kan rangordnes, eller om der er meningsfulde afstande mellem dem.

Nominal: En variabel er nominal, når dens værdier er gensidigt udelukkende, men ikke kan rangordnes. Eksempler inkluderer køn (“mand” og “kvinde”) eller hvilken region en skole er placeret i (“Nordjylland”, “Syddanmark” osv.). I tilfældet med region er kategorierne gensidigt udelukkende, fordi en skole kun kan ligge i én region, men på baggrund af denne information er der ikke umiddelbart nogen orden, der indikerer højere eller lavere værdier.

Ordinal: En variabel er ordinalt skaleret, når variablens værdier har en entydig rangorden. Et eksempel er personlig indkomst inddelt i indkomstkategorier som “lav” (under 300.000 kr.), “mellem” (300-600.000 kr.) eller “høj” (over 600.000 kr.). Hvis dette er den eneste information, vi har om personlig indkomst, er rangordning mulig, men vi vil ikke med sikkerhed kunne beregne afstande mellem værdierne.

Interval: En variabel er intervalskaleret, når man kan beregne meningsfulde afstande imellem de mulige værdier. Hvis vi havde information om indkomst opgjort i specifikke beløb, hvor der i princippet er mange mulige værdier, ville indkomst være intervalskaleret (fx 356.774,64 kr.). Ved denne type variabel kan man meningsfuldt beregne afstande mellem værdierne og fx kunne beregne gennemsnit eller standardafvigelse.

Når vi taler om kategoriske og metriske variable, refererer vi typisk til nominale og ordinale variable som kategoriske, og intervalskalerede variable som metriske.

Vigtigt at huske: Man kan altid gå ned i måleniveau, men ikke op. Har du fx indkomst målt på en intervalskala, kan du altid omdanne den til en ordinalskala med kategorier som lav, mellem og høj indkomst. Det betyder dog, at du mister noget af den præcise information, da du går fra specifikke værdier til brede kategorier. Om det er en fordel afhænger af, hvad du ønsker at formidle eller analysere.

I denne ressource ser vi kun på, hvordan man analyserer og rapporterer data ved hjælp af optælling og frekvenser, både for en kategorisk og en metrisk variabel. Dette vil give dig et udmærket fundament til at kunne lave analyser og fortolkninger af indsamlet data.

 

Reflektionsspørgsmål

  1. Hvordan vil du beskrive forskellen mellem en kategorisk og en metrisk variabel?
  2. Hvorfor er det vigtigt at tage højde for en variabels måleniveau, når du skal analysere data, og hvilke konsekvenser kan det få, hvis du vælger en forkert metode?
  3. Hvis du har en Likert-skala med både værdier og labels som 1 “Helt uenig”, 2 “Lidt uenig”, 3 “Hverken/eller”, 4 “Lidt enig”, og 5 “Helt enig”, hvilket måleniveau vil du sige, skalaen befinder sig på?

 

Flere artikler i denne serie

Introduktion til Statistisk analyse af kvantitative data

Del 1: Begrebsgymnastik: Variabel, enheder og værdier

Del 2.a: Analyse af én variabel: Kategorisk variabel

Del 2.b: Analyse af én variabel: Metrisk variabel

Del 3: Beregn statistisk usikkerhed for kategoriske variable

Del 4: Analyse af to variable: Krydstabel

 

Litteratur

Aagerup, L. C. (2015). Pædagogens undersøgelsesmetoder. Hans Reitzels Forlag.

Aagerup, L. C., & Willaa, K. C. W. (2016). Lærerens undersøgelsesmetoder. Hans Reitzels Forlag.

Agresti, A. (2018). Statistical methods for the social sciences (5. udgave). London: Pearson Education Limited.

Agresti, A., & Finlay, B. (2009). Statistical methods for the social sciences (4. udgave). New Jersey: Pearson Education.

Hansen, K. M. & Hansen, S. W. (2020). Univariat analyse. Side 368-392 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.

Hansen, N.-H. M., Marckmann, B., Nørregård-Nielsen, E., Rosenmeier, S. L., & Østergaard, J. (2015). Spørgeskemaer i virkeligheden. Frederiksberg C: Samfundslitteratur.

Thomsen, S. R., & Hansen, K. M. (2020). Stikprøveudvælgelse. Side 352-367 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.

Tilmeld nyhedsbrev
×
Læremiddel-interesseret?

Tilmeld dig vores nyhedsbreve og få nyheder, ny viden og ny forskning direkte i din indbakke.