Del 2.a: Analyse af én variabel – Kategorisk variabel

Dette delafsnit viser hvordan du analyserer fordelingen af én kategorisk variabel i et datasæt ved hjælp af frekvenstabeller i Excel.

Af Morten Pettersson, UCL Erhvervsakademi og Professionshøjskole

Når vi står overfor analyse af en kategorisk variabel i et datasæt, er det første skridt at lave en frekvenstabel, der viser optælling og procenter. Først illustrerer vi, hvordan en frekvenstabel ser ud i form af tabel 1, efterfulgt af en kort introduktion til, hvordan man opretter en sådan tabel i Excel, samt en udførlig instruktionsvideo.

En frekvenstabel er et meget informativt værktøj, som hurtigt giver et overblik over, hvordan en variabels værdier fordeler sig blandt de adspurgte. Den giver os indsigt i det, som vi ofte er meget interesseret i at forstå, nemlig hvor udbredt et bestemt fænomen er, fx en given holdning, i vores datamateriale.

I en frekvenstabel fremgår værdierne – i dette tilfælde holdningskategorierne – i første kolonne, mens den anden kolonne angiver antallet, eller frekvensen, der falder inden for hver kategori. Den tredje kolonne viser, hvor stor en procentandel af vores samlede observationer hver kategori udgør (også kaldt relativ frekvens). Den sidste kolonne viser den kumulative procent, der summerer hver kategoris procentandel med alle de foregående kategoriers procentandele. Dette gør det nemt at aflæse i tabel 1, hvor stor en procentandel der for eksempel er enige, altså mindst “helt enig” eller “lidt enig”, i dette tilfælde 51%.

Når man laver en frekvenstabel, eller en tabel i det hele taget, er grundreglen, at den skal være selvforklarende (Hansen et al. 2015, s. 202-203). Tabellen skal have en klar og tydelig overskrift, der præcist angiver, hvad tabellen viser. Derudover skal det fremgå, om tallene viser antal eller procent, samt hvor mange observationer der ligger til grund for beregningerne (se fx rækken Total i tabel 1). Endeligt er det god praksis, at man viser, hvilket spørgsmål der er stillet for at få svarerne, hvis svarerne stammer fra et spørgeskema (se noten i tabel 1).

 

Tabel 1. Holdningsfordeling blandt unge over 18 år. Antal, procent og kumulativ procent.

Holdningskategorier Antal Procent Kumulativ procent
Helt enig 130 26 26
Lidt enig 124 25 51
Hverken eller 50 10 61
Lidt uenig 118 24 84
Helt uenig 78 16 100
Total 500 100


Note:
Spørgsmålet lød ”Hvor enig eller uenig er du i følgende udsagn: ….”

 

Excel-instruktion: Sådan laver du en frekvenstabel (kategoriske variable)

At lave en frekvenstabel i Excel er en enkel proces, der giver dig et klart overblik over fordelingen af dine data på en variabel. I denne guide viser vi dig, hvordan du ved hjælp af en pivottabel hurtigt kan generere en tabel, der viser både frekvenser, procenter og den kumulative procentfordeling for en kategorisk variabel.

Her er de grundlæggende trin:

  1. Indsæt en pivottabel baseret på dine data: Start med at markere de relevante data i dit ark. Gå derefter til “Indsæt” menuen, og vælg “Pivottabel”. Dette vil oprette en ny tabel, hvor du kan analysere dine data.
  2. Placér variablen i både rækker og værdier: I pivottabelfelterne trækker du den variabel, som du vil analysere ind i både rækker og værdier. Det giver dig en umiddelbar optælling i en frekvenstabel.
  3. Tilføj værdier som procenter og kumulative procenter: For at vise optællingen som procenter af totalen og som en kumulativ procentfordeling, højreklikker du på værdierne, vælger ”Vis værdier som…” og tilføjer en kolonne med procent af totalen samt en kolonne med den kumulative procentfordeling.

Den detaljerede proces, inklusiv tips til hvordan du kan justere og tilpasse din tabel, kan du se i videoen nedenfor. Videoen guider dig trin for trin igennem hele proceduren, så du nemt kan skabe din egen frekvenstabel.

 

Reflektionsspørgsmål

  1. Hvad er forskellen mellem procentfordeling og kumulativ procentfordeling, og hvornår er den kumulative procent brugbar?
  2. Hvorfor er det vigtigt at angive det samlede antal observationer i en frekvenstabel, når du viser procenter, og hvilke problemer kan opstå, hvis det ikke er med?
  3. Hvilke overvejelser bør du gøre dig om præsentationen af data, så en frekvenstabel er let at forstå og kan læses uden yderligere forklaring?

 

Flere artikler i denne serie

Introduktion til Statistisk analyse af kvantitative data

Del 1: Begrebsgymnastik: Variabel, enheder og værdier

Del 2: Analyse af én variabel

Del 2.b: Analyse af én variabel: Metrisk variabel

Del 3: Beregn statistisk usikkerhed for kategoriske variable

Del 4: Analyse af to variable: Krydstabel

 

Litteratur

Aagerup, L. C. (2015). Pædagogens undersøgelsesmetoder. Hans Reitzels Forlag.

Aagerup, L. C., & Willaa, K. C. W. (2016). Lærerens undersøgelsesmetoder. Hans Reitzels Forlag.

Agresti, A. (2018). Statistical methods for the social sciences (5. udgave). London: Pearson Education Limited.

Agresti, A., & Finlay, B. (2009). Statistical methods for the social sciences (4. udgave). New Jersey: Pearson Education.

Hansen, K. M. & Hansen, S. W. (2020). Univariat analyse. Side 368-392 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.

Hansen, N.-H. M., Marckmann, B., Nørregård-Nielsen, E., Rosenmeier, S. L., & Østergaard, J. (2015). Spørgeskemaer i virkeligheden. Frederiksberg C: Samfundslitteratur.

Thomsen, S. R., & Hansen, K. M. (2020). Stikprøveudvælgelse. Side 352-367 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.

Tilmeld nyhedsbrev
×
Læremiddel-interesseret?

Tilmeld dig vores nyhedsbreve og få nyheder, ny viden og ny forskning direkte i din indbakke.