Del 4: Analyse af to variable – Krydstabel

Dette afsnit guider dig gennem hvordan du laver krydstabeller i Excel for at analysere sammenhænge mellem to kategoriske variable og forstå deres relationer.

Af Morten Pettersson, UCL Erhvervsakademi og Professionshøjskole

Det er sjældent, at vi kun er interesseret i at analysere en enkelt variabel og fx beskrive udbredelsen af et fænomen i vores data. Vi ønsker ofte at undersøge sammenhænge mellem variable. For eksempel om kvinder har en anden holdning end mænd. Her indgår to variable i analysen: køn og holdning.

Hvordan man analyserer sammenhængen mellem to variable afhænger af deres måleniveau. I denne ressource fokuserer vi på situationer, hvor begge variable er kategoriske, og derfor er krydstabulering den oplagte metode.

En krydstabel er et simpelt, men meget effektivt værktøj til at afdække, hvordan to variable hænger sammen. Hvis du fx vil undersøge sammenhængen mellem køn og holdning til et bestemt emne, kan en krydstabel vise, hvor mange mænd og kvinder, der henholdsvis er enige eller uenige, og dermed afsløre om kvinder er mere positive end mænd.

I en krydstabel, som vist i tabel 3, placeres én variabels kategorier i rækkerne og en anden variabels kategorier i kolonnerne. Det skaber en matrix, hvor cellerne viser antallet af observationer, der falder inden for hver kombination af kategorier.

Har du en formodning om, at den ene variabel (uafhængig variabel) påvirker den anden (afhængig variabel), placeres den uafhængige variabel typisk på rækkerne og den afhængige variabel på kolonnerne (Agresti, 2018, s. 227). For eksempel kunne man forestille sig, at køn påvirker holdninger, således at kvinder har en anden holdning end mænd, og derfor placeres køn i rækkerne og holdning i kolonnerne.

Første skridt er at beregne de rå tal i hver celle, men disse kan være svære at tolke, især når grupperne har forskellige størrelser, som det er tilfældet i eksemplet her (se tabel 3: mænd, n=350; kvinder, n=150).

For at lette tolkningen af data bruger vi procenter frem for rå tal. Men hvordan skal vi beregne disse procenter – på rækker, kolonner eller totalen? En tommelfingerregel er at beregne procenter ud fra den uafhængige variabel (Johnson et al. 2008, s. 431-434). Hvis køn er den uafhængige variabel, bør procenterne summere til 100 for hver række. Dette gør det muligt at analysere, hvordan holdninger fordeler sig blandt mænd og kvinder, og om der er en forskel mellem de to grupper. Hvis ingen variabel derimod kan defineres som uafhængig, vil procenterne nogle gange beregnes ud fra totalen, så cellerne i tabellen summerer til 100. Det viser forekomsten af svarkombinationer i vores samlede datamateriale.

Hvis køn er placeret i rækkerne og holdning i kolonnerne, som i ovenstående eksempel, bør du undgå at procentuere på kolonnerne. Procentuering på kolonnerne vil vise, hvor stor en andel af dem, der fx er enige, der henholdsvis er mænd og kvinder. Dette kan være misvisende, fordi det sammenligner gruppernes størrelse, snarere end forskellene i deres holdninger. Hvis der er mange flere mænd end kvinder i stikprøven, kan vi finde, at flere mænd er enige – simpelthen fordi de udgør en større andel af stikprøven. Det giver os dog ikke indsigt i, hvordan holdninger fordeler sig indenfor kønnene, dvs. hvor stor en andel af mændene i forhold til kvinderne, der er enige. Procentuering på kolonnerne vil i dette tilfælde kun give et billede, der afspejler forskelle i gruppestørrelse, ikke forskelle i holdninger.

Når vi derimod procentuerer på rækkerne, som vist i tabel 2, ser vi, hvordan holdningerne fordeler sig blandt kvinder og mænd inden for hver kønsgruppe. Dette gør det muligt at sammenligne de to grupper direkte. Tabellen viser, at 65 % af kvinderne er enten helt eller lidt enige, mens kun 45 % af mændene deler denne holdning. Omvendt er en større andel af mændene uenige sammenlignet med kvinderne. Denne korrekt anvendte procentuering viser altså, at der er en tydelig forskel mellem køn og holdning, hvor kvinderne fremstår mere positive.

Tabel 3. Holdningsfordeling efter køn (rækkeprocent)

Helt

enig

Lidt

enig

Hverken eller Lidt

uenig

Helt

uenig

Total
Kvinde 40 25 10 20 5 100 (n=150)
Mand 20 25 10 25 20 100 (n=350)
Total 26 25 10 24 16 100 (n=500)


Note:
Spørgsmålet lød ”Hvor enig eller uenig er du i følgende udsagn: ….”

 

Excel-instruktion: Sådan laver du en krydstabel (kategoriske variable)

I denne guide viser vi dig, hvordan du ved hjælp af en pivottabel nemt kan lave en krydstabel, og hvordan du får rå tal eller procenter på baggrund af rækkerne eller totalen.

Her er de grundlæggende trin:

  1. Indsæt en pivottabel baseret på dine data: Start med at markere de relevante data i dit ark. Gå derefter til “Indsæt”-menuen, og vælg “Pivottabel”. Dette vil oprette en ny tabel, hvor du kan analysere dine data.
  2. Placér en variabel i rækker og én i kolonner: I pivottabelfelterne trækker du en variabel ned til rækker (fx den du tænker er den uafhængige), og en anden variabel ned til kolonner (fx den du tænker er den afhængige). Dette giver dig en tom tabel med kategorier på rækker og kolonner, men ingen data endnu.
  3. Sådan tilføjes rå optælling som værdier: For at tilføje optælling i din tabelmatrix, kan du trække den variabel, som du har på kolonnen, ned i værdier. Dette giver dig optællingen i hver celle, som er en kombination af kategorier.
  4. Sådan tilføjes rækkeprocenter: Du kan tilføje en procentuering på rækkerne ved at højreklikke inde i tabellen, vælge ”Vis værdier som”, og derefter vælge “% af rækketotal”
  5. Sådan tilføjes procent på det totale: Du kan i stedet tilføje procentuering afhængig af det totale antal observationer i tabellen. Højreklik inde i tabellen, vælg ”Vis værdier som” og derefter “% af hovedtotal”.

Den detaljerede proces, inklusiv tips til hvordan du kan justere og tilpasse din tabel, kan du se i videoen nedenfor. Videoen guider dig trin for trin igennem hele proceduren, så du nemt kan skabe din egen krydstabel.

 

Refleksionsspørgsmål

  1. Hvad afgør om man skal procentuere på rækkerne, kolonnerne eller totalen i en krydstabel?
  2. Hvorfor er det typisk vigtigt at beregne procenter ud fra den uafhængige variabel, når man undersøger sammenhængen mellem to kategoriske variable såsom køn og holdning? Hvilke fejl kan opstå, hvis man procentuerer på kolonnerne?
  3. Hvordan vil fortolkningen af en celle ændre sig, hvis procenterne beregnes ud fra totalen i stedet for ud fra rækkerne?

 

Flere artikler i denne serie

Introduktion til Statistisk analyse af kvantitative data

Del 1: Begrebsgymnastik: Variabel, enheder og værdier

Del 2: Analyse af én variabel

Del 2.a: Analyse af én variabel: Kategorisk variabel

Del 2.b: Analyse af én variabel – Metrisk variabel

Del 3: Beregn statistisk usikkerhed for kategoriske variable

 

Litteratur

Aagerup, L. C. (2015). Pædagogens undersøgelsesmetoder. Hans Reitzels Forlag.

Aagerup, L. C., & Willaa, K. C. W. (2016). Lærerens undersøgelsesmetoder. Hans Reitzels Forlag.

Agresti, A. (2018). Statistical methods for the social sciences (5. udgave). London: Pearson Education Limited.

Agresti, A., & Finlay, B. (2009). Statistical methods for the social sciences (4. udgave). New Jersey: Pearson Education.

Hansen, K. M. & Hansen, S. W. (2020). Univariat analyse. Side 368-392 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.

Hansen, N.-H. M., Marckmann, B., Nørregård-Nielsen, E., Rosenmeier, S. L., & Østergaard, J. (2015). Spørgeskemaer i virkeligheden. Frederiksberg C: Samfundslitteratur.

Thomsen, S. R., & Hansen, K. M. (2020). Stikprøveudvælgelse. Side 352-367 i K. M. Hansen, L. B. Andersen & S. W. Hansen (red.) Metoder i statskundskab (3. udg.). København: Hans Reitzels Forlag.

Tilmeld nyhedsbrev
×
Læremiddel-interesseret?

Tilmeld dig vores nyhedsbreve og få nyheder, ny viden og ny forskning direkte i din indbakke.