Hvad er t‑test? En guide til analysering af resultater af spørgeundersøgelser

Find ud af, hvordan du identificerer statistisk signifikante forskelle på gruppers middelværdier, resultater af spørgeundersøgelser og A/B‑testresultater med en nem t‑test.

Kvinde arbejder med t‑testdiagrammer

Mens enhver kan se forskellen på to tal, kræver det en større indsats at finde ud af, om forskellen er statistisk signifikant.

Lad os sige, at du har gennemført en kundetilfredshedsundersøgelse på arbejdet. Din chef vil gerne analysere, om mænd giver din virksomhed en lavere NPS® (Net Promoter Score®) end kvinder. 

I dataene opdager du, at den gennemsnitlige vurdering fra de mandlige respondenter er 9, sammenlignet med en gennemsnitlig score på 12 fra de kvindelige respondenter. Hvordan kan du afgøre, om 9 adskiller sig signifikant fra 12? Det er her, t‑test kommer ind i billedet.

I denne artikel definerer vi t‑test og deres brugssager, deler eksempler på t‑test og forklarer, hvordan du fortolker dine resultater. 

En t‑test er en statistisk test, der vurderer, om forskellen mellem to middelværdier er signifikant ved hjælp af t‑fordelingen. Den hjælper dig med at klarlægge, om en observeret forskel mellem grupper afspejler en reel forskel eller sandsynligvis skyldes tilfældigheder.

Det er almindeligt at teste for statistisk signifikans inden for test af koncept og test af produkt. Ved test af koncept bruges A/B‑tests ofte til at afgøre, om ét reklamekoncept klarer sig bedre end et andet. Tilsvarende kan test af produkt vise, om et produkt kan klare sig på markedet, når det lanceres. 

T‑tests bruger specifikke formler til at sammenligne middelværdier og fastslå, om en forskel er statistisk signifikant. T‑testen med to stikprøver er den mest almindelige i analyser af spørgeundersøgelser:

t‑testformel

Her er formlerne for en t‑test med en stikprøve og en parret t‑test:

t‑test med en stikprøve og parret t‑test

I både t‑testen med en stikprøve og parret t‑testen sammenlignes den beregnede t‑værdi med en kritisk værdi fra t‑fordelingen for at vurdere signifikans.

Brug en t‑test, når du vil finde ud af, om to gennemsnit er meningsfuldt forskellige fra hinanden og ikke bare numerisk forskellige, i resultaterne af din spørgeundersøgelse. T‑tests hjælper dig med at sammenligne gruppers middelværdier, evaluere forskelle mellem stikprøver og beslutte, om en forskel er statistisk signifikant ud fra en p‑værdi og et konfidensniveau.

Typiske scenarier i spørgeundersøgelser inkluderer:

  • Sammenligning af to grupper. Brug en t‑test med to‑stikprøver (uparrede stikprøver) til at undersøge, om segmenter såsom mænd vs. kvinder, nye vs. tilbagevendende kunder eller forskellige medarbejdergrupper svarer forskelligt.
  • Testning af et koncept eller behandlingsgruppe vs. kontrolgruppe. Ved A/B‑test eller test af koncept hjælper t‑testen dig med at se, om én gruppe klarer sig bedre end en anden.
  • Evaluering af forskelle i scorer. Sammenlign målinger såsom Net Promoter Score (NPS), kundetilfredshedsscore (CSAT) eller score for kundeindsats (CES) for at afgøre, om én gruppes gennemsnitlige vurdering er statistisk signifikant højere eller lavere end en anden gruppe.
  • Undersøgelse af ændringer over tid. En parret t‑test viser, om de samme respondenters scorer ændrede sig efter f.eks. en begivenhed, produktlancering eller kampagne.

Brug en t‑test, når du skal vurdere en forskel i middelværdier, teste en sammenligning af benchmark eller bekræfte en hypotese med små stikprøvestørrelser. Her er den et pålideligt valg til analyse af spørgeundersøgelser, A/B‑test og alle situationer, hvor du skal bruge bevis for, at der er en reel forskel i dine data.

Inden du udfører en t‑test, skal du sikre dig, at dine data opfylder nogle forudsætninger, så resultaterne bliver pålidelige.

  • Uafhængige besvarelser. Hver besvarelse skal komme fra en anden person og må ikke påvirke en anden besvarelse. Undgå dubletter, delte enheder eller skjult gruppering.
  • Nogenlunde normal middelværdi. T‑test fungerer bedst, når fordelingen af stikprøvens middelværdi er nogenlunde normal, hvilket som regel er tilfældet, når din stikprøvestørrelse er ca. 30 eller flere pr. gruppe.
  • Rimelig varians. Hvis varianserne i de to grupper er meget forskellige, eller hvis stikprøvestørrelserne er ubalancerede, bør du bruge Welch's t‑test i stedet for en standard t‑test med to‑stikprøver.

En hurtig undersøgelse af disse grundlæggende ting er med til at sikre, at enhver forskel, du ser, afspejler et reelt signal og ikke blot støj i dataene.

Der er tre typer t‑test, som normalt bruges af analytikere bruger. Disse t‑test har forskellige formål, som vi uddyber nedenfor.

T‑test med en stikprøve undersøger, om middelværdien (også kaldet gennemsnittet) af data fra én gruppe (i dette tilfælde den overordnede CES) adskiller sig fra en værdi, du angiver.

Eksempel: Din virksomheds nuværende gennemsnitlige score for kundeindsats (CES) er 4,2. Er en CES på 4,2 et tegn på væsentligt mere problematisk end branchestandarden på 5,0?

T‑test med to stikprøver undersøger, om middelværdierne i to uparrede grupper adskiller sig signifikant fra hinanden. Hvis varianserne i grupperne ser ulige ud, eller stikprøvestørrelserne ubalancerede, bør du bruge Welch's t‑test (findes i de fleste værktøjer) i stedet for, da den ikke forudsætter ens varianser.

Eksempel: Din hypotese er, at mænd giver din virksomhed en lavere NPS end kvinder. Den gennemsnitlige NPS fra de mandlige respondenter er 9, mens den gennemsnitlige NPS fra de kvindelige respondenter er 12. Er 9 signifikant forskellig fra 12?

Denne test bruges, når du giver en testgruppe den samme spørgeundersøgelse to gange. En parret t‑test viser dig, om middelværdien har ændret sig fra den første til den anden spørgeundersøgelse.

Eksempel: Du har spurgt den samme kundegruppe to gange: Første gang i april og igen i maj, efter de havde set en reklame for din virksomhed. Har din virksomheds NPS ændret sig, efter kunderne har set reklamen?

Kvinde kigger på diagrammer på bærbar computer

Der er fire trin i udførelsen af en t‑test.

I dette afsnit gennemgår vi de fire trin ved hjælp af eksemplet på NPS-vurderinger fra starten: 

Din hypotese er, at mænd giver din virksomhed en lavere NPS end kvinder. Den gennemsnitlige NPS fra mænd er 9, mens den er 12 fra kvinder. Er 9 signifikant forskellig fra 12? Dette er et eksempel på, hvordan en t‑test med to stikprøver udføres.

Lad os se på trinnene og på eksemplet med t‑testen.

Hver type t‑test har en forskellig formel til beregning af t‑statistikken. I dette eksempel bruger vi formlen for t‑test med to stikprøver, hvor: 

  • t er t‑statistikken
  • x₁ er det gennemsnitlige NPS for mænd → 9
  • x₂ er det gennemsnitlige NPS for kvinder → 12
  • n₁ er antallet af mænd, der har besvaret NPS‑spørgsmålet → lad os sige, at 20 mænd har besvaret spørgeundersøgelsen
  • n₂ er antallet af kvinder → 23 kvinder besvarede
  • s₁ er spredningen for NPS for mænd → lad os sige, at den beregnede spredning er 12,48
  • s₂ er spredningen for NPS for kvinder → den beregnede spredning er 10,51
formel til t‑test med to‑stikprøver

Du vil sandsynligvis gennemføre t‑test i et regneark eller statistikprogram (såsom Excel eller SPSS). Hvis du gerne vil lave beregningerne selv, finder du formlerne for de to andre typer t‑test nedenfor.

t‑test med en stikprøve og parret t‑test

Frihedsgrader er antallet af måder, middelværdien kan variere på. I dette tilfælde er frihedsgraderne det antal NPS‑vurderinger, som du kan få i en fastlagt gruppe respondenter. Som med t‑statistikken afhænger formlen for frihedsgrader af, hvilken type t‑test du udfører. 

Denne formel skal bruges til at bestemme frihedsgraderne i t‑test med to stikprøver.

formel til frihedsgrader

Den kritiske værdi er den grænse, hvor forskellen mellem to tal anses for at være statistisk signifikant. 

Ifølge denne oversigt er den kritiske værdi 2,02 for en tosidet test med et alfaniveau på 0,05 og 41 frihedsgrader. Bemærk, at de fleste analytikere bruger en tosidet test fremfor en ensidet test, fordi det er et mere forsigtigt valg. 

Hvis du vil vide mere om forskellene på ensidede og tosidede test, kan du se denne video fra Khan Academy.

Hvis din t‑statistik er større end din kritiske værdi, er forskellen signifikant. Hvis t‑statistikken er mindre, er de to tal statistisk set ikke forskellige.

I vores eksempel er den absolutte værdi af t‑statistikken 0,86, hvilket ikke er større end den kritiske værdi på 2,02, så du kan konkludere, at mænd ikke giver signifikant lavere NPS‑scorer end kvinder.

Fortolkning af t‑testresultater indebærer gennemgang af t‑værdien, p‑værdien og konfidensintervallet for at finde ud af, om forskellen mellem dine grupper afspejler en reel betydning eller blot tilfældig variation. Samlet viser disse målinger størrelsen på forskellen, styrken af evidensen og konfidensniveauet du kan bruge til resultatet. Ofte Stillede Spørgsmål nedenfor forklarer, hvad de enkelte målinger viser dig, og hvordan du analyserer t‑testresultater.

T‑værdien viser, hvor stor forskellen er mellem gruppers middelværdier i relation til variationen i dine data. En større absolut t‑værdi betyder, at signalet overstiger støjen, mens en lavere t‑værdi antyder, at forskellen kan skyldes tilfældigheder.

P‑værdien angiver, hvor sandsynligt det er at få dine resultater, hvis nulhypotesen (ingen reel forskel) faktisk er sand. Mange bruger en grænse på 0,05 – p ≤ 0,05 tyder på en statistisk signifikant forskel, mens p > 0,05 angiver, at der ikke er en væsentlig forskel i dette eksempel.

Et konfidensinterval angiver et sandsynligt område for den sande forskel mellem middelværdierne og tilføjer kontekst ud over et ja/nej for signifikans. Hvis konfidensintervallet spænder over nul, er betydningen ikke afgørende – hvis intervallet ligger over eller under nul, er resultatet signifikant på det valgte konfidensniveau.

En betydningsfuld forskel er både statistisk signifikant og i praksis vigtig. Se på den estimerede betydningstørrelse og konfidensintervallet for at vurdere, hvor stor forskellen kan være, og om det har betydning for din beslutning.

Større stikprøver mindsker variationen, skærper konfidensintervallerne og gør det nemmere at opdage reelle forskelle. Mindre stikprøver giver større usikkerhed, hvilket kan gøre det sværere at fortolke betydninger tæt på grænsen.

En overskuelig oversigt over dine t‑testresultater viser, hvorfor du lavede sammenligningen, hvad testen viste, og hvor sikker du kan være på forskellen mellem grupperne. Din opgave er at omsætte de statistiske resultater til almindeligt sprog, knytte dem til det oprindelige spørgsmål og fremhæve, hvad resultaterne kan betyde for de efterfølgende beslutninger.

Medtag disse kerneelementer, når du udarbejder en oversigt over t‑testresultater:

  1. Angiv formålet. Start med at fortælle, hvorfor du gennemførte en t‑test og testens mål. Du kan for eksempel forklare, at du brugte en t‑test for at bevise en statistisk signifikant forskel mellem middelværdierne i to grupper i dine resultater af spørgeundersøgelsen.  
  2. Del beskrivende statistik. Fremhæv herefter middelværdi‑ og standardspredningen for hver gruppe, der evalueres. Det giver interessenterne den nødvendige kontekst til at forstå de observerede forskelle. Du bør også oplyse stikprøvestørrelserne for hver gruppe som ekstra kontekst. 
  3. Præsenter t‑testresultaterne. Del derefter t‑værdien, frihedsgrader (df), p‑værdi og analyse af konfidensintervallet (hvis du har foretaget en). 
  4. Del dine resultater. Til sidst skal du dele dine resultater med interessenterne. Tal kort om hvorvidt forskellen var statistisk signifikant, og hvad det betyder i relation til din hypotese eller dit undersøgelsesspørgsmål.
  5. Foreslå næste skridt. Forklar interessenterne, hvad dine undersøgelsesresultater betyder for virksomheden. Del de næste skridt for, hvordan resultaterne kan påvirke fremtidige forretningsbeslutninger.

Hvis du undgår nogle få simple fejl, får du mere overskuelige og pålidelige t‑testresultater fra dine spørgeundersøgelsesdata.

  • Søgning efter små p‑værdier uden at tjekke den faktiske forskel. Et resultat kan være “statistisk signifikant”, selv om forskellen mellem grupperne er for lille til at have nogen praktisk betydning. Overvej størrelsen på forskellen og konfidensintervallet for at bestemme, om det er betydningsfuldt.
  • Sammenligning af mange grupper uden at justere din tilgang. Hvis du tester mange segmenter eller forøger antallet af spørgsmål, øger du risikoen for tilfældige forskelle. Start med en bredere test såsom ANOVA eller brug grundlæggende korrektioner, når du gennemfører flere t‑test.
  • For tidlig afslutning af A/B‑tests. Hvis du hele tiden tjekker resultaterne og afslutter testen, så snart noget ser lovende ud, kan det føre til falske konklusioner. Beslut dig på forhånd for en stikprøvestørrelse eller en tidsramme.
  • Brug af t‑test til forkerte datatyper. Hvis dit spørgsmål bruger rangeringer eller meget skævvredne vurderingsskalaer, er en t‑test måske ikke den bedste løsning, fordi gennemsnittene kan være misvisende. Sørg for, at dine data forholder sig tilstrækkeligt som en numerisk skala.
  • Undladelse af de grundlæggende forudsætninger. T‑tests fungerer bedst, når besvarelserne er uafhængige, og grupperne har nogenlunde ens variation. Hvis spredningen er meget forskellig mellem grupperne, bør du skifte til Welch's t‑test for at få et mere pålideligt resultat.
  • T‑test vs. ANOVA
  • Z‑test vs. t‑test

T‑test bruges til at bestemme, om forskellen i middelværdierne i to stikprøvegrupper er statistisk signifikante. Du kan bruge t‑test under analyse af dine spørgeundersøgelsesdata for at validere pålideligheden af dine resultater. 

Med SurveyMonkey kan du nemt oprette og sende spørgeundersøgelser til stikprøvegrupper til din organisations analysebehov. Med SurveyMonkey kan du oprettemarkedsundersøgelser og spørgeskemaer fra bunden, eller du kan vælge blandt vores store udvalg af over 400 skabeloner til spørgeundersøgelser.

Kom i gang med at indsamle spørgeundersøgelsesdata til analyse allerede i dag, så din organisation kan træffe bedre beslutninger om vækst og udvikling. Opret en gratis konto i dag.

NPS, Net Promoter og Net Promoter® Score er registrerede varemærker tilhørende Satmetrix Systems, Inc., Bain & Company og Fred Reichheld.

Kvinde med en hijab ser på analyseindsigt på bærbar computer

SurveyMonkey kan hjælpe med at gøre det bedre. Se, hvordan du får større indflydelse med vindende strategier, produkter, oplevelser og meget mere.

En mand og kvinde ser på en artikel på deres bærbare computer og noterer oplysninger på selvklæbende sedler

Se, hvordan Hornblower bruger SurveyMonkey og kraftfuld AI til at få mest muligt ud af NPS-data, indsamle kundeindsigt og forbedre kundeoplevelsen.

Smilende mand med briller bruger en bærbar computer

Gør brandtilstanden bedre med skabelonen til spørgeundersøgelse til brandsporing. Stil de rigtige ekspertgodkendte spørgsmål til at måle dit brand equity.

Kvinde gennemgår oplysninger på sin bærbare computer

Branchen for forbrugerprodukter og -tjenester – inkl. forbrugsvarer, rejse- og hotelbranchen – anvender indsigt fra SurveyMonkey til at præge fremtiden.