Find ud af, hvordan du identificerer statistisk signifikante forskelle på gruppers middelværdier, resultater af spørgeundersøgelser og A/B‑testresultater med en nem t‑test.
Mens enhver kan se forskellen på to tal, kræver det en større indsats at finde ud af, om forskellen er statistisk signifikant.
Lad os sige, at du har gennemført en kundetilfredshedsundersøgelse på arbejdet. Din chef vil gerne analysere, om mænd giver din virksomhed en lavere NPS® (Net Promoter Score®) end kvinder.
I dataene opdager du, at den gennemsnitlige vurdering fra de mandlige respondenter er 9, sammenlignet med en gennemsnitlig score på 12 fra de kvindelige respondenter. Hvordan kan du afgøre, om 9 adskiller sig signifikant fra 12? Det er her, t‑test kommer ind i billedet.
I denne artikel definerer vi t‑test og deres brugssager, deler eksempler på t‑test og forklarer, hvordan du fortolker dine resultater.
En t‑test er en statistisk test, der vurderer, om forskellen mellem to middelværdier er signifikant ved hjælp af t‑fordelingen. Den hjælper dig med at klarlægge, om en observeret forskel mellem grupper afspejler en reel forskel eller sandsynligvis skyldes tilfældigheder.
Det er almindeligt at teste for statistisk signifikans inden for test af koncept og test af produkt. Ved test af koncept bruges A/B‑tests ofte til at afgøre, om ét reklamekoncept klarer sig bedre end et andet. Tilsvarende kan test af produkt vise, om et produkt kan klare sig på markedet, når det lanceres.
T‑tests bruger specifikke formler til at sammenligne middelværdier og fastslå, om en forskel er statistisk signifikant. T‑testen med to stikprøver er den mest almindelige i analyser af spørgeundersøgelser:
Her er formlerne for en t‑test med en stikprøve og en parret t‑test:
I både t‑testen med en stikprøve og parret t‑testen sammenlignes den beregnede t‑værdi med en kritisk værdi fra t‑fordelingen for at vurdere signifikans.
Brug en t‑test, når du vil finde ud af, om to gennemsnit er meningsfuldt forskellige fra hinanden og ikke bare numerisk forskellige, i resultaterne af din spørgeundersøgelse. T‑tests hjælper dig med at sammenligne gruppers middelværdier, evaluere forskelle mellem stikprøver og beslutte, om en forskel er statistisk signifikant ud fra en p‑værdi og et konfidensniveau.
Typiske scenarier i spørgeundersøgelser inkluderer:
Brug en t‑test, når du skal vurdere en forskel i middelværdier, teste en sammenligning af benchmark eller bekræfte en hypotese med små stikprøvestørrelser. Her er den et pålideligt valg til analyse af spørgeundersøgelser, A/B‑test og alle situationer, hvor du skal bruge bevis for, at der er en reel forskel i dine data.
Inden du udfører en t‑test, skal du sikre dig, at dine data opfylder nogle forudsætninger, så resultaterne bliver pålidelige.
En hurtig undersøgelse af disse grundlæggende ting er med til at sikre, at enhver forskel, du ser, afspejler et reelt signal og ikke blot støj i dataene.
Der er tre typer t‑test, som normalt bruges af analytikere bruger. Disse t‑test har forskellige formål, som vi uddyber nedenfor.
T‑test med en stikprøve undersøger, om middelværdien (også kaldet gennemsnittet) af data fra én gruppe (i dette tilfælde den overordnede CES) adskiller sig fra en værdi, du angiver.
Eksempel: Din virksomheds nuværende gennemsnitlige score for kundeindsats (CES) er 4,2. Er en CES på 4,2 et tegn på væsentligt mere problematisk end branchestandarden på 5,0?
T‑test med to stikprøver undersøger, om middelværdierne i to uparrede grupper adskiller sig signifikant fra hinanden. Hvis varianserne i grupperne ser ulige ud, eller stikprøvestørrelserne ubalancerede, bør du bruge Welch's t‑test (findes i de fleste værktøjer) i stedet for, da den ikke forudsætter ens varianser.
Eksempel: Din hypotese er, at mænd giver din virksomhed en lavere NPS end kvinder. Den gennemsnitlige NPS fra de mandlige respondenter er 9, mens den gennemsnitlige NPS fra de kvindelige respondenter er 12. Er 9 signifikant forskellig fra 12?
Denne test bruges, når du giver en testgruppe den samme spørgeundersøgelse to gange. En parret t‑test viser dig, om middelværdien har ændret sig fra den første til den anden spørgeundersøgelse.
Eksempel: Du har spurgt den samme kundegruppe to gange: Første gang i april og igen i maj, efter de havde set en reklame for din virksomhed. Har din virksomheds NPS ændret sig, efter kunderne har set reklamen?
Der er fire trin i udførelsen af en t‑test.
I dette afsnit gennemgår vi de fire trin ved hjælp af eksemplet på NPS-vurderinger fra starten:
Din hypotese er, at mænd giver din virksomhed en lavere NPS end kvinder. Den gennemsnitlige NPS fra mænd er 9, mens den er 12 fra kvinder. Er 9 signifikant forskellig fra 12? Dette er et eksempel på, hvordan en t‑test med to stikprøver udføres.
Lad os se på trinnene og på eksemplet med t‑testen.
Hver type t‑test har en forskellig formel til beregning af t‑statistikken. I dette eksempel bruger vi formlen for t‑test med to stikprøver, hvor:
Du vil sandsynligvis gennemføre t‑test i et regneark eller statistikprogram (såsom Excel eller SPSS). Hvis du gerne vil lave beregningerne selv, finder du formlerne for de to andre typer t‑test nedenfor.
Frihedsgrader er antallet af måder, middelværdien kan variere på. I dette tilfælde er frihedsgraderne det antal NPS‑vurderinger, som du kan få i en fastlagt gruppe respondenter. Som med t‑statistikken afhænger formlen for frihedsgrader af, hvilken type t‑test du udfører.
Denne formel skal bruges til at bestemme frihedsgraderne i t‑test med to stikprøver.
Den kritiske værdi er den grænse, hvor forskellen mellem to tal anses for at være statistisk signifikant.
Ifølge denne oversigt er den kritiske værdi 2,02 for en tosidet test med et alfaniveau på 0,05 og 41 frihedsgrader. Bemærk, at de fleste analytikere bruger en tosidet test fremfor en ensidet test, fordi det er et mere forsigtigt valg.
Hvis du vil vide mere om forskellene på ensidede og tosidede test, kan du se denne video fra Khan Academy.
Hvis din t‑statistik er større end din kritiske værdi, er forskellen signifikant. Hvis t‑statistikken er mindre, er de to tal statistisk set ikke forskellige.
I vores eksempel er den absolutte værdi af t‑statistikken 0,86, hvilket ikke er større end den kritiske værdi på 2,02, så du kan konkludere, at mænd ikke giver signifikant lavere NPS‑scorer end kvinder.
Fortolkning af t‑testresultater indebærer gennemgang af t‑værdien, p‑værdien og konfidensintervallet for at finde ud af, om forskellen mellem dine grupper afspejler en reel betydning eller blot tilfældig variation. Samlet viser disse målinger størrelsen på forskellen, styrken af evidensen og konfidensniveauet du kan bruge til resultatet. Ofte Stillede Spørgsmål nedenfor forklarer, hvad de enkelte målinger viser dig, og hvordan du analyserer t‑testresultater.
T‑værdien viser, hvor stor forskellen er mellem gruppers middelværdier i relation til variationen i dine data. En større absolut t‑værdi betyder, at signalet overstiger støjen, mens en lavere t‑værdi antyder, at forskellen kan skyldes tilfældigheder.
P‑værdien angiver, hvor sandsynligt det er at få dine resultater, hvis nulhypotesen (ingen reel forskel) faktisk er sand. Mange bruger en grænse på 0,05 – p ≤ 0,05 tyder på en statistisk signifikant forskel, mens p > 0,05 angiver, at der ikke er en væsentlig forskel i dette eksempel.
Et konfidensinterval angiver et sandsynligt område for den sande forskel mellem middelværdierne og tilføjer kontekst ud over et ja/nej for signifikans. Hvis konfidensintervallet spænder over nul, er betydningen ikke afgørende – hvis intervallet ligger over eller under nul, er resultatet signifikant på det valgte konfidensniveau.
En betydningsfuld forskel er både statistisk signifikant og i praksis vigtig. Se på den estimerede betydningstørrelse og konfidensintervallet for at vurdere, hvor stor forskellen kan være, og om det har betydning for din beslutning.
Større stikprøver mindsker variationen, skærper konfidensintervallerne og gør det nemmere at opdage reelle forskelle. Mindre stikprøver giver større usikkerhed, hvilket kan gøre det sværere at fortolke betydninger tæt på grænsen.
En overskuelig oversigt over dine t‑testresultater viser, hvorfor du lavede sammenligningen, hvad testen viste, og hvor sikker du kan være på forskellen mellem grupperne. Din opgave er at omsætte de statistiske resultater til almindeligt sprog, knytte dem til det oprindelige spørgsmål og fremhæve, hvad resultaterne kan betyde for de efterfølgende beslutninger.
Medtag disse kerneelementer, når du udarbejder en oversigt over t‑testresultater:
Hvis du undgår nogle få simple fejl, får du mere overskuelige og pålidelige t‑testresultater fra dine spørgeundersøgelsesdata.
T‑test bruges til at bestemme, om forskellen i middelværdierne i to stikprøvegrupper er statistisk signifikante. Du kan bruge t‑test under analyse af dine spørgeundersøgelsesdata for at validere pålideligheden af dine resultater.
Med SurveyMonkey kan du nemt oprette og sende spørgeundersøgelser til stikprøvegrupper til din organisations analysebehov. Med SurveyMonkey kan du oprettemarkedsundersøgelser og spørgeskemaer fra bunden, eller du kan vælge blandt vores store udvalg af over 400 skabeloner til spørgeundersøgelser.
Kom i gang med at indsamle spørgeundersøgelsesdata til analyse allerede i dag, så din organisation kan træffe bedre beslutninger om vækst og udvikling. Opret en gratis konto i dag.
NPS, Net Promoter og Net Promoter® Score er registrerede varemærker tilhørende Satmetrix Systems, Inc., Bain & Company og Fred Reichheld.

SurveyMonkey kan hjælpe med at gøre det bedre. Se, hvordan du får større indflydelse med vindende strategier, produkter, oplevelser og meget mere.

Se, hvordan Hornblower bruger SurveyMonkey og kraftfuld AI til at få mest muligt ud af NPS-data, indsamle kundeindsigt og forbedre kundeoplevelsen.

Gør brandtilstanden bedre med skabelonen til spørgeundersøgelse til brandsporing. Stil de rigtige ekspertgodkendte spørgsmål til at måle dit brand equity.

Branchen for forbrugerprodukter og -tjenester – inkl. forbrugsvarer, rejse- og hotelbranchen – anvender indsigt fra SurveyMonkey til at præge fremtiden.





