Hvordan gjøre en T-test i Excel

Innholdsfortegnelse:

Hvordan gjøre en T-test i Excel
Hvordan gjøre en T-test i Excel
Anonim

En T-test er en måte å avgjøre om det er statistisk signifikante forskjeller mellom datasett, ved å bruke en Students t-fordeling. T-testen i Excel er en to-utvalgs T-test som sammenligner gjennomsnittet av to prøver. Denne artikkelen forklarer hva statistisk signifikans betyr og viser hvordan du gjør en T-test i Excel.

Instruksjonene i denne artikkelen gjelder for Excel 2019, 2016, 2013, 2010, 2007; Excel for Microsoft 365 og Excel Online.

Image
Image

Hva er statistisk signifikans?

Tenk deg at du vil vite hvilken av to terninger som gir en bedre poengsum. Du kaster den første terningen og får 2; du kaster den andre terningen og får 6. Forteller dette deg at den andre terningen vanligvis gir høyere poengsum? Hvis du svarte «Selvfølgelig ikke», har du allerede en viss forståelse av statistisk signifikans. Du forstår at forskjellen skyldtes den tilfeldige endringen i poengsummen, hver gang en terning kastes. Fordi prøven var veldig liten (bare ett kast), viste den ikke noe vesentlig.

Tenk deg nå at du kaster hver terning 6 ganger:

  • Den første terningen kaster 3, 6, 6, 4, 3, 3; Gjennomsnitt=4,17
  • Den andre terningen kaster 5, 6, 2, 5, 2, 4; Gjennomsnittlig=4,00

Beviser dette nå at den første terningen gir høyere poengsum enn den andre? Sannsynligvis ikke. Et lite utvalg med en relativt liten forskjell mellom gjennomsnittene gjør det sannsynlig at forskjellen fortsatt skyldes tilfeldige variasjoner. Etter hvert som vi øker antall terningkast, blir det vanskelig å gi et fornuftig svar på spørsmålet - er forskjellen mellom poengsummen et resultat av tilfeldig variasjon, eller er det faktisk mer sannsynlig at den ene gir høyere poengsum enn den andre?

Signifikans er sannsynligheten for at en observert forskjell mellom utvalgene skyldes tilfeldige variasjoner. Betydning kalles ofte alfanivået eller ganske enkelt 'α'. Konfidensnivået, eller ganske enkelt 'c,' er sannsynligheten for at forskjellen mellom utvalgene ikke skyldes tilfeldig variasjon; med andre ord, at det er forskjell mellom de underliggende populasjonene. Derfor: c=1 – α

Vi kan sette 'α' på hvilket nivå vi vil, for å føle oss trygge på at vi har bevist betydning. Svært ofte brukes α=5 % (95 % konfidens), men hvis vi vil være virkelig sikre på at eventuelle forskjeller ikke er forårsaket av tilfeldig variasjon, kan vi bruke et høyere konfidensnivå ved å bruke α=1 % eller til og med α=0,1 %.

Ulike statistiske tester brukes for å beregne signifikans i ulike situasjoner. T-tester brukes til å avgjøre om middelverdiene til to populasjoner er forskjellige og F-tester brukes til å bestemme om variansene er forskjellige.

Hvorfor teste for statistisk signifikans?

Når vi sammenligner forskjellige ting, må vi bruke signifikanstesting for å finne ut om den ene er bedre enn den andre. Dette gjelder mange felt, for eksempel:

  • I næringslivet må folk sammenligne ulike produkter og markedsføringsmetoder.
  • I sport må folk sammenligne forskjellig utstyr, teknikker og konkurrenter.
  • I ingeniørfag må folk sammenligne ulike design og parameterinnstillinger.

Hvis du vil teste om noe gir bedre resultater enn noe annet, i et hvilket som helst felt, må du teste for statistisk signifikans.

Hva er studentens T-distribusjon?

En students t-fordeling ligner på en normal (eller gaussisk) fordeling. Disse er begge klokkeformede distribusjoner med de fleste resultatene nær gjennomsnittet, men noen sjeldne hendelser er ganske langt fra gjennomsnittet i begge retninger, referert til som halene av distribusjonen.

Den nøyaktige formen på studentens t-fordeling avhenger av prøvestørrelsen. For prøver på mer enn 30 er det veldig likt normalfordelingen. Ettersom prøvestørrelsen reduseres, blir halene større, noe som representerer den økte usikkerheten som kommer av å trekke slutninger basert på et lite utvalg.

Hvordan gjøre en T-test i Excel

Før du kan bruke en T-test for å finne ut om det er en statistisk signifikant forskjell mellom gjennomsnittet av to prøver, må du først utføre en F-test. Dette er fordi forskjellige beregninger utføres for T-testen avhengig av om det er en signifikant forskjell mellom variansene.

Du trenger Analysis Toolpak-tillegget aktivert for å utføre denne analysen.

Sjekker og laster analyseverktøypakken-tillegg

For å sjekke og aktivere analyseverktøypakken, følg disse trinnene:

  1. Velg FILE-fanen >velg Options.
  2. I dialogboksen Alternativer, velg Add-Ins fra fanene på venstre side.
  3. Velg Administrer-rullegardinmenyen nederst i vinduet, og velg deretter Excel-tillegg. Velg Go.

    Image
    Image
  4. Sørg for at avmerkingsboksen ved siden av Analysis Toolpak er merket av, og velg deretter OK.

  5. Analyseverktøypakken er nå aktiv, og du er klar til å bruke F-tester og T-tester.

Utføre en F-Test og en T-Test i Excel

  1. Legg inn to datasett i et regneark. I dette tilfellet vurderer vi salg av to produkter i løpet av en uke. Den gjennomsnittlige daglige salgsverdien for hvert produkt beregnes også, sammen med standardavviket.

    Image
    Image
  2. Velg Data-fanen > Data Analysis

    Image
    Image
  3. Velg F-Test To-Sample for Variances fra listen, og velg deretter OK.

    Image
    Image

    F-testen er svært følsom for ikke-normalitet. Det kan derfor være tryggere å bruke en Welch-test, men dette er vanskeligere i Excel.

  4. Velg Variable 1 Range og Variable 2 Range; still alfa (0,05 gir 95 % konfidens); velg en celle i øverste venstre hjørne av utdata, med tanke på at dette vil fylle 3 kolonner og 10 rader. Velg OK.

    Image
    Image

    For området for variabel 1 må prøven med det største standardavviket (eller variansen) velges.

  5. Se F-Test-resultatene for å finne ut om det er en signifikant forskjell mellom variansene. Resultatene gir tre viktige verdier:

    • F: Forholdet mellom variansene.
    • P(F<=f) one-tail: Sannsynligheten for at variabel 1 faktisk ikke har en større varians enn variabel 2. Hvis denne er større enn alfa, som er vanligvis 0,05, så er det ingen signifikant forskjell mellom variansene.
    • F Kritisk en-hale: Verdien av F som kreves for å gi P(F<=f)=α. Hvis denne verdien er større enn F, indikerer dette også at det ikke er noen signifikant forskjell mellom variansene.

    P(F<=f) kan også beregnes ved å bruke FDIST-funksjonen med F og frihetsgradene for hver prøve som input. Frihetsgrader er ganske enkelt antall observasjoner i et utvalg minus én.

  6. Nå som du vet om det er forskjell mellom avvikene, kan du velge riktig T-test. Velg fanen Data > Data Analysis, og velg deretter enten t-Test: Two-Sample Assuming Equal Varianceseller t-test: to-utvalg forutsatt ulik variasjon

    Image
    Image
  7. Uavhengig av hvilket alternativ du valgte i forrige trinn, vil du bli presentert med den samme dialogboksen for å angi detaljene for analysen. For å starte, velg områdene som inneholder prøvene for Variable 1 Range og Variable 2 Range.

    Image
    Image
  8. Forutsatt at du vil teste for ingen forskjell mellom midlene, sett Hypotesized Mean Difference til null.
  9. Angi signifikansnivået Alpha (0,05 gir 95 % konfidens), og velg en celle i øverste venstre hjørne av utdata, med tanke på at dette vil fylle 3 kolonner og 14 rader. Velg OK.
  10. Gjennomgå resultatene for å avgjøre om det er en betydelig forskjell mellom middelene.

    Akkurat som med F-testen, hvis p-verdien, i dette tilfellet P(T<=t), er større enn alfa, er det ingen signifikant forskjell. I dette tilfellet er det imidlertid gitt to p-verdier, en for en en-hale-test og den andre for en to-hale-test. I dette tilfellet bruker du to-haleverdien siden hver variabel som har et høyere gjennomsnitt vil være en signifikant forskjell.

Anbefalt: