Vurder statistisk signifikans

Hypotesetestning understøttes af statistisk analyse. Statistisk signifikans beregnes ud fra en p-værdi, som angiver sandsynligheden for det observerede resultat, givet at en bestemt sætning (nulhypotesen) er opfyldt. Hvis denne p-værdi er mindre end det angivne signifikansniveau (normalt 0,05), så kan eksperimentatoren antage, at nulhypotesen er falsk og acceptere den alternative hypotese. Ved hjælp af en simpel t-test kan du beregne en p-værdi og sammenligne signifikansen mellem to forskellige grupper af et datasæt.

Trin

Del 1 af 3: Opsætning af dit eksperiment

Billede med titlen Vurder statistisk signifikans Trin 1
1. Definer din hypotese. Det første trin i vurderingen af ​​statistisk signifikans er at definere spørgsmålet, der skal besvares, og stille din hypotese. Hypotesen er et udsagn om dine eksperimentelle data og de forskelle, der kan være i befolkningen. I hvert eksperiment er der både en nul- og en alternativ hypotese. Generelt vil du sammenligne to grupper for at se, om de er ens eller forskellige.
  • Nulhypotesen (H0) angiver generelt, at der ikke er nogen forskel mellem dine to sæt data. For eksempel: elever, der har læst stoffet inden undervisningen, opnår ikke bedre slutkarakterer.
  • Den alternative hypotese (H-en) er det modsatte af nulhypotesen og er den påstand, du forsøger at understøtte med dine eksperimentelle data. For eksempel: elever, der har læst stoffet inden undervisningen, opnår bedre slutkarakterer.
Billede med titlen Vurder statistisk signifikans Trin 2
2. Indstil signifikansniveauet for at bestemme, hvor usædvanlige dine data skal være, før de kan betragtes som væsentlige. Signifikansniveauet (også kaldet alfa) er den tærskel, du sætter for at bestemme signifikans. Hvis p-værdien er mindre end eller lig med det fastsatte signifikansniveau, kan dataene betragtes som statistisk signifikante.
  • Som en generel regel er signifikansniveauet (eller alfa) ofte sat til 0,05, hvilket betyder, at sandsynligheden for tilfældigt at observere forskellene i dine data kun er 5 %.
  • Et højere konfidensniveau (og dermed en lavere p-værdi) betyder, at resultaterne er mere signifikante.
  • Hvis du ønsker, at dataene skal være mere pålidelige, skal du indstille p-værdien til under 0,01. Lavere p-værdier er almindeligt anvendt i industrien ved fejlretning af produkter. Det er meget vigtigt at kunne have stor tillid til, at hver del fungerer præcis, som den skal.
  • For de fleste eksperimenter hen imod en hypotese er et signifikansniveau på 0,05 acceptabelt.
  • Billede med titlen Vurder statistisk signifikans Trin 3
    3. Beslut dig for at bruge en en- eller to-halet test. En af de antagelser, en t-test gør, er, at data er normalfordelt. En normalfordeling af data danner en klokkekurve, hvor de fleste testdata falder i midten. t-testen er en matematisk test for at se, om data falder uden for normalfordelingen (over eller under), i `halerne` af kurven.
  • Hvis du ikke er sikker på, om dine data er over eller under kontrolgruppen, skal du bruge en tostrenget test. Giver dig mulighed for at teste for signifikans i begge retninger.
  • Hvis du ved, hvilken retning dine data har tendens til at bevæge sig, skal du bruge en ensidet test. I det givne eksempel forventer du, at elevernes karakterer forbedres; det er derfor du bruger en ensidet test.
  • Billede med titlen Vurder statistisk signifikans Trin 4
    4. Bestem prøvestørrelsen med en kraftanalyse. Styrken af ​​en test er sandsynligheden for, at det forventede resultat vil blive observeret, givet en bestemt stikprøvestørrelse. Den fælles tærskel for kraft (eller β) er 80 %. En effektanalyse kan blive en smule vanskelig uden nogle foreløbige data, fordi du har brug for nogle oplysninger om de forventede mellemværdier mellem hver gruppe og deres standardafvigelser. Brug en online kraftanalyseberegner til at bestemme den optimale prøvestørrelse for dine data.
  • Forskere laver normalt en lille pilotundersøgelse for at informere om deres styrkeanalyse og for at bestemme den nødvendige stikprøvestørrelse til en større, mere omfattende undersøgelse.
  • Hvis du ikke har ressourcerne til at lave en kompleks pilotundersøgelse, så lav nogle skøn over mulige gennemsnit baseret på læsning af litteraturen og de undersøgelser, som andre personer kan have lavet. Dette vil give dig et godt udgangspunkt for prøvestørrelsen til at starte med.
  • Del 2 af 3: Beregning af standardafvigelsen

    Billede med titlen Vurder statistisk signifikans Trin 5
    1. Find formlen for standardafvigelsen. Standardafvigelsen er et mål for spredningen af ​​dine data. Det giver dig information om, hvor ens hvert datapunkt i din prøve er. Ved første øjekast kan ligningen virke lidt kompliceret, men de følgende trin vil lede dig gennem beregningen. Formlen er: s = √∑((xjeg – µ)/(N – 1)).
    • s er standardafvigelsen.
    • ∑ angiver, at du skal lægge alle de indsamlede prøveværdier sammen.
    • xjeg repræsenterer hver enkelt værdi af dine data.
    • µ er gennemsnittet (eller midten) af dine data for hver gruppe.
    • N er summen af ​​prøven.
    Billede med titlen Vurder statistisk signifikans Trin 6
    2. Tag et gennemsnit af testdataene i hver gruppe. For at beregne standardafvigelsen skal du først gennemsnittet testdataene i de enkelte grupper. Middelværdien er angivet med det græske bogstav mu eller µ. For at gøre dette skal du lægge hvert stykke data sammen og derefter dividere det med det samlede antal data.
  • Lad os for eksempel se på nogle data for at finde gennemsnitskarakteren for den gruppe, der læste materialet før undervisningen. For nemheds skyld bruger vi et datasæt på 5 punkter: 90, 91, 85, 83 og 94.
  • Læg alle data sammen: 90 + 91 + 85 + 83 + 94 = 443.
  • Divider summen med antallet af data, N = 5:443 / 5 = 88,6.
  • Gennemsnitskarakteren for denne gruppe er 88,6.
  • Billede med titlen Vurder statistisk signifikans Trin 7
    3. Træk hver metrik fra middelværdien. Den næste del af beregningen inkluderer delen (xjeg – µ) af ligningen. Du trækker hver data fra det netop beregnede gennemsnit. I vores eksempel ender du med fem subtraktioner.
  • (90-88,6), (91-88,6), (85-88,6), (83-88,6) og (94-88,6).
  • De beregnede tal er nu 1,4, 2,4, -3,6, -5,6 og 5,4.
  • Billede med titlen Vurder statistisk signifikans Trin 8
    4. Kvadret hvert af disse tal og læg dem sammen. Hvert af de nye tal, du lige har beregnet, vil nu blive kvadreret. Dette trin skaber også negative tegn. Hvis du har et minustegn efter dette trin eller i slutningen af ​​din beregning, har du muligvis glemt dette trin.
  • I vores eksempel arbejder vi nu med 1.96 5.76, 12.96, 31.36 og 29.16.
  • Tilføjelse af disse kvadrater giver: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  • Billede med titlen Vurder statistisk signifikans Trin 9
    5. Divider dette med størrelsen af ​​den samlede prøve, minus 1. Formlen dividerer med N-1, fordi den korrigerer for, at man ikke har talt en hel population endnu; du tager en stikprøve fra populationen af ​​alle elever for at lave et skøn.
  • Træk fra: N – 1 = 5 – 1 = 4
  • Del: 81,2/4 = 20,3
  • Billede med titlen Vurder statistisk signifikans Trin 10
    6. Tag kvadratroden. Når du har divideret med antallet af data minus én, skal du beregne kvadratroden af ​​dette sidste tal. Dette er det sidste trin i beregningen af ​​standardafvigelsen. Der er statistiske programmer, der kan lave denne beregning for dig, efter at have indtastet rådata.
  • I vores eksempel er standardafvigelsen for de endelige karakterer for elever, der havde læst materialet før undervisningen: s = √20,3 = 4,51.
  • Del 3 af 3: Bestem betydningen

    Billede med titlen Vurder statistisk signifikans Trin 11
    1. Beregn forskellen mellem dine to grupper af prøven. Indtil nu har eksemplet kun dækket én af stikprøvegrupperne. Ønsker du at sammenligne to grupper, har du naturligvis data fra begge grupper. Beregn standardafvigelsen for den anden gruppe af testdata og brug den til at beregne forskellen mellem de to eksperimentelle grupper. Formlen for varians er sd = √((s1/N1) + (s2/N2)).
    • sd er variansen mellem dine grupper.
    • s1 er standardafvigelsen for gruppe 1 og N1 er stikprøvestørrelsen for gruppe 1.
    • s2 er standardafvigelsen for gruppe 2 og N2 er stikprøvestørrelsen for gruppe 2.
    • Af hensyn til vores eksempel, lad os sige, at data fra gruppe 2 (elever, der ikke havde læst før undervisningen) havde en stikprøvestørrelse på 5 og en standardafvigelse på 5,81. Variationen er:
    • sd = √((s1)/N1) + ((s2)/N2))
    • sd = √(((4,51)/5) + ((5,81)/5)) = √((20,34/5) + (33,76/5)) = √(4,07 + 6,75) = √10,82 = 3,29.
    Billede med titlen Vurder statistisk signifikans Trin 12
    2. Beregn t-score for dine data. Med en t-score kan du konvertere data til en form, som du kan sammenligne med andre data. Med t-scores kan du udføre en t-test, for at beregne sandsynligheden for, at to grupper adskiller sig væsentligt fra hinanden. Formlen for en t-score er: t = (µ1 – µ2)/sd.
  • µ1 er gennemsnittet af den første gruppe.
  • µ2 er middelværdien af ​​den anden gruppe.
  • sd er variansen mellem prøverne.
  • Brug den større middelværdi som µ1, så du ikke har en negativ værdi for t.
  • I vores eksempel, lad os sige, at stikprøvegennemsnittet for gruppe 2 (dem, der ikke læste) var 80. t-scoren er da: t = (µ1 – µ2)/sd = (88,6 – 80)/3,29 = 2,61.
  • Billede med titlen Vurder statistisk signifikans Trin 13
    3. Bestem graden af ​​frihed for din prøve. Ved brug af t-score bestemmes frihedsgrader ved hjælp af stikprøvestørrelsen. Læg antallet af testdata fra hver gruppe sammen, og divider derefter med to. I vores eksempel, graderne af frihed; d.f.) 8, fordi der var fem data i den første gruppe og fem i den anden gruppe ((5 + 5) – 2 = 8).
    Billede med titlen Vurder statistisk signifikans Trin 14
    4. Brug en t-tabel til at vurdere betydningen. En tabel med t-scores og antallet af frihedsgrader kan findes i en standard statistikbog eller online. Se på rækken af ​​frihedsgrader for dine data og find den p-værdi, der svarer til din t-score.
  • med 8 d.f. og en t-score på 2,61 falder p-værdien for en ensidet test mellem 0,01 og 0,025. Fordi vores fastsatte signifikansniveau er mindre end eller lig med 0,05, er vores data statistisk signifikante. Med disse data forkaster vi nulhypotesen og accepterer den alternative hypotese: Elever, der læser stoffet inden undervisningen, får bedre slutkarakterer.
  • Billede med titlen Vurder statistisk signifikans Trin 15
    5. Overvej en opfølgende undersøgelse. Mange forskere laver en lille pilotundersøgelse med nogle få målinger for at forstå, hvordan man opsætter et større studie. En anden undersøgelse, med flere målinger, vil hjælpe med at øge din tillid til din konklusion.

    Tips

    • Statistik er et omfattende og kompliceret felt. Tag en klasse på gymnasiet eller videregående uddannelse om statistisk slutning for bedre at forstå statistisk signifikans.

    Advarsler

    • Denne analyse er specifik for en t-test til at teste forskellene mellem to normalfordelte populationer. Du skal muligvis have en anden statistisk test afhængigt af kompleksiteten af ​​din dataindsamling.

    Оцените, пожалуйста статью