Wiki Statistik og metodologi

Hvad er en P-værdi? | Statistik

Tjek vores butik
Hvad er en P-værdi?
Find denne wiki på Physiotutors platform Bliv medlem af Physiotutors

Lær

Hvad er en P-værdi? | Statistik

Enkelt sagt udtrykker p-værdien, hvor overrasket man er over dataene, hvis man antager, at der ikke er nogen effekt. Jo lavere p-værdi, jo mere uforenelige synes dataene at være med din model (dvs. antagelsen om, at der ikke er nogen effekt).

F.eks.

Behandling A sammenlignes med behandling B, og du antager, at der ikke er nogen effekt eller forskel; du forventer, at nulhypotesen er korrekt. Du udfører testen og får en p-værdi på 0,02. Det betyder, at de data, du har indsamlet, er ret overraskende, når man tænker på, at du antog, at grupperne ikke ville være forskellige.

P-værdien er til for at beskytte dig mod tilfældigheder. Hvis du udfører en undersøgelse, er der stor sandsynlighed for, at de effekter, du ser, bare er tilfældige - eller datastøj, som vi kalder det. Det er derfor, man kan se mærkbare forskelle i gennemsnitsværdierne mellem grupperne, men ingen statistisk signifikant effekt. Det kan også gå den anden vej rundt. En undersøgelse kan vise et ikke-signifikant resultat, men der kan være en reel effekt; måske fordi stikprøven er for lille.

 

Hvad påvirker p-værdien?

P-værdier påvirkes af et par forskellige faktorer: stikprøvestørrelse, effektstørrelse og typen af test med dens antagelser.

  • Stikprøvestørrelse: Jo større gruppen er, jo hurtigere får du statistisk signifikante resultater med små forskelle - og omvendt.
  • Effektstørrelse: Jo større effektstørrelse, jo hurtigere får du statistisk signifikante resultater, selv med mindre grupper - og omvendt.
  • Testtype: En test bliver mere følsom over for forskelle med visse antagelser om f.eks. datafordelingen, målenes uafhængighed, homoskedasticitet, ensidig vs. tosidet, mellem grupper vs. inden for grupper osv.

F.eks. 

En stor undersøgelse kan finde statistisk signifikante resultater med selv de mindste effekter. Disse effekter betyder måske ikke noget. Det er her, den kliniske betydning kommer ind i billedet: I det oprindelige penicillin-studie brugte man en lille prøve for at få data til at vise, at der er en enorm effekt på eliminering af bakterier.

 

P-værdi <0,05 grænseværdi

Tærsklen for statistisk signifikans, som de fleste forskere bruger (dvs. p < 0,05), er bare vilkårlig. Alt taget i betragtning bør det ændre sig baseret på dit studie-setup. Hvis du virkelig ikke vil have falske positive resultater (f.eks. en beslutning om at gennemgå en livstruende operation), har du brug for et lavt tærskelnummer. Hvis du virkelig ikke vil have falske negativer (f.eks. ved diagnosticering af aggressive tumorer), har du brug for enundersøgelse med høj effekt og efterfølgende en højere p-værdi. Dette illustrerer forholdet mellem type 1 (α) og type 2 (ß ) fejl.

Bemærk, at p-værdien er udledt af data, ikke af teorien. Du kan ikke "bevise" din teori med en statistisk signifikant effekt. Det eneste, du kan gøre, er at forsøge at modbevise din teori med forskellige undersøgelser, og hvis det holder, står din teori ved magt. Dette er falsifikation.

Misforståelser omkring p-værdien

Nogle almindelige misforståelser om p-værdien i medicinsk forskning omfatter:

  • En signifikant p-værdi betyder, at effekten eller sammenhængen er stor eller klinisk meningsfuld.
  • En ikke-signifikant p-værdi betyder, at der ikke er nogen effekt eller sammenhæng.
    • Virkeligheden: En ikke-signifikant p-værdi antyder kun, at det observerede resultat ikke er statistisk signifikant, men det betyder ikke nødvendigvis, at der ikke er nogen effekt eller sammenhæng. Det kan skyldes lav statistisk styrke eller andre faktorer som målefejl eller forvirrende variabler.
  • En p-værdi på 0,05 er en universel grænse for statistisk signifikans.
    • Virkeligheden: Valget af signifikansniveau afhænger af konteksten og bør baseres på faktorer som undersøgelsesdesign, stikprøvestørrelse og konsekvenserne af at begå en type I-fejl. Et lavere signifikansniveau kan være passende i nogle situationer, f.eks. i studier med flere sammenligninger eller høj indsats.
  • En signifikant p-værdi beviser årsagssammenhæng.
    • Virkeligheden: Statistisk signifikans angiver kun sandsynligheden for at opnå det observerede resultat eller et mere ekstremt resultat under nulhypotesen. Det fastslår ikke årsagssammenhæng, som kræver yderligere beviser fra undersøgelsesdesign, biologisk plausibilitet og andre faktorer.
  • En stor stikprøvestørrelse fører altid til en signifikant p-værdi.
    • Virkeligheden: En stor stikprøve øger muligheden for at påvise en effekt eller sammenhæng, men det garanterer ikke en signifikant p-værdi. Effektstørrelsen, variabiliteten og andre faktorer spiller også en rolle i bestemmelsen af den statistiske signifikans.

Referencer

Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). Statistisk inferens gennem estimering: anbefalinger fra International Society of Physiotherapy Journal Editors. The Journal of manual & manipulative therapy, 30(3), 133-138.
Neyman, J. og Pearson, E.S. (1928) On the Use and Interpretation of Certain Test Criteria for Purposes of Statistical Inference. Biometrika, 20A, 175-240.

Grønland, S., Senn, S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N., & Altman, D. G. (2016). Statistiske tests, P-værdier, konfidensintervaller og styrke: en guide til fejlfortolkninger. European journal of epidemiology, 31(4), 337-350.

Kamper S. J. (2019). Fortolkning af resultater 2-Statistisk signifikans og klinisk meningsfuldhed: Kobling af evidens til praksis. The Journal of orthopaedic and sports physical therapy, 49(7), 559-560. 

Karl Popper, Conjectures and Refutations, London: Routledge and Keagan Paul, 1963, s. 33-39; fra Theodore Schick, ed., Readings in the Philosophy of Science, Mountain View, CA: Mayfield Publishing Company, 2000, s. 9-13

Christley, R.M. (2010). Magt og fejl: Øget risiko for falske positive resultater i studier med for få deltagere. The Open Epidemiology Journal, 3, 16-19.

Fleming A. On the Antibacterial Action of Cultures of a Penicillium, with Special Reference to their Use in the Isolation of B. influenzæ. Br J Exp Pathol. 1929 Jun;10(3):226-36. PMCID: PMC2048009.

Erickson, R. A., & Rattner, B. A. (2020). Vi bevæger os ud over p < 0,05 i økotoksikologi: En guide til praktikere. Environmental toxicology and chemistry, 39(9), 1657-1669.

Kan du lide det, du lærer?

KØB DEN FULDE FYSIOTUTORS VURDERINGSBOG

  • E-bog på mere end 600 sider
  • Interaktivt indhold (direkte videodemonstration, PubMed-artikler)
  • Statistiske værdier for alle specialtest fra den seneste forskning
  • Fås i 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
  • Og meget mere!
Bock med stort tryk 5.2

HVAD KUNDERNE HAR AT SIGE OM E-BOGEN OM VURDERING

Download den gratis Physiotutors-app nu!

Gruppe 3546
Download billeder på mobilen
App mockup mobil
App-logo
Mockup af app
Se vores alt-i-en-bog!
Download vores GRATIS app