Naučite se
Kaj je vrednost P? | Statistika
Poenostavljeno povedano, p-vrednost izraža, kako presenečeni ste nad podatki ob predpostavki, da učinka ni. Nižja kot je p-vrednost, bolj nezdružljivi se zdijo podatki z vašim modelom (tj. s predpostavko, da učinka ni).
Npr.
Zdravljenje A se primerja z zdravljenjem B, predpostavljate, da ni učinka ali razlike; pričakujete, da je ničelna hipoteza pravilna. Opravite test in dobite p-vrednost 0,02. To pomeni, da so podatki, ki ste jih zbrali, precej presenetljivi, saj ste domnevali, da se skupini ne bosta razlikovali.
Vrednost p je namenjena zaščiti pred naključnostjo. Če izvajate študijo, obstaja velika verjetnost, da so učinki, ki jih opazite, zgolj naključni - ali podatkovni šum, kot mu pravimo. Zato lahko opazite opazne razlike v povprečnih vrednostih med skupinami, vendar brez statistično pomembnega učinka. Lahko je tudi obratno. Študija lahko pokaže nepomemben rezultat, vendar lahko obstaja pravi učinek; morda zato, ker je vzorec premajhen.
Kaj vpliva na p-vrednost?
Na vrednost P vpliva nekaj različnih dejavnikov: velikost vzorca, velikost učinka in vrsta testa ter njegove predpostavke.
- Velikost vzorca: večja kot je skupina, hitreje boste dobili statistično pomembne rezultate z majhnimi razlikami – in obratno.
- Velikost učinka: večja kot je velikost učinka, hitreje boste dobili statistično pomembne rezultate, tudi pri manjših skupinah - in obratno.
- Vrsta testa: test je bolj občutljiv na razlike z določenimi predpostavkami, na primer o porazdelitvi podatkov, neodvisnosti mer, homoskedastičnosti, enostranski proti dvostranski, med skupinami proti znotraj skupin itd.
Npr.
V obsežni študiji lahko najdemo statistično pomembne rezultate tudi pri najmanjših učinkih. Ti učinki morda ne pomenijo ničesar. V prvotni študiji o penicilinu je bil uporabljen majhen vzorec, da bi podatki pokazali, da je učinek na odstranjevanje bakterij velik.
Vrednost P <0,05
Prag statistične pomembnosti, ki ga uporablja večina raziskovalcev (tj. p < 0,05), je poljuben. Glede na vse to se mora spremeniti glede na vašo študijsko nastavitev. Če res ne želite lažno pozitivnih rezultatov (npr. odločitev za operacijo, ki ogroža življenje), potrebujete nizko mejno število. Če res ne želite lažno negativnih rezultatov (npr. diagnosticiranje agresivnih tumorjev), potrebujete visoko zmogljivoštudijo z naknadno višjo mejno vrednostjo p. To ponazarja razmerje med napakami tipa 1 (α) in tipa 2 (ß).
Upoštevajte, da p-vrednost izhaja iz podatkov in ne iz teorije. Svoje teorije ne morete "dokazati" s statistično pomembnim učinkom. Edina stvar, ki jo lahko storite, je, da poskušate ovreči svojo teorijo z različnimi študijami, če drži, vaša teorija velja. To je ponarejanje.
Napačne predstave o p-vrednosti
Nekatere pogoste napačne predstave o p-vrednosti v medicinskih raziskavah vključujejo:
- Pomembna p-vrednost pomeni, da je učinek ali povezava velika ali klinično pomembna.
- Resničnost : P-vrednost označuje samo verjetnost, da se doseže opazovani rezultat ali bolj ekstremna pod ničelno hipotezo . Ne zagotavlja informacij o velikosti ali kliničnem pomenu učinka ali povezave
- Neznačilna p-vrednost pomeni, da ni učinka ali povezave.
- Realnost: Neznačilna p-vrednost pomeni le, da opazovani rezultat ni statistično pomemben, vendar ne pomeni nujno, da ni učinka ali povezave. Vzrok je lahko majhna statistična moč ali drugi dejavniki, kot so napaka pri merjenju ali moteče spremenljivke.
- Vrednost p 0,05 je splošni prag za statistično pomembnost.
- Resničnost : Izbira stopnje pomembnosti je odvisna od konteksta in mora temeljiti na dejavnikih, kot so načrt študije, velikost vzorca in posledice napake tipa I. V nekaterih situacijah je lahko primerna nižja stopnja pomembnosti , na primer v študijah z več primerjavami ali visokimi vložki
- Pomembna p-vrednost dokazuje vzročno zvezo.
- Realnost: Statistična pomembnost označuje le verjetnost, da bomo ob ničelni hipotezi dobili opazovani rezultat ali bolj skrajni rezultat. Ne določa vzročne zveze, za katero so potrebni dodatni dokazi na podlagi zasnove študije, biološke verjetnosti in drugih dejavnikov.
- Velika velikost vzorca vedno vodi do pomembne vrednosti p.
- Realnost: Velika velikost vzorca poveča moč za odkrivanje učinka ali povezave, vendar ne zagotavlja pomembne p-vrednosti. Pri določanju statistične pomembnosti so pomembni tudi velikost učinka, variabilnost in drugi dejavniki.
Reference
Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G. in Sheikh, U. (2022). Statistično sklepanje z ocenjevanjem: priporočila Mednarodnega združenja urednikov revij s področja fizioterapije. The Journal of manual & manipulative therapy, 30(3), 133-138.
Neyman, J. in Pearson, E.S. (1928) O uporabi in razlagi nekaterih testnih meril za namene statističnega sklepanja. Biometrika, 20A, 175-240.
Vam je všeč, kar se učite?
KUPITE CELOTNO KNJIGO ZA OCENJEVANJE PHYSIOTUTORS
- 600+ strani e-knjige
- Interaktivna vsebina (neposredna video predstavitev, članki v PubMedu)
- Statistične vrednosti za vse posebne teste iz najnovejših raziskav
- Na voljo v 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- In še veliko več!