Naučiti
Što je P-vrijednost? | Statistika
Jednostavno rečeno, p-vrijednost izražava koliko ste iznenađeni podacima, pod pretpostavkom da nema učinka. Što je p-vrijednost niža, podaci se čine nekompatibilnijim s vašim modelom (tj. pretpostavka da nema učinka).
Npr.
Tretman A se uspoređuje s tretmanom B, pretpostavljate da nema učinka ili razlike; očekujete da je nulta hipoteza točna. Provedete test i dobijete p-vrijednost od 0,02. To znači da su podaci koje ste prikupili prilično iznenađujući, s obzirom na to da ste pretpostavili da se grupe neće razlikovati.
P-vrijednost postoji kako bi se zaštitili od slučajnosti. Ako provedete studiju, velike su šanse da su učinci koje vidite samo nasumični— ili podatkovni šum, kako to zovemo. Zbog toga biste mogli vidjeti primjetne razlike u srednjim vrijednostima između skupina, ali ne i statistički značajan učinak. Može i obrnuto. Studija može pokazati neznačajan rezultat, ali može postojati pravi učinak; možda zato što je veličina uzorka jednostavno premala.
Što utječe na p-vrijednost?
Na P-vrijednosti utječe nekoliko različitih čimbenika: veličina uzorka, veličina učinka i vrsta testa s njegovim pretpostavkama.
- Veličina uzorka: što je grupa veća, brže ćete dobiti statistički značajne rezultate s malim razlikama— i obrnuto.
- Veličina učinka : što je veća veličina učinka, brže ćete dobiti statistički značajne rezultate, čak i s manjim grupama— i obrnuto
- Vrsta testa: test postaje osjetljiviji na razlike s određenim pretpostavkama o, na primjer, distribuciji podataka, neovisnosti mjera, homoskedastičnosti, jednostranom naspram dvostranosti, između grupa naspram unutar grupe itd.
Npr.
Velika studija može pronaći statistički značajne rezultate čak i s najmanjim učincima. Ovi učinci možda ne znače ništa. Ovdje dolazi do izražaja klinička važnost. Izvorna studija o penicilinu koristila je maleni uzorak kako bi podaci pokazali da postoje golemi učinci na eliminaciju bakterija.
P-vrijednost <0,05 praga
Prag statističke značajnosti koji većina istraživača koristi (tj. p < 0,05) samo je proizvoljan. Kad se sve uzme u obzir, trebalo bi se promijeniti ovisno o postavkama vašeg studija. Ako stvarno ne želite lažno pozitivne rezultate (npr. odluku da se podvrgnete operaciji opasnoj po život), potreban vam je nizak prag. Ako stvarno ne želite lažno negativne rezultate (npr. dijagnosticiranje agresivnih tumora), potrebna vam je studija visoke snage s naknadno višim pragom p-vrijednosti. Ovo ilustrira odnos davanja i uzimanja između pogrešaka tipa 1 (α) i tipa 2 (ß) .
Imajte na umu da je p-vrijednost izvedena iz podataka, a ne iz teorije. Ne možete 'dokazati' svoju teoriju sa statistički značajnim učinkom. Jedino što možete učiniti je pokušati pobiti svoju teoriju različitim studijama, ako to stoji, vaša teorija stoji. Ovo je krivotvorina.
Zablude oko p-vrijednosti
Neke uobičajene zablude o p-vrijednosti u medicinskim istraživanjima uključuju:
- Značajna p-vrijednost znači da je učinak ili povezanost velika ili klinički značajna.
- stvarnost : P-vrijednost samo ukazuje na vjerojatnost dobivanja promatranog rezultata ili ekstremnije prema nultoj hipotezi . Ne pruža informacije o veličini ili kliničkom značaju učinka ili povezanosti
- P-vrijednost koja nije značajna znači da nema učinka ili povezanosti.
- stvarnost : Neznačajna p-vrijednost samo sugerira da promatrani rezultat nije statistički značajan, ali ne znači nužno da nema učinka ili povezanosti. To može biti posljedica niske statističke snage ili drugih čimbenika kao što su pogreške mjerenja ili zbunjujuće varijable.
- P-vrijednost od 0,05 univerzalni je prag za statističku značajnost.
- stvarnost : Odabir razine značajnosti ovisi o kontekstu i trebao bi se temeljiti na čimbenicima kao što su dizajn studije, veličina uzorka i posljedice pravljenja pogreške tipa I. Niža razina značajnosti može biti prikladna u nekim situacijama, kao što su studije s višestrukim usporedbama ili visokim ulozima
- Značajna p-vrijednost dokazuje uzročnost.
- stvarnost : Statistička značajnost samo ukazuje na vjerojatnost dobivanja promatranog rezultata ili ekstremnijeg prema nultoj hipotezi. Ne utvrđuje uzročnost, što zahtijeva dodatne dokaze iz dizajna studije, biološke vjerodostojnosti i drugih čimbenika.
- Velika veličina uzorka uvijek dovodi do značajne p-vrijednosti.
- stvarnost : Velika veličina uzorka povećava moć otkrivanja učinka ili povezanosti, ali ne jamči značajnu p-vrijednost. Veličina učinka , varijabilnost i drugi čimbenici također igraju ulogu u određivanju statističke značajnosti.
Reference
Elkins, MR, Pinto, RZ, Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, JM, Agarwal, S., Jette , A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). Statističko zaključivanje kroz procjenu: preporuke urednika časopisa International Society of Physiotherapy. Časopis manualne i manipulativne terapije, 30(3), 133–138 .
Neyman, J. i Pearson, ES (1928) O korištenju i tumačenju određenih testnih kriterija u svrhu statističkog zaključivanja. Biometrika, 20A, 175-240.
Sviđa vam se ono što učite?
KUPITE POTPUNU KNJIGU ZA OCJENJIVANJE PHYSIOTUTORS
- 600+ stranica e-knjige
- Interaktivni sadržaj (izravna video demonstracija, PubMed članci)
- Statističke vrijednosti za sve posebne testove iz najnovijih istraživanja
- Dostupno u 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- I mnogo više!