Naučiti
Što je statistička moć? | Statistika
Snaga je dugoročna vjerojatnost niza identičnih studija za otkrivanje statistički značajnog učinka (npr. p<0,05) ako postoji. Vjerojatnost pogreške tipa 2 u nizu identičnih studija je jedan minus snaga (1-ß, često 20%).
Npr.
Stotinu studija provodi se unutar iste populacije s istom strukturom liječenja A u odnosu na liječenje B. Prava razlika u liječenju u stvarnom životu između A i B je 30% veća šansa za potpuni oporavak u liječenju A. Kada se statistika izvede na ovih sto studija (ista populacija, ista varijanca, ista standardna devijacija), u prosjeku oko 20 studije neće pokazati statistički značajan učinak. Ovo je stopa pogreške tipa 2, ili lažno negativni rezultati— izravno povezani sa statističkom snagom (1-ß).
Pojednostavljeno rečeno, neadekvatno osnažena studija rjeđe će pokazati statistički značajan učinak, iako razlika zapravo postoji.
Ovo utječe na snagu
Na snagu utječe nekoliko čimbenika, baš kao i kod p-vrijednosti .
- Veličina uzorka: veći uzorak = veća snaga (jasnije razlike između grupa, manje šuma u podacima)
- Varijanca: manja varijanca = veća snaga
- Veličine efekta : veće veličine efekta = više snage (lakše je uočiti testom)
- Vrsta statističkog testa: neki testovi daju više snage u zamjenu za više pretpostavki (nema besplatnih ručaka u statistikama)
Međutim, ključno je razumjeti da statistička snaga (npr. 80%) postoji za jedan mjerni alat, za jednu vremensku točku, za jednu veličinu učinka.
Mala snaga = nepouzdana studija
Dakle, nedovoljno snažna studija povećava rizik od pogrešaka tipa 2 (lažno negativni rezultati) , ali također povećava rizik od pogrešaka tipa 1 (lažno pozitivni), s prenapuhanim učincima. To se zove 'prokletstvo pobjednika'. To je razlog zašto jednostavno ne možete baciti više mjera ishoda na veličinu uzorka i mjeriti u više točaka u vremenu, a da ne dopustite da vaša statistička snaga padne. Dobri istraživači i kliničari znaju da su mjere sekundarnog ishoda samo sugestivne jer studija nije utemeljena na toj količini mjera. Potrebne su vam nove studije da potvrdite te prijedloge. Gore opisani problem naziva se problem višestruke usporedbe .
Mogu zamisliti da ovo zvuči pomalo kontraintuitivno. Pogledajmo primjer.
Npr.
Držite predavanje grupi od 200 studenata i odlučili ste ih podijeliti u dvije grupe. Cilj vaše studije je vidjeti postoje li spolne razlike poput većeg broja žena u jednoj skupini u odnosu na drugu. Nema razlike. Zatim gledate boju očiju, boju kose, duljinu njihovog kažiprsta, PR, kvalitetu života, dob, broj braće i sestara itd. Velike su šanse da ćete negdje naići na statistički značajan rezultat. Ovo je problem višestruke usporedbe .
Rješenja
Kako bi izbjegli nedovoljno snažne studije i rizik od lažno pozitivnih ili lažno negativnih rezultata , istraživači moraju planirati svoje studije s odgovarajućom snagom. To zahtijeva razmatranje faktora kao što su veličina uzorka, veličina učinka , varijanca i korišteni statistički test. Višestruko testiranje također predstavlja rizik od lažno pozitivnih rezultata , koji se može riješiti metodama kao što je podešavanje razine značajnosti ili korištenje kontrole stope lažnog otkrivanja. Razumijevanjem koncepta statističke snage i njegove važnosti u testiranju hipoteza, istraživači mogu dizajnirati studije koje daju pouzdane i smislene rezultate.
Reference
Sviđa vam se ono što učite?
KUPITE POTPUNU KNJIGU ZA OCJENJIVANJE PHYSIOTUTORS
- 600+ stranica e-knjige
- Interaktivni sadržaj (izravna video demonstracija, PubMed članci)
- Statističke vrijednosti za sve posebne testove iz najnovijih istraživanja
- Dostupno u 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- I mnogo više!