Öğrenmek
P Değeri Nedir? | İstatistikler
Basit bir ifadeyle p-değeri, herhangi bir etki olmadığını varsayarak verilere ne kadar şaşırdığınızı ifade eder. P-değeri ne kadar düşük olursa, veriler modelinizle (yani etki olmadığı varsayımıyla) o kadar uyumsuz görünür.
Örn.
A tedavisi B tedavisi ile karşılaştırıldığında, hiçbir etki veya fark olmadığını varsayarsınız; sıfır hipotezinin doğru olmasını beklersiniz. Testi yaptınız ve 0,02 p-değeri elde ettiniz. Bu, grupların farklı olmayacağını varsaydığınız düşünüldüğünde, topladığınız verilerin oldukça şaşırtıcı olduğu anlamına gelir.
P-değeri, kendinizi rastgelelikten korumak için vardır. Eğer bir çalışma yaparsanız, gördüğünüz etkilerin rastgele ya da bizim deyimimizle veri gürültüsü olma ihtimali yüksektir. Bu nedenle, gruplar arasındaki ortalama değerlerde fark edilebilir farklılıklar görebilirsiniz, ancak istatistiksel olarak anlamlı bir etki yoktur. Bunun tam tersi de olabilir. Bir çalışma anlamlı olmayan bir sonuç gösterebilir, ancak gerçek bir etki olabilir; belki de örneklem büyüklüğü çok küçük olduğu için.
P-değerini ne etkiler?
P-değerleri birkaç farklı faktörden etkilenir: örneklem büyüklüğü, etki büyüklüğü ve varsayımlarıyla birlikte test türü.
- Örneklem büyüklüğü: Grup ne kadar büyük olursa, küçük farklılıklarla istatistiksel olarak anlamlı sonuçlara o kadar hızlı ulaşırsınız - ve bunun tersi de geçerlidir.
- Etki büyüklüğü: Etki büyüklüğü ne kadar büyük olursa, daha küçük gruplarla bile istatistiksel olarak anlamlı sonuçları o kadar hızlı elde edersiniz - ve bunun tersi de geçerlidir
- Test türü: bir test, örneğin veri dağılımı, ölçümlerin bağımsızlığı, homoscedasticity, tek taraflı vs çift taraflı, gruplar arası vs grup içi vs gibi belirli varsayımlarla ilgili farklılıklara karşı daha hassas hale gelir.
Örn.
Büyük bir çalışma, en küçük etkilerle bile istatistiksel olarak anlamlı sonuçlar bulabilir. Bu etkiler bir şey ifade etmeyebilir. Orijinal penisilin çalışmasında, verilerin bakterileri ortadan kaldırmada büyük etkileri olduğunu göstermesi için küçük bir örneklem kullanılmıştır.
P-değeri <0,05 eşiği
Çoğu araştırmacının kullandığı istatistiksel anlamlılık eşiği (yani p < 0.05) sadece keyfidir. Her şey düşünüldüğünde, çalışma düzeninize göre değişmelidir. Eğer gerçekten yanlış pozitif sonuçlar istemiyorsanız (örneğin hayati tehlikesi olan bir ameliyata karar vermek), düşük bir eşik sayısına ihtiyacınız vardır. Gerçekten yanlış negatif sonuç istemiyorsanız (örneğin agresif tümörlerin teşhisi), daha sonra daha yüksek bir p-değeri eşik sayısına sahip yüksek güçlü birçalışmaya ihtiyacınız vardır. Bu, tip 1 (α) ve tip 2 (ß) hatalar arasındaki al-ver ilişkisini göstermektedir.
P-değerinin teoriden değil, verilerden türetildiğini unutmayın. Teorinizi istatistiksel olarak anlamlı bir etki ile 'kanıtlayamazsınız'. Yapabileceğiniz tek şey, teorinizi farklı çalışmalarla çürütmeye çalışmaktır, eğer tutarsa, teoriniz ayakta kalır. Bu bir tahrifattır.
P-değeri ile ilgili yanlış anlamalar
Tıbbi araştırmalarda p-değeri ile ilgili bazı yaygın yanlış anlamalar şunlardır:
- Anlamlı bir p-değeri, etkinin veya ilişkinin büyük veya klinik olarak anlamlı olduğu anlamına gelir.
- Gerçeklik: P-değeri yalnızca sıfır hipotezi altında gözlemlenen sonucun veya daha uç bir sonucun elde edilme olasılığını gösterir. hakkında bilgi sağlamamaktadır. etkinin büyüklüğü veya klinik önemi veya dernek
- Anlamlı olmayan bir p-değeri, herhangi bir etki veya ilişki olmadığı anlamına gelir.
- Gerçeklik: Anlamlı olmayan bir p-değeri yalnızca gözlemlenen sonucun istatistiksel olarak anlamlı olmadığını gösterir, ancak mutlaka bir etki veya ilişki olmadığı anlamına gelmez. Bunun nedeni düşük istatistiksel güç veya ölçüm hatası ya da karıştırıcı değişkenler gibi diğer faktörler olabilir.
- İstatistiksel anlamlılık için 0,05 p-değeri evrensel bir eşik değerdir.
- Gerçeklik: Anlamlılık düzeyinin seçimi bağlama bağlıdır ve çalışma tasarımı, örneklem büyüklüğü ve Tip I hata yapmanın sonuçları gibi faktörlere dayanmalıdır. Çoklu karşılaştırmalar veya yüksek riskli çalışmalar gibi bazı durumlarda daha düşük bir anlamlılık düzeyi uygun olabilir
- Anlamlı bir p-değeri nedenselliği kanıtlar.
- Gerçeklik: İstatistiksel anlamlılık sadece sıfır hipotezi altında gözlemlenen sonucun veya daha uç bir sonucun elde edilme olasılığını gösterir. Çalışma tasarımı, biyolojik akla yatkınlık ve diğer faktörlerden ek kanıtlar gerektiren nedenselliği ortaya koymaz.
- Büyük bir örneklem büyüklüğü her zaman anlamlı bir p-değerine yol açar.
- Gerçeklik: Büyük bir örneklem büyüklüğü, bir etkiyi veya ilişkiyi tespit etme gücünü artırır, ancak anlamlı bir p değerini garanti etmez. Etki büyüklüğü, değişkenlik ve diğer faktörler de istatistiksel anlamlılığın belirlenmesinde rol oynar.
Referanslar
Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). Tahmin yoluyla istatistiksel çıkarım: Uluslararası Fizyoterapi Dergisi Editörleri Derneği'nin önerileri. The Journal of manual & manipulative therapy, 30(3), 133-138.
Neyman, J. ve Pearson, E.S. (1928) İstatistiksel Çıkarım Amacıyla Belirli Test Kriterlerinin Kullanımı ve Yorumlanması Üzerine. Biometrika, 20A, 175-240.
Öğrendiklerini beğendin mi?
FIZYOTERAPIST DEĞERLENDIRME KITABININ TAMAMINI SATIN ALIN
- 600+ Sayfa e-Kitap
- İnteraktif İçerik (Doğrudan Video Gösterimi, PubMed makaleleri)
- En son araştırmalardan elde edilen tüm Özel Testler için İstatistiksel Değerler
- 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷 adresinde mevcuttur.
- Ve çok daha fazlası!