Belajar
Apa yang dimaksud dengan P-Value? | Statistik
Secara sederhana, nilai-p menyatakan seberapa terkejutnya Anda dengan data tersebut, dengan asumsi tidak ada pengaruhnya. Semakin rendah nilai p-value, semakin tidak cocok data tersebut dengan model Anda (yaitu asumsi bahwa tidak ada pengaruh).
Misalnya.
Perlakuan A dibandingkan dengan perlakuan B, Anda berasumsi tidak ada efek atau tidak ada perbedaan; Anda mengharapkan hipotesis nol benar. Anda melakukan tes dan mendapatkan nilai p-value 0,02. Artinya, data yang Anda kumpulkan cukup mengejutkan, mengingat Anda mengasumsikan bahwa kedua kelompok tersebut tidak akan berbeda.
Nilai-p ada untuk melindungi diri Anda dari keacakan. Jika Anda melakukan penelitian, kemungkinan besar efek yang Anda lihat hanyalah acak - atau noise data, seperti yang kami sebut. Itulah mengapa Anda mungkin melihat perbedaan yang nyata dalam nilai rata-rata antar kelompok, tetapi tidak ada efek yang signifikan secara statistik. Hal ini juga bisa terjadi sebaliknya. Sebuah penelitian mungkin menunjukkan hasil yang tidak signifikan, tetapi mungkin saja ada efek yang benar; mungkin karena ukuran sampelnya terlalu kecil.
Apa yang memengaruhi nilai-p?
Nilai P dipengaruhi oleh beberapa faktor yang berbeda: ukuran sampel, ukuran efek, dan jenis pengujian dengan asumsinya.
- Ukuran sampel: semakin besar kelompok, semakin cepat Anda akan mendapatkan hasil yang signifikan secara statistik dengan perbedaan yang kecil-dan sebaliknya.
- Ukuran efek: semakin besar ukuran efek, semakin cepat Anda akan mendapatkan hasil yang signifikan secara statistik, bahkan dengan kelompok yang lebih kecil - dan sebaliknya
- Jenis tes: tes menjadi lebih sensitif terhadap perbedaan dengan asumsi tertentu, misalnya distribusi data, independensi ukuran, homoskedastisitas, satu sisi vs dua sisi, antar-kelompok vs di dalam kelompok, dll.
Misalnya.
Sebuah penelitian besar dapat menemukan hasil yang signifikan secara statistik bahkan dengan efek terkecil sekalipun. Efek ini mungkin tidak berarti apa-apa. Di sinilah signifikansi klinis berperan, penelitian penisilin yang asli menggunakan sampel kecil untuk membuat data menunjukkan bahwa ada efek yang sangat besar dalam membasmi bakteri.
Nilai P-value <0,05 ambang batas
Ambang batas untuk signifikansi statistik yang digunakan sebagian besar peneliti (yaitu p < 0,05) hanya bersifat arbitrer. Semua hal dipertimbangkan, ini harus berubah berdasarkan pengaturan belajar Anda. Jika Anda benar-benar tidak menginginkan hasil positif palsu (misalnya keputusan untuk menjalani operasi yang mengancam jiwa), Anda memerlukan angka ambang batas yang rendah. Jika Anda benar-benar tidak menginginkan hasil negatif palsu (misalnya, mendiagnosis tumor agresif), Anda memerlukanpenelitian berkekuatan tinggi dengan angka ambang batas nilai p yang lebih tinggi. Hal ini menggambarkan hubungan memberi-dan-menerima antara kesalahan tipe 1 (α) dan tipe 2 (ß).
Perlu diketahui bahwa nilai p-value berasal dari data, bukan teori. Anda tidak dapat 'membuktikan' teori Anda dengan efek yang signifikan secara statistik. Satu-satunya hal yang dapat Anda lakukan adalah mencoba menyanggah teori Anda dengan penelitian yang berbeda, jika itu berhasil, teori Anda tetap bertahan. Ini adalah pemalsuan.
Kesalahpahaman seputar nilai-p
Beberapa kesalahpahaman umum tentang nilai-p dalam penelitian medis meliputi:
- Nilai p yang signifikan berarti bahwa efek atau hubungan tersebut besar atau bermakna secara klinis.
- Kenyataan: Nilai p hanya menunjukkan kemungkinan mendapatkan hasil yang diamati atau lebih ekstrem di bawah hipotesis nol. Ini tidak memberikan informasi tentang ukuran atau signifikansi klinis dari efek atau asosiasi
- Nilai p yang tidak signifikan berarti tidak ada pengaruh atau hubungan.
- Kenyataan: Nilai p yang tidak signifikan hanya menunjukkan bahwa hasil yang diamati tidak signifikan secara statistik, tetapi tidak berarti bahwa tidak ada efek atau hubungan. Hal ini mungkin disebabkan oleh kekuatan statistik yang rendah atau faktor lain seperti kesalahan pengukuran atau variabel perancu.
- Nilai p-value sebesar 0,05 adalah ambang batas universal untuk signifikansi statistik.
- Kenyataan: Pemilihan tingkat signifikansi tergantung pada konteksnya dan harus didasarkan pada faktor-faktor seperti desain penelitian, ukuran sampel, dan konsekuensi dari kesalahan Tipe I. Tingkat signifikansi yang lebih rendah mungkin sesuai dalam beberapa situasi, seperti dalam penelitian dengan banyak perbandingan atau taruhan tinggi
- Nilai p yang signifikan membuktikan adanya hubungan sebab-akibat.
- Kenyataan: Signifikansi statistik hanya menunjukkan kemungkinan mendapatkan hasil yang diamati atau lebih ekstrem di bawah hipotesis nol. Penelitian ini tidak menetapkan hubungan sebab-akibat, yang membutuhkan bukti tambahan dari desain penelitian, kemungkinan biologis, dan faktor lainnya.
- Ukuran sampel yang besar selalu menghasilkan nilai p yang signifikan.
- Kenyataan: Ukuran sampel yang besar meningkatkan kekuatan untuk mendeteksi efek atau asosiasi, tetapi tidak menjamin nilai p yang signifikan. Ukuran efek, variabilitas, dan faktor lainnya juga berperan dalam menentukan signifikansi statistik.
Referensi
Elkins, MR, Pinto, RZ, Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Syekh, U. (2022). Inferensi statistik melalui estimasi: rekomendasi dari International Society of Physiotherapy Journal Editors. Jurnal terapi manual & manipulatif, 30(3), 133-138.
Neyman, J. dan Pearson, E.S. (1928) Tentang Penggunaan dan Interpretasi Kriteria Uji Tertentu untuk Tujuan Inferensi Statistik. Biometrika, 20A, 175-240.
Seperti apa yang Anda pelajari?
BELI BUKU PENILAIAN FISIOTERAPIS LENGKAP
- 600+ Halaman e-Book
- Konten Interaktif (Demonstrasi Video Langsung, artikel PubMed)
- Nilai Statistik untuk semua Tes Khusus dari penelitian terbaru
- Tersedia di 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- Dan banyak lagi!