学习
什么是置信区间?| 统计
置信区间是一个数值范围,用于以一定的置信度估计一个未知的人口参数。 它是一种表达人口参数(如平均值)估计值不确定性的方法。
例如,在一项调查下背痛理疗新疗法有效性的研究中,研究人员可能会从病人样本中收集数据,并计算出治疗组疼痛减轻的平均值。 平均疼痛减轻率的 95% 置信区间是一个数值范围,预计真实的人群平均疼痛减轻率将以 95% 的概率落在这个范围内。 这意味着,如果同一项研究进行 100 次,大约 95 项研究的真实人口平均值会在其 95% 的置信区间内。
一个典型的例子是
"结果显示,四周后 VAS 疼痛平均减轻 2.3(95% CI 1.8 - 2.8)"。
置信区间是根据样本统计数据和所需置信度(通常为 95% 或 99%)计算得出的。 值得注意的是,置信区间并不能说明零假设是真还是假,但它提供了一个数值区间,这个区间很可能包含具有一定置信度的真实人口参数。
宽度如何?
置信区间越窄,说明样本平均数对总体平均数的估计越精确,而置信区间越宽,说明样本平均数越不精确。 一般来说,样本量越大,置信区间越窄,对人口参数的估计也就越精确。
误解
需要注意的是,我们不能说有 95% 的概率真实的人口平均值位于某张试卷的给定区间内。 是就是,不是就不是。 但是,如果这项研究重复无数次,95% 的情况下都能在生成的区间内找到真正的平均值。
CI 与 P 值
置信区间提供了根据样本估计的人口参数(如两组之间的平均差)的取值范围。 区间的计算方法是,如果我们多次重复研究,一定百分比的区间(由置信度决定,通常为 95%)将包含真实的人口值。
相反,P 值是在样本数据和假设零假设正确的情况下,零假设(如组间无差异)为真的概率。 小的p 值(通常小于 0.05)通常用来拒绝零假设,并表明有证据表明组间存在差异。
然而,P 值只能对能否拒绝零假设提供二元答案。 它没有提供任何关于效应大小或精确度的信息,也没有说明在更大的人群中发生这种效应的可能性有多大。 这就是置信区间更有用的地方。 通过提供效果值的范围,置信区间可以更清楚地说明治疗对结果的预期改变程度,以及该估计值的不确定性有多大。 此外,置信区间有助于避免过度解读显著的 p 值,因为具有统计学意义的结果并不一定意味着效果具有实际或临床意义。 效应大小可以帮助您做出判断。
总之,置信区间能更全面、更细致地反映研究结果,而p 值只能对统计显著性问题提供二元答案。
喜欢你正在学习的东西吗?
购买物理治疗师评估全书
- 600 多页电子书
- 互动内容(直接视频演示、PubMed 文章)
- 最新研究得出的所有特殊测试的统计值
- 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- 还有更多!