灵敏度、特异性、预测值和似然比傻瓜版

统计学是物理学家和物理系学生最困惑的话题之一。 这很可能是因为我们更关心人和健康,而不是数学,对吗?
好吧,我知道你对正确评估病人、良好的操作和最新的治疗方法更感兴趣,但我得告诉你,你需要知道一种特殊测试的统计值,以及在整个肛门检查过程中向病人提出问题的流行率、测试前和测试后概率的偶数!
我甚至敢说,如果不了解上述数字,你就不知道向病人提出的某些问题(以及这些问题的答案)有多大价值,你就会在不知道结果是好是坏的情况下进行特殊检查。
当我看到或听到理疗师对半月板病变进行塞萨利测试等特殊测试,结果呈阳性,而且他们事后百分之百地肯定病人有半月板病变时,我就会感到害怕!
请不要再这样做了!
因此,我建议您继续阅读我的文章,在文章中,我将尝试让您深入了解您如何以及应该如何利用统计数据成为一名更好的理疗师,以及这些知识如何提高您对临床推理过程的认识!
一般来说,您将首先接受筛查,然后是病史,接着是基本评估。 根据你在上述部分获得的信息,你正在形成你的假设,你想证实或否定这些假设。 这就是灵敏度和特异性的作用所在。 因此,让我们先来看看什么是灵敏度和特异性! 最简单的方法就是观看我们不久前制作的视频短片:
所以,我再总结一下: 敏感度为 100% 的阴性检测结果可排除疾病(SnNOut),特异性为 100% 的阳性检测结果可排除疾病(SpPIn)。
100%灵敏度检测的阴性结果可排除疾病(SnNOut),100%特异性检测的阳性结果可排除疾病(SpPIn)。
有了 SnNOut 和 SpPIn 这两个记忆法,要将这两个概念付诸实践就相对容易了。
大多数情况下,如果能使用 2×2 表格计算这些值,就能更好地掌握它们的定义和实际含义。 请观看我们的下一个视频,了解如何进行计算:
不幸的是,在现实生活中,几乎没有 100% 准确的测试,这就是为什么会出现很多假阳性和假阴性结果的原因。 此外,灵敏度和特异性还告诉我们,在我们已经知道是否患病的患者中,检测结果呈阳性的概率有多大。 但实际上,我们并不知道病人是否患有某种疾病。 在实践中,我们更愿意做的是解释阳性或阴性检测的结果。
你通常不知道患者实际患病的概率有多大,结果如何;也不知道患者未患病的概率有多高,结果如何。
这些值称为阳性预测值(PPV)和阴性预测值(NPV),也称为检测后概率。 你猜对了,我们还有一段视频,借助 2×2 表格解释这些值,并向你展示如何计算这些值:
现在,正如视频中提到的,如果您对患者群体的患病率有很好的了解,并且该患病率与 RCT 的患病率相同,那么 PPV 和 NPV 就是很好的工具。 如果不是这样,PPV 和 NPV 就会变得毫无用处。
想象一下,在不同的环境下,前十字韧带(ACL)断裂的测试前概率会发生怎样的变化: 例如,在全科诊所,前交叉韧带撕裂患者的发病率要比膝关节损伤专科运动诊所低得多。 流行率越高,PPV 就越高,NPV 就越低。
也许我们将来也会制作有关这方面的视频,但重要的是要记住,我们需要一个比 PPV 和 NPV 更好的值,这就是可能性比率发挥作用的地方。
似然比结合了灵敏度和特异性,告诉我们特定检测结果在患病人群中的可能性,以及在未患病人群中的可能性。 观看以下关于似然比以及如何计算似然比的视频:
在示例中,我们使用了拉赫曼试验,这是临床实践中最准确的试验之一,但让我们看看我们所钟爱的塞萨利试验,以及我们的示例是如何进行的:
根据 Goossens 等人的研究 (2015),Thessaly 检验的灵敏度为 64%,特异度为 53%,LR+ 为 1.36,LR- 为 0.68。 正如您已经看到的,这些值非常接近 LR = 1,这告诉我们,它们对一个人患有半月板病变的概率影响很小。 将这些数值应用到我们的前交叉韧带撕裂案例中,我们知道前交叉韧带撕裂往往伴随着半月板撕裂。 虽然我们的病人没有报告任何锁定或卡住的感觉,但我们估计测试前的概率约为 30%。
我们的示意图如下
根据(更精确的)计算结果,我们得出以下测试后概率:
- 测试前几率: 流行率/(1-流行率)= 0,3/(1-0,3) = 0,43
- 测试后几率 (LR+): 0,43 x 1,36 = 0,58
-后测概率 (LR+):后测概率 / (后测概率+1) = 0,58/(0,58+1) = 0,37 (所以是37%)
- 后测概率 (LR-): 0,43 x 0,68 = 0,29
- 后测概率 (LR-):测试后赔率/(测试后赔率+1)=0,29/(0,29+1)=0,22 (22%)
因此,如果塞萨利检测呈阳性,您患门静脉病变的几率就会从假定的 30% 提高到 37%;如果塞萨利检测呈阴性,您患门静脉病变的几率就会降低到 22%。
如果人们在做完检查后,就认为自己的病人肯定患有或不患有某种疾病,你就明白我为什么会抓狂了吧? 而这一切都建立在对测试前几率的假设之上,大多数人甚至忘了考虑这一点!
如果您想进行多项测试,例如您想在我们的前交叉韧带例子中增加前抽屉测试,那么您将根据拉赫曼测试后的概率来确定测试前的概率。 因此,在拉赫曼阳性的情况下,检测前的概率为 95%,而在拉赫曼阴性的情况下,检测前的概率为 19%。
虽然大多数测试的结果要么是积极的,要么是消极的,但也有一些测试群具有多种结果。 因此,如果以 Laslett 群组为例,5 个阳性测试中有 2 个的 LR+ 为 2.7,3/5 的 LR+ 为 4.3,等等。
但要注意的是,如果检测前的概率非常高,再做一次检测的价值不大,最好还是开始治疗。 如果检测前的概率很低,则不进行检测,也不对病情进行治疗。
举例来说,如果一名患者突然出现腰痛、双腿神经症状、排尿困难和鞍部麻醉,你就会非常肯定这名患者患有马尾综合征,这是一个危险信号,需要紧急手术治疗。 因此,如果您对自己的诊断有 99% 的把握,那么 LR- 为 0.2 的直腿测试(SLR)会将测试后的概率降低到 95%,这仍然是非常高的概率,因此您仍然希望让这位患者接受手术治疗。
反过来,如果检测结果呈阳性,您可能会从 99% 的确定性上升到 100% 的确定性,那么为什么还要首先进行检测呢,尤其是如果这是一个紧急转诊手术?
测试前概率非常低的情况也是如此。 如果患者来就诊时膝关节以下没有放射性疼痛,那么该患者因椎间盘突出症而患根性综合征的几率非常低,假设为 5%。 那么,在这种情况下,如果您使用 LR+ 为 2.0 的单反相机,会发生什么情况呢? 如果测试结果为阴性,那么测试后的概率将下降到 4%。 所以,如果你几乎可以肯定病人没有某种疾病,那为什么还要进行检测呢?
当然,在实践中,是否做某项检查总是取决于各种因素,如费用、疾病的严重程度、检查的风险等。
现在让我们回到我一开始所说的,统计值可以帮助您评估在采集患者病史时的提问结果。
事实上,每一个问题都可以看作是一个特殊的测试,其答案(是或否)都会增加或减少患者患有某种疾病的概率。 这也是为什么在大多数情况下,全面的病史分析比特殊检查更重要的原因,因为你基本上是在连续进行一系列的特殊检查,
,如果你是一个好的临床医生,知道如何根据病人的回答形成一个假设的话。
我们再举一个例子: 长期使用皮质类固醇对脊柱骨折的几率有什么影响?
根据 Henschke et al. (2009) 指出,长期使用皮质类固醇的 LR+ 为 48.5。 根据威利(Willi)的研究,初级医疗机构脊柱骨折的发病率(检测前概率)估计为 1%-4%。ams等人 (2013) 在出现腰背痛的患者中。
因此,在长期使用皮质类固醇的情况下,尽管我们在这个例子的计算中只假设了 1%的流行率,但我们最终会得出 33%的检测后概率。
我认为可以这样说,在脊柱骨折筛查程序中,应始终询问有关皮质类固醇的问题!
现在,让我们来看看另一种在腰背痛患者恶性肿瘤筛查中常用的红色信号: 腰痛来势汹汹
根据 Deyo et al. (1988我承认这是一项相当老的研究),这个问题的 LR+ 是 1.1。 根据Henschke 等人(2009 年)的研究,腰背痛患者的恶性肿瘤发病率甚至低于 1%,但为了简单起见,我们还是以 1%来计算。
因此,"隐匿性发病 "这一红旗将腰背痛的恶性病因在检测后的概率从 1%提高到 1.1%。 我想我们都同意,这面 "红旗 "应该被踢出任何列有它的准则。
我知道这篇文章很长,如果你能看到这里,我向你表示祝贺和敬意! 我的目标是向您解释如何使用灵敏度、特异性、PPV、NPV 等统计值,尤其是似然比,并让您意识到它们在整个物理治疗过程中的重要性。
如果您能在未来的病人中考虑到某种假设的流行程度,了解您的肛门问题对测试前概率的影响,并能正确评估您的特殊测试的威力,那就太棒了。
如果您觉得本博文对您有帮助,欢迎在评论中提问或分享!
感谢您的阅读!
凯
参考资料
凯-西格尔
首席执行官兼联合创始人 Physiotutors
收件箱中的新博客文章
立即订阅,最新博客文章一经发表,您就会收到通知。