초보자를 위한 민감도, 특이도, 예측값 및 확률 비율

통계는 물리학과 학생들에게 가장 혼란스러운 주제 중 하나입니다. 아마도 이것은 우리가 수학에 대한 관심보다 사람과 건강에 대한 관심이 더 많기 때문일 것입니다.
환자를 제대로 평가하고, 잘 다루고, 최신 치료법에 더 관심이 있다는 것은 이해하지만, 전체 마취 과정에서 환자에게 묻는 질문의 유병률, 검사 전 및 검사 후 확률에 대한 특수 검사의 통계 값과 짝수 숫자를 알아야한다고 말해야합니다!
위에서 언급한 숫자에 대한 지식이 없으면 환자에게 묻는 특정 질문(및 그에 대한 답변)에 얼마나 많은 가치를 부여할 수 있는지 전혀 알 수 없으며, 양성 또는 음성 결과가 무엇인지 실제로 알지 못한 채 특수 검사를 수행하게 될 것이라고 감히 말씀드리고 싶습니다.
물리치료사가 반월상 연골판 병변에 대한 테살리 검사와 같은 특수 검사를 시행한 결과 양성이었고, 그 후 환자에게 반월상 연골판 병변이 있다고 100% 확신했다는 소식을 보거나 들을 때면 마음이 찡해집니다!
제발 그만하세요!
그렇기 때문에 더 나은 의사가 되기 위해 통계를 사용할 수 있는 방법과 사용해야 하는 방법, 그리고 그러한 지식이 임상 추론 과정에 대한 인식을 어떻게 향상시키는지에 대한 통찰력을 제공하기 위해 노력하는 제 글을 계속 읽어 주시기 바랍니다!
일반적으로 선별 검사부터 시작하여 기억상실증 검사, 기본 평가 순으로 진행됩니다. 앞서 언급한 부분에서 얻은 정보를 바탕으로 확인하거나 거부하고 싶은 가설을 세웁니다. 바로 이 지점에서 감도와 구체성이 중요한 역할을 합니다. 먼저 감도와 특이성이 무엇인지 살펴 보겠습니다! 가장 쉬운 방법은 얼마 전에 제작한 짧은 동영상을 시청하는 것입니다:
다시 요약하면 다음과 같습니다: 100% 민감도 검사에서 음성 결과가 나오면 질병을 배제할 수 있고(SnNOut), 100% 특이도 검사에서 양성 결과가 나오면 질병을 배제할 수 있습니다(SpPIn).
100% 민감도 검사에서 음성 결과가 나오면 질병을 배제할 수 있고(SnNOut), 100% 특이도 검사에서 양성 결과가 나오면 질병을 배제할 수 있습니다(SpPIn).
두 개의 니모닉인 SnNOut과 SpPIn을 사용하면 이 두 가지 개념을 비교적 쉽게 실천할 수 있습니다.
대부분의 경우 2×2 표를 사용하여 이러한 값을 계산할 수 있다면 그 정의와 실제 값을 더 잘 파악할 수 있습니다. 다음 동영상에서는 계산 부분을 수행하는 방법을 보여 드리겠습니다:
안타깝게도 현실에서는 100% 정확한 테스트가 거의 없기 때문에 위양성 및 위음성 결과가 많이 나올 수 있습니다. 또한 민감도와 특이도는 이미 질병이 있는 것으로 알려진 환자에서 검사가 얼마나 자주 양성으로 나오는지 알려줍니다. 하지만 실제로는 환자에게 특정 질환이 있는지 여부를 알 수 없습니다. 실제로 우리가 하는 일은 양성 또는 음성 테스트 결과를 해석하는 것입니다.
일반적으로 환자가 실제로 질병에 걸렸을 확률이 얼마나 되는지, 환자가 질병에 걸리지 않았을 확률이 얼마나 되는지, 결과가 부정적일 확률이 얼마나 되는지 알 수 없습니다.
이러한 값을 양의 예측값(PPV)과 음의 예측값(NPV)이라고 하며, 테스트 후 확률이라고도 합니다. 2×2 표를 사용하여 이러한 값을 설명하고 이러한 값을 계산하는 방법을 보여주는 또 다른 동영상이 있습니다:
동영상에서 언급했듯이, 환자 그룹의 유병률을 잘 알고 있고 이 유병률이 애초에 특정 테스트에 대한 통계 값을 얻은 RCT의 유병률과 동일한 경우 PPV와 NPV는 훌륭한 도구입니다. 그렇지 않으면 PPV와 NPV는 거의 쓸모가 없게 됩니다.
다양한 설정에서 전방십자인대(ACL) 파열의 검사 전 확률이 어떻게 달라지는지 상상해 보세요: 예를 들어, 일반 진료소에서 ACL 파열 환자의 유병률은 무릎 부상을 전문으로 하는 스포츠 클리닉보다 훨씬 낮을 것입니다. 유병률이 높을수록 PPV는 높아지고 NPV는 낮아집니다.
향후 이에 대한 영상도 제작할 예정이지만, 가능성 비율을 고려할 때 PPV와 NPV보다 더 나은 가치가 필요하다는 점을 기억하는 것이 중요합니다.
가능성 비율은 민감도와 특이도를 모두 결합한 것으로, 특정 검사 결과가 해당 질환이 있는 사람에게서 나타날 확률을 질환이 없는 사람에게서 나타날 확률과 비교하여 알려줍니다. 다음 동영상에서 가능성 비율과 이를 계산하는 방법에 대해 알아보세요:
이 예에서는 임상에서 가장 정확한 검사 중 하나인 라크만 테스트를 사용했지만, 우리가 가장 사랑하는 테살리 테스트와 그 예가 어떻게 작동하는지 살펴 보겠습니다:
Goossens 등에 따르면 (2015)에 따르면 테살리 테스트의 민감도는 64%, 특이도는 53%이며 LR+는 1,36, LR-는 0,68입니다. 이미 보시다시피, 이 값은 LR = 1에 매우 가깝기 때문에 반월상 연골판 병변이 있을 확률이 거의 변하지 않는다는 것을 알 수 있습니다. 이러한 값을 ACL 파열 사례에 적용하기 위해 ACL 파열은 반월상 연골 파열을 동반하는 경우가 많다는 것을 알고 있습니다. 환자가 잠기거나 걸리는 감각을 보고하지는 않았지만, 테스트 전 확률을 약 30%로 추정합니다.
노모그램은 다음과 같습니다:
(보다 정확한) 계산에 따르면 테스트 후 확률은 다음과 같습니다:
- 테스트 전 확률: 유병률/(1-유병률) = 0,3/(1-0,3) = 0,43
- 테스트 후 확률(LR+): 0,43 x 1,36 = 0,58
- 테스트 후 확률(LR+): 테스트 후 확률 / (테스트 후 확률+1) = 0,58/(0,58+1) = 0,37 (따라서 37%)
- 테스트 후 확률(LR-): 0,43 x 0,68 = 0,29
- 테스트 후 확률(LR-): 테스트 후 확률 / (테스트 후 확률+1) = 0,29/ (0.29+1) = 0,22(22%)
따라서 테살리 검사 양성인 경우, 남성 병변이 있을 확률은 30%에서 37%로 증가했고, 테살리 검사 음성인 경우, 22%로 감소했습니다.
사람들이 검사를 시행한 후 환자가 특정 질환에 확실히 걸렸다거나 걸리지 않았다고 가정하면 왜 내가 겁을 먹게 되는지 알겠어요?! 그리고 이 모든 것은 대부분의 사람들이 고려하지 않는 사전 테스트 확률을 가정한 것입니다!
여러 테스트를 수행하려는 경우, 예를 들어 ACL 예제에서 전방 서랍 테스트를 추가하려는 경우 사전 테스트 확률은 라크만 테스트의 테스트 후 확률을 기준으로 합니다. 따라서 라크만이 양성인 경우 테스트 전 확률이 95%이고, 라크만이 음성인 경우 테스트 전 확률이 19%인 상태에서 시작합니다.
대부분의 테스트는 양성 또는 음성 결과가 나오지만, 여러 결과가 나오는 테스트 클러스터도 있습니다. 예를 들어 라슬렛 클러스터를 예로 들면, 5회 검사 중 2회 양성인 경우 LR+ 2.7, 3회/5회 양성인 경우 LR+ 4.3 등의 결과가 나옵니다.
하지만 사전 검사 확률이 매우 높으면 다른 검사는 거의 의미가 없으므로 치료를 시작하는 것이 좋습니다. 검사 전 확률이 매우 낮은 경우에도 마찬가지이며, 이 경우 검사를 하지 않고 질환을 치료하지 않습니다.
예를 들어, 갑작스러운 요통, 양쪽 다리의 신경학적 증상, 배뇨 및 안장 마취 문제 등을 호소하는 환자가 있다면, 이 환자는 위험 신호이며 긴급 수술이 필요한 종아리 증후군을 의심해 볼 수 있습니다. 따라서 진단이 99% 확실하다고 가정할 때, LR-가 0.2인 직선 다리 검사(SLR)는 검사 후 확률을 95%로 낮추지만 여전히 매우 높으므로 이 환자를 수술로 보내야 합니다.
검사 결과가 양성으로 나오면 99%에서 100% 확신할 수 있는데, 특히 긴급한 수술 의뢰인 경우라면 애초에 왜 굳이 검사를 할 필요가 있을까요?
사전 테스트 확률이 매우 낮은 경우에도 마찬가지입니다. 무릎 아래 방사통 없이 내원하는 환자의 경우, 이 환자가 디스크 탈출증으로 인한 방사통 증후군일 가능성은 5%라고 가정하면 매우 낮습니다. 그렇다면 이 경우 LR+가 2.0인 SLR을 수행하면 어떻게 될까요? 테스트 후 확률은 10%가 되고, 테스트가 음성인 경우 테스트 후 확률은 4%로 감소합니다. 그렇다면 환자가 특정 질병에 걸리지 않았다는 것이 거의 확실하다면 애초에 왜 검사를 할까요?
물론 실제로는 비용, 질병의 심각도, 검사의 위험성 등 다양한 요인에 따라 특정 검사를 실시할지 여부가 결정됩니다.
이제 제가 처음에 주장한 내용으로 돌아가서, 통계 수치는 환자 병력 조사 시 질문의 결과를 평가하는 데 도움이 된다는 점을 다시 한 번 말씀드리겠습니다.
실제로 모든 질문은 답변(예 또는 아니오)에 따라 환자가 특정 질환에 걸릴 확률이 높아지거나 낮아지는 특수 검사로 볼 수 있습니다. 이것은 또한 환자의 답변을 바탕으로 가설을 세우는 방법을 아는 훌륭한 임상의라면 기본적으로 일련의 특수 검사를 연속적으로 수행하기 때문에 철저한 기억 상실이 특수 검사보다 대부분의 경우 더 중요한 이유이기도합니다 (
).
다른 예를 들어 보겠습니다: 코르티코스테로이드의 장기간 사용에 대한 질문에 대한 긍정적인 답변이 척추 골절 가능성에 어떤 영향을 미치나요?
에 따르면 Henschke et al. (2009)에 따르면 코르티코스테로이드를 장기간 사용하면 LR+가 48.5로 양수입니다. Willi에 따르면 1차 의료기관에 내원하는 척추 골절의 유병률(검사 전 확률)은 1%-4% 사이로 추정할 수 있습니다.ams et al. (2013) 요통이 있는 환자를 대상으로 한 연구입니다.
따라서 코르티코스테로이드를 장기간 사용하면 이 예제 계산에서는 유병률을 1%로 가정했지만 테스트 후 확률은 33%가 됩니다.
코르티코스테로이드에 대한 이 질문은 척추 골절 검사 과정에서 항상 물어봐야 한다고 생각한다!
이제 요통 환자의 악성 종양 선별 검사에 일반적으로 사용되는 또 다른 위험 신호를 살펴 보겠습니다: 교활한 요통의 시작.
에 따르면 Deyo et al. (1988년, 꽤 오래된 연구임을 인정합니다), 이 질문에 대한 LR+는 1.1입니다. Henschke 등(2009)에 따르면 요통 환자의 악성 종양 유병률은 1%보다 훨씬 낮지만, 간단하게 계산하기 위해 이 1%로 계산해 보겠습니다.
따라서 적신호 교활한 발병은 요통의 원인으로 검사 후 악성 종양의 확률을 1 %에서 정확히 1,1 %로 증가시킵니다. 이 위험 신호가 나열된 모든 가이드라인에서 삭제되어야 한다는 데 동의할 수 있을 것 같습니다.
긴 글이지만 여기까지 읽어주셨다면 축하와 존경을 표합니다! 저의 목표는 민감도, 특이도, PPV, NPV, 특히 확률비와 같은 통계 값을 다루는 방법에 대해 설명하고 전체 물리 치료 프로세스에서 이러한 통계 값의 중요성을 인식하도록 하는 것이었습니다.
미래의 환자에게 특정 가설의 유병률을 고려하고, 기억상실 질문이 사전 테스트 확률에 미치는 영향에 대한 아이디어를 얻고, 특수 테스트의 힘을 제대로 평가할 수 있다면 환상적일 것입니다.
이 블로그 게시물이 도움이 되었다면 댓글로 자유롭게 질문하고 공유해 주세요!
읽어주셔서 감사합니다!
Kai
참조
카이 시겔
피지오튜터스의 CEO 겸 공동 설립자
받은 편지함의 새 블로그 기사
지금 구독하고 최신 블로그 글이 게시되면 알림을 받아보세요.