엘렌 밴디크
연구 관리자
2014년에 도하 합의 회의의 전문가 패널이 임상 분류 시스템을 개발했습니다. 분류 체계는 다음 기관에서 발표했습니다. Weir et al. (2015)를 통해 전 세계 운동선수와 사타구니 부상을 치료하는 임상의에게 다가갈 수 있는 길을 찾았습니다. 사타구니 부상에 대한 분류 체계는 자주 사용되기 때문에 신뢰성이 적절한지 확인해야 합니다. 이 논문이 연구하고자 하는 바가 바로 그것입니다.
도하 합의 패널은 사타구니 통증의 임상적 실체를 내전근 관련, 장요근 관련, 사타구니 관련, 음모 관련 등 4가지로 정의했습니다. 이 외에도 사타구니 통증의 고관절 관련 원인 및 기타 원인도 정의되었습니다.
이 연구는 분류 시스템 사용의 평가자 간 신뢰도를 조사하기 위해 마련되었습니다. 외과의사와 물리치료사가 사타구니 통증이 서서히 시작되어 운동으로 악화되거나 갑자기 시작되어 6주 이상 지속되는 남성 성인 운동선수를 독립적으로 조사했습니다.
반구조화된 대화를 사용하여 환자의 증상과 부상 이력을 질문했습니다. 이는 도하 협정 분류에 근거한 것이지만, 임상의들은 다른 질문도 할 수 있었습니다. 인터뷰에 이어 참가자들은 코펜하겐 고관절 및 사타구니 결과 점수(HAGOS)의 아랍어 버전을 작성했습니다. 이 설문지는 증상, 통증, 일상 생활에서의 기능, 스포츠 및 레크리에이션에서의 기능, 신체 활동 참여, 고관절 및/또는 사타구니 관련 삶의 질을 측정하기 위해 고안되었습니다. 점수의 범위는 0~100점이며 0점은 극심한 엉덩이 및/또는 사타구니 증상을 나타냅니다.
증상의 목록화와 함께 통증 유발 검사(촉진, 저항 검사, 스트레칭), 고관절 운동 범위 검사, 고관절 충돌 검사(굴곡-외전-내회전(FADIR) 및 굴곡-외전-외회전(FABER))로 구성된 임상 검사를 실시했습니다. 이 정보와 인터뷰를 통해 얻은 정보를 사용하여 사타구니 통증은 도하 협정에 따라 분류되었습니다. 여러 임상 개체를 분류할 수 있었으며 이는 심사자의 재량에 따라 결정되었습니다. 사타구니 통증의 원인이 여러 가지로 확인된 경우 순위를 매겼습니다.
시험관 간 신뢰도는 코헨의 카파 통계를 사용하여 연구했습니다. 카파 값의 해석은 다음과 같습니다:
사타구니 통증이 있는 남성 48명이 이 연구에 참여했습니다. 그 중 18명은 양측성 증상을 보였기 때문에 총 66명의 양측을 검사했습니다. 사타구니 통증의 4가지 임상 항목에 대해 검사자 간 신뢰도는 내전근 관련은 보통, 장요근 관련 및 사타구니 관련은 보통, 음모 관련 사타구니 통증은 약간(이분법적 척도 해석에 따른 카파)인 것으로 나타났습니다.
사타구니 통증의 원인이 여러 가지인 경우, 임상적 중요도가 높은 순서대로 순위를 매겼을 때 내전근과 장요근 관련은 상당한 신뢰도, 사타구니 관련은 보통의 신뢰도, 음모 관련은 약간의 신뢰도를 나타냈습니다. 이는 서수 척도의 카파 값 해석에서 확인할 수 있습니다.
48명의 참가자 중 7명에게서 단 1명의 임상 개체만 진단되었습니다. 여기서 블라인드 심사자 간의 일치율은 100%였습니다. 그러나 대부분의 참가자는 사타구니 통증을 유발하는 임상적 실체가 1개 이상인 것으로 분류되었으며, 검사자 간 일치도는 훨씬 낮았습니다. 심사관들은 29%와 23%의 양측에서 동일한 분류 조합에 동의했습니다.
사타구니 부상에 대한 진단은 두 명의 검사자 간에 많은 차이가 있는 것으로 보입니다. 두 사람의 다른 직업(외과의사와 물리치료사)이 영향을 미쳤을까요? 사타구니 부상에 대해 도하 분류 체계를 사용하면 검사자마다 진단이 균일하지 않은 것으로 보입니다. 그 이유는 사타구니 부상을 유발한 여러 임상적 실체를 진단할 수 있었다는 사실과 조사자들이 임상적 중요도에 대한 인식에 따라 가장 중요한 것부터 가장 중요하지 않은 것까지 순위를 매기도록 요청했기 때문일 수 있습니다. 이러한 순위는 순서가 중요하다는 의미에서 서수 변수로 분석되었습니다. 임상 분류가 이렇게 정해졌을 때 심사관들은 대체로 동의했습니다.
표 1에 따르면 참가자의 1/3에서 두 번째 시험관의 검사가 당일에 이루어지지 않은 것으로 나타났습니다. 13%는 1~2일 후, 15%는 3~5일 후, 6%는 6~7일 후에 시행했습니다. 이는 장단점이 있을 수 있습니다. 두 번째 검사가 지연되면 증상이 달라졌을 수 있으므로 검사자 간 합의에 영향을 미칠 수 있습니다. 반면, 같은 날 반복 검사를 피하면 두 번째 검사 시 증상이 악화될 가능성이 있습니다.
해당 기사에는 다음과 같은 내용이 명시되어 있습니다: "두 블라인드 심사자 모두 14/48(29%), 15/66(23%)의 참가자가 동일한 분류/분류 조합에 동의했습니다." 따라서 3분의 1 미만의 사례에서 사타구니 부상의 원인에 대해 검사관이 동의했습니다. 사타구니 통증의 임상적 실체를 1개만 정의했을 때는 100%의 일치도를 보였지만, 48명의 참가자 중 7명만이 일방적인 증상과 단 하나의 임상적 실체를 가지고 있었습니다. 보다 명확한 임상 사진에서 사타구니 부상이 다른 문제로 인해 발생한다고 생각되는 경우보다 동의가 훨씬 더 높다는 것이 분명해 보입니다. 하지만 어떻게 이렇게 세세한 분류 체계가 겹치는 부분이 많을 수 있는지 궁금합니다. 모든 기준이 충족되지 않더라도 심사관이 부상을 분류할 수 있다는 설명입니다. 실제로 분류의 유용성에 대해 고민하고 계신다고 들었습니다. 분류 체계의 모든 기준을 충족하는 부상만 분석했을 때 평가자 간 일치도가 향상되었습니다.
그렇다면 왜 분류 체계의 '규칙'을 지키지 않았을까요? 도하 분류는 저자가 설명한 대로 해석의 여지를 남깁니다: "예를 들어, 장요근 관련 사타구니 통증에 대한 정의("장요근 압통 및 고관절 굴곡 시 통증이 있거나 고관절 굴곡 스트레칭 시 통증이 있는 경우")는 개별 검사자의 해석에 상당한 폭을 허용합니다. 장요근 촉진 검사에서 가벼운 이차 증상이 재현되었지만 스트레칭이나 저항 검사에서는 재현되지 않은 경우, 한 검사관은 이를 장요근 관련 사타구니 통증으로 분류할 수 있고 다른 검사관은 그렇지 않을 수 있습니다. 이로 인해 해석이 달라지고 결과적으로 동의율이 낮아졌을 수 있습니다. 반면에 임상 시험에서는 비판적인 태도를 유지하고 체크박스에 체크하지 않는 것이 좋습니다. 임상적 추론은 여전히 진단 검사에서 가장 중요한 부분입니다.
HAGOS 점수의 아랍어 번역본이 사용되었지만, 이 버전은 아직 검증이 필요합니다. 이 점수는 참가자의 기본 특성을 설명하는 데만 사용되었기 때문에 큰 문제가 되지 않습니다.
이 결과를 해석하는 데 있어 중요한 점은 두 연구자 모두 이 연구에 사용된 사타구니 부상에 대한 도하 분류 체계 개발에 참여한 전문가 패널이라는 점입니다. 그들은 이 분야에 대한 임상 전문성을 갖추고 있었습니다. 따라서 경험이 적은 평가자에게는 이러한 결과를 일반화하는 데 한계가 있을 수 있습니다. 또한 결과가 약간 다르게 표현될 수 있으므로 결과에 편향이 생겼을 수도 있습니다. 예를 들어, 신뢰도가 약간의 변동과 상당한 변동 사이를 오간다는 저자의 말에서 이를 확인할 수 있습니다. 그러나 이는 서수 데이터(임상적 중요도에 따라 서로 다른 임상 개체의 순위를 매긴 경우)를 볼 때 사실입니다. 그러나 명목 데이터(환자 1명의 사타구니 통증의 다양한 원인에 대한 중요도에 순위를 매기지 않은 경우)를 살펴보면 리뷰어 간의 신뢰도가 약간에서 중간 정도까지 변동하는 것을 알 수 있습니다. 여기에서 결과가 때때로 약간 다르게 표현되는 예를 볼 수 있습니다. 이 저자들은 이 분류의 개발에 참여했으며 분명히 좋은 결과를 원합니다. 이 연구는 전문가 패널에 참여하지 않은 독립적인 검토자나 경험이 적은 연구자가 수행했더라면 더 좋았을 것입니다. 물론 앞으로도 이런 일이 발생할 수 있습니다.
표 2에 따르면 음모 관련, 고관절 관련 및 기타 원인의 유병률은 상대적으로 낮았습니다. 그러나 카파 값은 질환의 유병률에 영향을 받습니다. 따라서 사타구니 통증의 음부 관련, 고관절 관련 및 기타 원인에 대한 결과는 정확하지 않을 수 있습니다. 측정된 편향성 지수는 평가자가 긍정 또는 부정 사례의 비율에 대해 동의하지 않는 정도를 나타냅니다. 편향성이 높다는 것은 평가자의 동의하지 않는 의견이 더 많다는 것을 의미합니다. 이로 인해 카파 값이 과대평가될 수 있습니다.
이 연구에서는 사타구니 부상에 대한 도하 분류 체계의 평가자 간 신뢰도를 조사했습니다. 그 결과 사타구니 통증의 원인이 한 가지로만 확인되었을 때 두 검사자 간의 일치도가 좋았다는 것을 알 수 있습니다. 여러 임상 실체가 존재하는 경우, 내전근, 사타구니 및 장요근 관련 사타구니 통증에 대해서는 부상의 임상적 중요도에 따라 순위를 매겼을 때 신뢰도가 가장 높았지만 음부 관련, 고관절 관련 및 기타 사타구니 통증의 원인에 대해서는 그렇지 않았습니다. 도하 협정에서 제안한 임상 기준을 엄격하게 적용하더라도 전문가들조차도 항상 동의하지 않았다고 말할 수 있습니다. 따라서 사용하기 전에 기준을 숙지하는 것이 좋습니다. 또한 다른 동료와 자신의 결정을 더 잘 비교할 수 있고 진단을 더 잘 정당화할 수 있도록 발견한 내용을 명확하게 문서화하는 것이 좋습니다.
심 J, 라이트 CC. 신뢰도 연구의 카파 통계: 사용, 해석 및 표본 크기 요구 사항. Phys Ther. 2005 Mar;85(3):257-68. PMID: 15733050.