연구 EBP 및 통계 2026년 6월 1일
호프만 등 (2026)

요추 운동 조절 검사: 통계적 유의성이 반드시 임상적 성과는 아닐 때

요추 운동 조절 검사

소개

요추 운동 조절(LMC)은 만성 비특이적 요통(NSCLBP)에서 중요한 요인으로 자주 제안돼 왔고, 운동 조절 결함을 확인하기 위해 여러 검사 배터리가 개발되었습니다. 그중 하나가 Adelt 등(2021)이 제안한 검사 배터리인데, 굴곡, 신전, 회전/측굴에 대해 방향 특이적인 검사로 구성돼 있습니다. 그런데 이전 연구에서는 이 배터리의 굴곡 관련 검사가 너무 쉬워서, 실제로는 요통이 있는지와 상관없이 대부분의 사람들이 통과하더라는 점이 확인됐습니다. 그래서 자연스럽게 이런 의문이 생깁니다. 이 검사들이 운동 조절이 더 좋거나 더 나쁜 사람들을 구분할 수 있는 능력이 있는지, 아니면 요추 운동 조절이라는 개념(construct)을 측정하기에 타당한 검사인지 말이죠. 기존 검사 배터리에 굴곡 기반의 새로운 검사 4개를 추가했고, 이번 연구는 이 최신 검사들이 더 어렵기 때문에 측정 관점에서 더 유용할 수 있는지 살펴봤습니다. 다만 이 연구는 요추의움직임 조절이 요통을 유발하는지, 또는 움직임 조절을 개선하면 결과가 좋아지는지는 조사하지 않았습니다. 대신, 이 검사 자체가 만성 요통이 있는 참여자와 없는 참여자를 구분하는 데 있어 심리측정학적으로 더 나은지(즉, 더 잘 구별하는지)만을 평가했습니다.

 

방법

본 횡단면 연구에는 비특이적 만성 요통(NSCLBP)을 가진 참가자와 증상이 없는 대조군이 포함됐다. NSCLBP 환자들은 최소 3개월 이상 요통을 보고했다. 배제 기준에는 특정 척추 병변, 과거 척추 수술, 신경학적 결손, 골절, 종양, 또는 염증성 질환을 가진 사람들이 포함됐다.

인구통계와 함께 Oswestry 장애지수(ODI), 공포회피신념설문지(FABQ), Fremantle 요통 인식 설문지(FreBAQ)를 실시했다.

참가자들은 굴곡과 관련된 움직임-조절 검사 8가지를 수행했습니다.

  • Forward bend
  • 편측 무릎 폄
  • 가슴 처짐
  • 뒤로 흔들기

새로 추가된 4가지 검사는 다음과 같습니다.

  • 웨이터 보우
  • 깊은 스쿼트
  • 박스 리프트
  • 양측 무릎 신전
요추 운동 조절 검사
출처: Hoffmann 등, BMC Musculoskeletal Disorders. (2026)

 

이러한 각 검사는 표준화된 스크립트를 사용해 참가자들에게 설명했습니다. 집단 배정을 눈가림한(블라인드 처리한) 물리치료사가 실시간으로 검사의 수행을 시각적으로 평가했습니다. 검사는 주관적인 시각적 관찰에 따라 정답(정확) 또는 오답(부정확)으로 이분법적으로 판정했습니다.

 

결과

총 69명의 참가자가 포함되었으며, 그중 45명은 NSCLBP 환자였고 24명은 건강한 대조군이었다. 기준 시점에서의 자료를 비교한 결과, NSCLBP 환자들은 그렇지 않은 사람들에 비해 더 높은 신체 부담을 보고했으며, 반대로 건강한 대조군은 0~10 숫자평정척도에서 스포츠 참여에 대해 스스로 평가한 점수가 약간 더 높았다.

요추 운동 조절 검사
출처: Hoffmann 등, BMC Musculoskeletal Disorders. (2026)

 

NSCLBP 환자들은 전반적으로 증상이 비교적 경미했으며, 중앙값 기준 통증 강도는 3/10로 낮았고 평균 ODI는 7.8점이었다. 

요추 운동 조절 검사
출처: Hoffmann 등, BMC Musculoskeletal Disorders. (2026)

 

전체 참가자 기준으로, 동작의 22%가 잘못 수행된 것으로 평가됐습니다. 집단을 NSCLBP 환자와 건강한 대조군으로 나눴을 때, 영향받은 집단은 대조군(17%)에 비해 25%의 항목을 잘못 수행한 것으로 나타났습니다. 

요추 운동 조절 검사
출처: Hoffmann 등, BMC Musculoskeletal Disorders. (2026)

 

올바르게 수행된 움직임의 비율을 모니터링한 결과, 전방 굴곡은 가장 자주 정답으로 수행된 항목이었고(따라서 가장 쉬운 항목이었습니다). 정답으로 수행하기 가장 어려웠던 움직임은 박스 리프트였는데, 46%의 참가자가 이를 잘못 수행했습니다: 대조군은 37%, NSCLBP가 있는 참가자는 52%였습니다.

요추의 운동 조절 동작 각각을 NSCLBP가 있는 경우와 없는 경우로 나눠 비교했지만, 집단 간 유의한 차이는 확인되지 않았습니다. 다만 저자들은 집단 간 ‘총 정답 수행’에서 차이가 통계적으로 유의했다고 보고했습니다. NSCLBP 환자들은 평균적으로 7개 동작 중 7개 중 5개를 정확히 수행한 반면, 대조군은 7개 중 6개를 정확히 수행했습니다. 모델이 왜곡될 수 있어 보인다는 이유로, 이 분석에서는 5번 문항이 제외되었습니다. 5번 문항이 6번 문항과의 상관관계가 매우 높았기 때문입니다.

 

질문과 생각

일단 첫째로요. 통계적 유의성이 항상 임상적으로 의미 있는 것은 아닙니다. 흥미롭게도, NSCLBP가 있는 참가자와 없는 참가자 사이에서 개별 운동 조절 검사는 유의미한 차이를 보이지 않았습니다. 검사들을 합쳐 총점으로 봤을 때에야 비로소 통계적으로 유의한 차이가 나타났습니다. 이 결과는 집단 간의 작은 차이들이 누적된 것일 수도 있지만, 한 가지 운동 조절 검사만으로는 집단을 그 자체로 의미 있게 구분할 수 없었다는 점도 시사합니다. 게다가 제대로 수행된 검사가 1개 더 많았다는 차이(5개 vs. 7개 중 6개)는, 통계적으로 유의하더라도 해당 결과의 임상적 관련성에 의문을 제기합니다. 또한 운동 조절 구성 개념의 타당성이 불확실하다는 점까지 더하면, 이 결과는 NSCLBP와 연관된 운동 조절 손상에 대한 근거라기보다는, 움직임의 변이와 적응과 같은 요인과 관련된 개인 간 차이를 보여준다고 볼 수 있습니다.

흥미롭게도, 개별 검사들은 NSCLBP가 있는 참가자와 없는 참가자를 유의하게 구분하지 못했습니다. 통계적으로 유의한 결과는 항목들을 모두 합쳐 총점으로 만들었을 때에만 나타났습니다. 이는 애초부터 집단 간 차이가 크지 않은 구성(construct)을 대상으로, 측정 정밀도를 최적화하려는 시도를 하고 있는 건지에 대한 의문을 제기합니다. 개별 검사가 NSCLBP가 있는 사람과 없는 사람을 의미 있게 구분하지 못한다면, 주요 한계가 검사 자체에 있는지, 아니면 검사로 측정하려는 기반 구성에 있는지 다시 물어볼 만합니다.

이 단면 연구의 목적이 굴곡 관련 요추 운동조절 검사들의 문항 난이도를 파악하고, 검사들 간에 서로 비교하는 데 있었다는 점은 분명히 해야 합니다. 다만 동시에, 임상 진료에서 이 검사들의 목적이 갖는 의미에 대해서는 비판적으로 바라볼 필요도 있습니다. 요추 운동조절은 1990년대와 2000년대 초반에 Panjabi, Hodges, Richardson, O’Sullivan, Sahrmann 등 연구자들의 작업을 바탕으로 주로 부상한 주제입니다. 이 이론은 요통이 있는 일부 사람들에게서 요추의 움직임과 부하(하중)를 조절하는 능력이 손상돼 있을 수 있다고 제안합니다. Panjabi의 영향력 있는 척추 안정성 모델은 척추 안정성이 수동 구조(척추, 디스크, 인대), 능동 구조(근육과 힘줄), 그리고 신경 제어 시스템이 서로 상호작용한 결과라고 봤습니다. 이 모델에 따르면, 한 하위 시스템에 기능 이상이 생기면 척추 안정성을 유지하기 위해 다른 하위 시스템들이 그 기능을 보상해야 합니다. 이 개념은 근육 활성이나 움직임 패턴이 변화하면 통증이나 손상에 기여할 수 있다는 아이디어로 이어졌습니다.

이론은 일부 요통 환자에서 복횡근과 다열근의 활성화가 지연된다고 보고한 연구들 이후 상당한 인기를 얻었습니다. 이러한 결과는 척추의 심부 안정화 근육들이 최적으로 작동하지 않는다는 증거로 해석되었고, 그에 따라 정상적인 활성화 패턴을 회복하기 위한 운동조절 훈련과 ‘코어 안정성(core stability)’ 훈련이 개발됐습니다. 

하지만 시간이 지나면서, 그 이론에 대한 여러 비판이 제기됐습니다. 가장 큰 문제는 ‘정상’ 움직임이 무엇인지에 대한 명확한 정의가 없다는 점입니다. 인간의 움직임은 매우 다양하며, 건강한 사람들조차도 같은 과제를 수행하기 위해 서로 아주 다른 움직임 전략을 사용하곤 합니다. 그 결과, 움직임의 변이가 언제 기능장애로 간주돼야 하는지 여전히 불분명합니다. 테니스 선수들을 떠올려 보세요. 모두 포핸드와 백핸드를 사용해 같은 경기를 하지만, 같은 공을 쳐내기 위해서는 서로 다른 움직임 전략을 보여줄 수 있습니다. 그리고 상위 선수들 사이에서도 움직임 변이는 많이 존재합니다

그래서 많은 연구에서 요통이 있는 사람들의 움직임 차이를 확인하긴 했지만, 이 결과만으로는 인과관계를 입증할 수 없습니다. 움직임의 변화는 통증의 결과일 수도 있고, 보호적인 적응일 수도 있으며, 증상의 원인이라기보다 단순히 선호하는 움직임 전략일 수도 있습니다.

또 하나의 과제는, 운동 조절(motor control) 손상에 관한 연구 결과가 일관적이지 않다는 점입니다. 허리 통증이 있는 사람에서는 근육 활성 패턴이 지연되거나, 더 빠르게 나타나거나, 더 일찍·더 강하게 활성화되거나, 반대로 감소하는 양상이 보고되어 왔습니다. 이는 모든 환자를 특징짓는 단 하나의 운동 조절 결함이 없다는 것을 시사합니다. 그 결과, 연구자들은 허리 통증에서 나타나는 운동 조절 적응이 ‘기능 장애’로 보기보다는, 매우 다양하고 개인마다 달라진다고 주장하게 됐습니다. 또한 운동 조절 운동이 만성 요통에 효과적일 수는 있지만, 대체로 근력 운동, 걷기 프로그램, 일반 운동 같은 다른 ‘활동 기반’ 중재를 큰 차이로 앞서지는 못합니다.

제 의견으로 가장 중요한 비판은, 움직임-조절 프레임워크가 (의도치 않게) 척추에 대한 도움이 되지 않는 믿음을 강화할 수 있다는 점입니다. 환자에게 움직임 조절이 나쁘다거나, 척추가 불안정하다거나, 움직임 패턴이 잘못됐다고 설명하면 두려움, 과각성, 그리고 움직임 회피가 생길 수 있습니다. 이러한 심리적 반응 자체가 지속적인 통증과 장애와 연관됩니다. 따라서 많은 현대 연구자들은 이제 변화된 움직임 패턴을 병적인 결함이라기보다, 통증에 대한 개인의 반응, 이전 경험, 신체적 요구, 또는 믿음 같은 맥락에 따라 달라지는 적응으로 보는 시각이 커졌습니다. 그 결과, 분야의 초점은 “운동 조절 결손”을 어떻게 교정할지 묻는 것에서, 실제로 확인된 움직임 패턴이 정말로 기능장애인지, 그리고 무엇보다도 그것이 통증을 유발하는 임상적으로 의미 있는 원인인지에 대해 의문을 제기하는 쪽으로 이동했습니다.

더 큰 우려는, 운동 조절 프레임워크가 종종 ‘어떤 움직임은 정답이고 다른 움직임은 오답’이라는 전제를 깔고 출발한다는 점입니다. 움직임의 변이를 결함으로 분류해버리면, 임상가는 통증·손상·예후와 관련해 그 움직임 양상이 실제로 원인이나 예측력을 가진다는 근거가 부족한 경우에도 이를 찾아내고 교정해야 한다고 느낄 수 있습니다. 이 과정에서 정상적인 인간의 움직임 변이성이 ‘의학적 문제’처럼 보이게(의학화) 될 위험이 있습니다. 그 결과, 환자들은 상담을 마친 뒤 자신의 척추가 불안정하고, 위험에 더 취약하며, 끊임없는 의식적 조절에 의존하고 있다고 믿게 될 수 있습니다. 이런 믿음은, 실제 움직임 패턴 자체보다도 환자에게 더 큰 부담(장애)을 줄 수 있습니다.

저는 진료 현장에서 자세를 바로잡고 싶어 하는 환자들을 자주 봅니다. 다만, 이른바 ‘완벽한 자세’는 오래 유지하기가 어려워서 도움을 찾는 경우가 많죠. 대부분의 경우, ‘바로 세운 자세’가 되려는 시도는 근긴장 증가, 과도한 경계심(과각성), 움직임에 대한 두려움, 그리고 무엇보다도 절망감으로 이어지고 있습니다. 그들에게 더 자연스럽게 움직이고, 자세를 자주 바꾸며, 일어서서, 자주 걸어 보라고 말하는 것은—그들이 스스로 ‘나쁜’ 자세와 움직임이라고 규정해 온 것—에 대해 때로는 정말 놀라울 정도로 효과적인 해법이 되기도 합니다.

저자들은 굴곡과 관련된 동작 조절 검사 중 어떤 것들이 수행이 더 어려운지 조사했습니다. 하지만 이러한 검사들을 다듬기 전에, 우선 실제로 임상적으로 의미 있는 손상을 측정하는지부터 확인해야 합니다. 이 연구는 요추의 운동 조절이 시각적 관찰로 식별될 수 있는 구성개념(construct)이며, 그 손상은 만성 요통과 관련이 있다고 가정합니다. 그런데 이 가정은 여전히 논의 중입니다. 실제로 저자들 자신도, 임상적으로 평가한 lumbopelvic(요추-골반) 감각운동 조절 검사들의 타당성이 낮은 수준부터 매우 낮은 수준의 질적 근거에 의해 지지된다고 결론내린 최근 체계적 문헌고찰을 인용하고 있습니다. 기저 구성개념이 불확실하다면, 검사들의 психометр적(측정도구의 신뢰도·타당도 등) 특성을 개선하는 것만으로는 임상적 관련성이 여전히 분명하지 않은 무언가를 측정하는 데 더 잘해질 뿐일 수도 있습니다.

이 결과는 Larsson 등(2024)의 연구와도 유사합니다. 해당 연구에서는 요통이 있는 경우와 없는 경우에 따라 파워리프터의 요추-골반(루ம்ப로펠빅) 움직임-운동조절 테스트 수행에 차이가 없었습니다. 이는 임상에서 흔히 ‘운동조절 결함’으로 해석하는 것이 때로는 정상적인 움직임 변동성, 과제에 특화된 적응, 또는 기능장애가 아니라 서로 다른 움직임 전략을 반영할 가능성을 시사합니다.

또 다른 우려는, 움직임-조절 프레임워크가 임상에서 어떻게 번역되고 적용되는지입니다. 환자에게 “움직임 조절이 나쁘다”거나 “제대로 움직이지 못한다”라고 말하면, 척추가 약하고 불안정하며 늘 보호가 필요하다는 믿음을 쉽게 강화할 수 있습니다. 이런 서사는 두려움, 과도한 경계, 그리고 움직임 회피로 이어질 수 있는데, 이러한 요인들은 그 자체로 지속적인 통증과 장애와 연관돼 있습니다. 역설적이게도, 움직임이 위험하다고 믿는 것의 결과는 이른바 “잘못된” 움직임 패턴 그 자체보다 임상적으로 더 중요한 관련성을 가질 수 있습니다.

중요하게도, 이 연구는 요추 굴곡이나 물건 들기 같은 이러한 움직임이 해롭다는 것을 보여주지 않았습니다. 그런데도 이런 종류의 연구 논문은 “운동 이상”이나 척추의 통제되지 않는 움직임으로 쉽게 오해될 수 있습니다. 이는 노세보(부정적 기대) 언어에 해당하며, 의도한 것보다 환자에게 더 해로울 수 있습니다. 다만 이 내용은 실제로 환자가 겪는 경험과도 얽혀 있을 수 있습니다.

 

괴상한 이야기

저자들은 문항반응이론(Item Response Theory, IRT)이라는 심리측정 접근법을 사용했는데, 이는 서로 다른 능력 수준에서 테스트가 얼마나 정보가 있는지(얼마나 잘 측정하는지)를 평가합니다. 단순히 합격/불합격 비율을 보는 대신, IRT는 각 문항이 얼마나 어려운지, 그리고 실제로는(이 경우) 굴곡과 관련된 요추의 운동 조절이라는 잠재 특성에서 서로 다른 수준을 가진 사람들을 얼마나 잘 구별하는지를 추정합니다.

박스 리프트가 가장 어려운 항목이었고, 앞으로 굽히기가 가장 쉬운 항목이었습니다. 다만 모든 검사는 난이도 값이 음수로 나왔는데, 이는 운동 조절 능력이 평균보다 낮은 사람이라도 이를 정확하게 수행할 가능성이 충분히 합리적이라는 뜻입니다. 이는 굴곡 하위척도가 주로 낮은 수준의 능력을 겨냥하고 있으며, 고기능군에서의 미세한 결함을 식별하는 데는 활용도가 제한적임을 시사합니다.

심리측정 분석은 엄격했지만, 더 근본적인 문제는 해결할 수 없습니다. 바로 구성타당도입니다. 한 검사는 신뢰도 있을 수 있고, 통계적으로 정교하며, 문항 간 내적 일관성을 갖추더라도 임상적 관련성이 없는 것을 측정하고 있을 수 있습니다. 이 문제는 임상 요추 불안정성에 대한 Areeudomwong et al. (2020) 리뷰에서 우리가 다뤘던 것과 유사합니다. 거기서도 진단 정확도 계산은 보편적으로 합의된 골드 스탠더드가 없는 ‘구성’을 바탕으로 구축됐습니다.

또 다른 한계는, 모든 움직임 평가는 시각적 관찰에 의존했다는 점입니다. 저자들은 절차를 표준화하고 평가자를 눈가림했지만, 시각 기반 움직임 분석은 여전히 주관적입니다. 객관적인 생체역학적 측정이 없으면, 관찰된 움직임 패턴이 조절력 저하를 반영하는지, 통증과 관련된 적응인지, 정상적인 변동성인지, 아니면 단순히 선호하는 움직임 전략인지 구분하기가 어렵습니다.

 

집으로 가져갈 메시지

이 연구에서는 만성 비특이적 요통이 있는 사람들에서 무증상 대조군보다 굴곡 관련 운동 조절 검사 수행이 약간 더 나빴다고 보고했습니다. 새로 제안된 검사들, 특히 박스 리프트(box lift)와 웨이터의 벤드(waiter’s bow)는 기존 굴곡 검사보다 더 어려웠고, 검사 배터리의 심리측정적 특성도 개선했습니다. 다만 집단 간 차이는 작았으며, 단 1개 항목에서만 차이가 관찰되어 임상적으로는 관련이 없을 가능성이 큽니다. 

 

참조

호프만, A., 마이어링, L., 프랑켄슈타인, T., 샤퍼, A., & 슈바르츠, A. (2026). 만성 비특이적 요통 환자에서 굴곡 시 요추의 움직임 조절 평가를 위한 8개 검사의 항목 난이도 — 단면 연구. BMC 근골격계 질환.

요통에 대한 지식을 무료로 대폭 향상시키세요.

절대적으로 중요한 5가지 교훈 요통 환자를 더 잘 치료할 수 있는 방법을 대학에서 배우지 못합니다. 한 푼도 지불하지 않고 즉시

 

5일 무료 요통 코스