研究 头,头部/颈部 2025 年 7 月 7 日
Gül et al.,《欧洲脊柱杂志》(Eur Spine J. (2025)

颈椎神经根综合征: 手术还是教育?

颈椎神经根综合征

导言

颈椎神经根综合征是一个统称,涵盖了颈椎根性疼痛和 颈椎神经根病. 后者主要是由颈椎间盘突出引起的状况,会带来感觉和运动障碍。 颈椎根性疼痛表现为沿手臂的放射性疼痛,通常严重程度足以影响日常生活。 虽然症状通常会在六个月内得到改善,但当保守治疗无效时,就会考虑手术治疗,通常是前椎间盘切除术。 尽管根据功能和疼痛结果报告的成功率为 80-95%,但只有三分之二的患者对相关疼痛缓解的总体情况表示满意。 这凸显了优化治疗策略的持续研究需求。 启动这项 CASINO 试验的目的在于解决因椎间盘突出导致的颈椎神经根综合症患者接受手术治疗与保守治疗的长期结果差异方面的知识匮乏问题。 

 

方法

这项前瞻性队列研究于 2012 年至 2021 年在荷兰进行。 符合条件的参与者为 18 至 75 岁的成年人,他们都患有颈椎神经根综合症,其定义为至少两个月的致残性疼痛或刺痛感。 神经科医生或神经外科医生确诊,磁共振成像检查证实存在椎间盘突出并伴有椎间盘根部受压。

如果出现颈椎病(通过磁共振成像确定)或手臂轻瘫,即MRC< 4,则排除参与者。 

与神经外科医生会诊后设立手术组和保守治疗组。 与受试者讨论并平衡两种方案,在达成一致后,决定选择手术还是保守治疗。 未进行随机分组。

选择手术治疗的参试者在全身麻醉下进行了标准的前椎间盘切除术,打开后纵向韧带,为神经根和硬脑膜减压。 在椎间隙放置了一个 PEEK 骨架。 术后,参试者需住院一至两天,但术后无需进行物理治疗。 

至于保守治疗组,根据方案,由神经科医生或全科医生负责。 该组的参与者被告知了颈椎神经根病的状况和良好的预后。 我们鼓励他们恢复日常活动。 必要时,还包括使用扑热息痛、非甾体抗炎药或曲马多进行渐进式疼痛管理。 他们没有接受常规的物理治疗或软颈部项圈治疗;但是,如果患者认为有必要,可以开始接受这些治疗。 他们接受以分级激活为目标的时间表。 本组的参与者是安全网内的,这意味着如果出现进展性神经性的缺陷或疼痛变得无法忍受,患者会被转回神经外科医生处,以探索潜在的手术方案。

主要结果是手臂疼痛 VAS 量表和颈部受限指数。 这些测量分别在基线、入组后 6、12、26、38、52 和 104 周进行。 颈部受限指数转换为 100 分制,分数越高,结果越差。 最小临床重要差异(MCID)设定为 VAS 手臂疼痛减少 30%,100 分颈部疼痛指数减少 20 分。 

次要结果包括针对颈部疼痛的 VAS 量表和 EuroQol VAS(EQ-VAS),后者评估的总体健康状况从 0(可想象的最差健康状况)到 100(可想象的最佳健康状况)。

对参与者的数据进行二分法处理,以报告成功和不成功结果的分布情况。 以下临界值被视为良好结果:

  • VAS 手臂疼痛 ≤ 25
  • 颈部受限指数 ≤ 24
  • VAS 颈部疼痛 ≤ 35 
  • EQ-VAS ≥ 69

成果

共有 141 人参与了这项研究,其中 53 人接受了保守治疗,88 人选择了手术前减压。 

保守组患者的平均年龄为 54.6 岁,而手术组患者的平均年龄为 49 岁。 这一年龄差异在统计学上具有显著意义。 在保守组中,男性占 58%,而在手术组中仅占 40%。 不过,这种性别差异在统计学上并不显著。 保守组的平均体重指数(BMI)为 27.7 kg/m2,而手术组为 25.8 kg/m2,导致基线时的显著差异。 保守治疗组手臂疼痛的平均 VAS 值为 49.9/100,而保守治疗组为 60.9/100,同样产生了组间显著的基线差异。

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

第一年,保守治疗组的 VAS 手臂疼痛平均减轻了 36.9 毫米,而手术组则减轻了 43.9 毫米。 这并没有产生明显的组间差异(p = 0.858)。

保守组一年后的颈部受限指数平均降低了 13.3 点,手术组降低了 20.1 点,导致无明显差异(P=0.329)。  

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

在对 2 年(104 周)的数据进行比较时,保守治疗组的 VAS 手臂疼痛减少了 27.1 毫米,手术组减少了 41.9 毫米。 这没有产生明显的组间差异(p=0.053),尽管作者将其错误地标注为临床相关的组内差异。 组内-尽管作者将其误认为是临床相关的组内差异,因为降幅超过了预设的成功降幅 30%。

2 年后的颈部受限指数显示,保守治疗组平均降低了 12.5 点,手术组降低了 20.6 点。 保守治疗组和手术治疗组的颈部残疾指数平均值分别降低了 12.5 分和 20.6 分,差异无统计学意义(P=0.135)。

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

将VAS手臂疼痛数据进行二分后,保守治疗组87%的参与者和手术组70%的参与者报告结果良好。 保守治疗组和手术组在 2 年后分别有 70% 和 74% 的人报告结果良好。

将颈部受限指数结果进行二分法处理后发现,保守治疗组和手术治疗组分别有76%和74%的结果良好。 2 年后,保守治疗组的这一比例变为 71%,手术治疗组的这一比例变为 80%。

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

对次要结果的分析表明,虽然两组患者的 EQ-VAS 均随时间推移有所改善,但在 1 年或 2 年后两组间无明显差异(p=0.493)。 随着时间的推移,颈部疼痛的 VAS 下降幅度相同,但 2 年后发现差异显著,手术组更胜一筹(P=0.002)。 

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

问题与思考

先说第一件事。 让我印象深刻的是术语使用的不一致。 在论文以及方案中,作者交替使用了 "颈椎神经根病 "和 "颈椎神经根综合征 "这两个术语。 虽然这些术语看起来很相似,但它们并不是同义词,尽管在文献中,这些术语多次出现重叠和使用不一致的情况。 需要明确的是,颈椎神经根综合征是一个统称,颈椎神经根疼痛和颈椎神经根病都属于这个统称。 颈椎根性疼痛指的是一种疼痛状况,由颈神经根受压迫或刺激性引起,而颈椎根病指的是神经功能的丧失。 这种丧失可能源于运动或感觉,但也可能导致反射丧失。 疼痛和神经功能丧失的综合症状可称为疼痛性神经根病。 

既然明确了这一点,那么了解本出版物研究的是哪些患者群体就非常重要了。 标题指向颈神经根病,暗示该状况以神经功能丧失为特征。 摘要中提到了颈椎神经根综合征。 在受限标准中,"受限症状 刺痛"。 该术语过于宽泛,不明确。 颈椎根性疼痛引起的剧烈疼痛可能会出现受限症状。 同样,源于颈椎神经根病的运动功能丧失者也会受到受限症状的影响。 此外,由于没有提供诊断的详细资料,因此很难断定究竟纳入了哪些患者群体。 全文的重点是疼痛而非神经性的功能丧失,假设颈椎根性疼痛属于研究范围。 但这仍然是一个假设。 研究对象的定义不够明确,限制了结果的可解释性以及对特定临床亚组的适用性。 正确使用术语至关重要!

研究方法由 RCT 改为观察性队列设计。 我当然理解作者为什么选择将 RCT 改为队列研究,尤其是因为他们在招募参与者时遇到了问题。 这项研究进行了九年,时间很长,在此期间,药物领域不断进步和创新。 如果坚持原计划进行 RCT,就会导致资源浪费,招募到的样本也会很少,最终提交论文时,程序可能已经过时,最终无助于证据的积累。 然而,观察性研究容易出现偏差,因此不是最佳选择。 虽然没有具体提到参与者是在哪里招募的,但我猜测是在三级医院,因为神经科医生和神经外科医生可以确定诊断,而且神经外科医生与患者一起参与做出治疗决定。 由于这些人已经在咨询神经外科医生,这就提高了这些人已经在寻求更先进治疗的可能性,意味着他们对手术有偏好。 事实上,在 141 名符合条件的候选人中,近三分之二选择了手术治疗。 这可能意味着该研究受到了选择偏倚和治疗偏倚的影响。 因此,临床等效性仍然存在,这就为将来进行 RCT 提供了依据。 由于意大利面条图显示即使在组内也存在大量异质性,因此进行亚组分析以进一步完善应答者和非应答参与者将是有意义的。

颈椎神经根综合征
摘自:Gül 等人,Eur Spine J. (2025) Gül 等人,《欧洲脊柱杂志》(Eur Spine J. (2025)

 

在研究意大利面条图中的个体数据时,可以观察到结果中存在很大的个体间差异。 这意味着研究人群具有显著的异质性,这也反映在较大的标准偏差上。 在基线时,已经有几个因素存在差异,但有趣的是,这些差异作为协变量在分析中并不显著。 分析发现,基线差异没有明显的混杂效应,这意味着虽然各组在基线上不相等,但这些差异并不影响或预测随着时间推移的结果。 例如,体重指数的显著差异并不意味着体重指数较低的人与体重指数较高的人相比会自动获得更好的治疗效果。

作者将患者满意度与良好结果混为一谈。 在分析数据之前,确定了几个表示良好结果的分界线。 在文中,当达到其中一个临界值时,作者有时会将其称为显著结果,表示患者满意。 例如,表 4 描述了在 2 年时,70% 接受保守治疗的参与者的 VAS 手臂疼痛低于 25mm/100。 作者将此标注为成功结果,这是可以理解的。 尽管好的结果和患者满意度可能有联系,但当有人提出某个临界值时,这并不一定意味着患者认为超过这个临界值就是满意的结果。 我可以想象,如果一个人的 VAS 臂部疼痛低于 25,但颈部受限指数得分仍然很高,那么他也不会过于满意,尽管作者将其称为显示成功结果的人。 相反,患者应该参与到研究的设计中来,指出什么样的结果才是成功的,能给他们带来满意的结果。

 

跟我说说书呆子的事

该研究最初设计为随机对照试验(RCT),但途中转变为观察性队列研究。 作者解释说,这一方案偏离是必要的,因为纳入似乎具有挑战性。 在改用队列研究形式之前,先以 RCT 形式纳入了 12 名参与者。 论文中对方案偏离进行了透明的解释。

预设样本量计算要求每组纳入 100 名参与者,假定α=0.05,90% 的功率,VAS手臂疼痛减轻 15 毫米为临床相关效应,最坏情况下标准偏差为 30,并考虑到 10%的随访损失。

这里有三个方面需要讨论:

  • 颈部受限指数在方案中被指定为次要结果,但在最终出版物中却被用作主要结果测量指标。 这一事后更改带来了结果报告偏差的风险,并引发了对选择性报告的担忧。
  • MCID设定为VAS手臂疼痛减轻30%,但在功率分析中,15毫米的减轻幅度被认为与临床相关。 这是双重标准。 
  • 虽然需要 200 名参与者,但在 141 名参与者注册后,即开始注册 9 年后,研究就停止了。 因此,作者忽略了其最初的样本量计算,纳入的参与者比原计划少。 这限制了研究的有效性,并可能导致错误的阴性结果。

结果是根据 MCID 描述的,关于作者对此的解释方式有注意事项。 让我们仔细看看都说了些什么。 

  • 对于 VAS 手臂疼痛的结果,保守治疗组的疼痛在 1 年后从 49.9/100 减少到 13.0。 在 VAS 量表中,这意味着 100 毫米中的差异超过了 30 毫米,超过了 30 毫米的 MCID。 从 49.9 毫米到 13.0 毫米,减少了 74%。
  • 就结果 VAS 颈部疼痛而言,保守治疗组从 47.8 毫米减少到 21.7 毫米。 虽然这意味着减少了 54.6%,似乎超过了 MCID,但 26.1 毫米的差异低于 30 毫米的 MCID 临界值。 
  • 虽然在这篇论文中,这种曲解并没有被过分强调,以表示实际上没有差异,但这是一种常见的曲解/误导,您在阅读论文时应时刻注意。 当需要在 100 毫米的尺度上缩小 30 毫米(即 30%)时,您应始终注意将 30% 的差异表示在初始分数上而不是总分上时,将其视为与临床相关的常见扭曲图像。
  • 可以看出,减少 30% 并不是减少 30/100 分。

由于颈椎疼痛通常在手臂比在颈部更明显,因此作者将 VAS 手臂疼痛作为主要结果测量指标的优先级做得很好。 虽然随着时间的推移,两组患者的疼痛都有了明显的减轻,但手臂疼痛的减轻并没有达到显著的组间差异。 尽管两组患者的手臂疼痛都有值得肯定的减轻,但并不能因此确定一种治疗方法优于另一种治疗方法。 只有颈部疼痛的 VAS 在 2 年后达到了具有统计学意义的组间差异,有利于手术组。 但是,当人们在有这种状况时更多地抱怨手臂疼痛,而在次要结果 VAS 颈部疼痛上发现了唯一显著的组间差异,在此基础上,他们还要等 2 年才能超过保守组,这是否说明手术具有优越性呢? 我不这么认为,95% 的信心区间也支持这种想法,因为它的范围从-30.71(超过 MCID)到-7.03(大致低于 MCID)。 而在此基础上,在一项没有采用 Bonferroni 多重比较校正的研究中,唯一的显著差异是在次要结果中获得的,增加了假阳性结果的风险。 

最后,在整个研究过程中,有关患者的信息很少。 正如方法论中所写,在保守组中,虽然允许物理治疗,但没有常规处方。 出版物中没有一处提到并存治疗或药物使用。 由于全科医生和神经科医生负责患者的治疗,因此护理可能更偏向于生物医学方向。 这组试验的良好改善并不表明物理治疗咨询本身是必要的,但由于几乎没有分享细节,我们不知道教育和信息究竟是如何以生物心理社会为方向的。 谈话是以患者为中心,还是每个人都收到了相同的预制建议? 这次咨询花费了多少时间? 此外,尽管磁共振成像是诊断所必需的,但没有分享有关受影响颈椎水平的信息。 预先公布的试验方案没有澄清这些问题,主张今后进行更加透明的试验。

带回的信息

虽然作者指出手术治疗颈椎疼痛后可能会产生有益结果,但仔细检测数据后并不支持这一结论。 此外,这种队列设计也无法给出其中一种治疗方法优越性的确凿证据。

由于观察性研究无法排除常见的偏差(选择偏差、混杂偏差--例如,选择手术的患者更期望手术能 "治愈 "他们),因此可能需要进行研究性临床试验。 应首先进行试验性 RCT,以解决本研究中发现的招募病人方面的问题。

就像在这项 "神经性的颈椎 "试验中,对患者人群的描述含糊不清,让读者无法确定参与者是单纯的根性疼痛,还是已经进展为伴有神经性障碍的颈椎根病。 这种模糊性并非微不足道;无功能障碍的疼痛和有客观神经损害的疼痛对干预措施的反应往往不同。 没有明确的诊断界限,解释结果就成了一种机会游戏,这与试验的名字不谋而合。 就像转动轮盘而不知道哪个数字对应哪个临床表现一样,这种缺乏特异性的做法带来了一种方法论上的随机性,破坏了研究结果的外部有效性。

 

参考资料

Gül,A.、van Geest,S.、Kuijper,B.、van der Plas,A.A.、Steyerberg,E.和 Vleggeert-Lankamp,C. (2025). 赌场试验:椎间盘突出导致的颈椎根病患者的手术与保守治疗:前瞻性队列研究》。 欧洲脊柱杂志》。

关注希望成功治疗头痛患者的治疗师

100% 免费头痛家庭锻炼计划

为您的头痛患者下载这份免费的家庭锻炼计划。 只需 打印出来交给他们,让他们在家里做这些练习

 

头痛家庭锻炼计划
下载我们的免费APP