De betrouwbaarheid van de Doha-overeenkomst om liesblessures te classificeren

Inleiding

In 2014 werd een klinisch classificatiesysteem ontwikkeld door een panel van deskundigen tijdens de bijeenkomst in het kader van de Doha-overeenkomst. Het classificatiesysteem werd gepubliceerd door Weir et al. (2015) en heeft zijn weg gevonden naar clinici die werken met atleten en liesblessures over de hele wereld. Omdat het classificatiesysteem voor liesblessures vaak wordt gebruikt, moet worden nagegaan of de betrouwbaarheid voldoende is. Dat is wat dit artikel wilde onderzoeken.

Methode

Het Doha-akkoordpanel definieerde 4 klinische entiteiten van liespijn: adductor-gerelateerd, iliopsoas-gerelateerd, inguinaal-gerelateerd en schaambeen-gerelateerd. Daarnaast werden ook heupgerelateerde oorzaken voor liespijn en andere oorzaken gedefinieerd.

classificatiesysteem voor liesblessures — Van: Heijboer et al., Scand J Med Sci Sports (2022)

Deze studie is opgezet om de interbeoordelaarsbetrouwbaarheid van het classificatiesysteem te onderzoeken. Een chirurg en een fysiotherapeut onderzochten onafhankelijk van elkaar mannelijke volwassen atleten met liespijn die geleidelijk begon en verergerde bij inspanning of die plotseling begon en langer dan 6 weken aanhield.

Door middel van een semigestructureerde dialoog werden de symptomen en de letselgeschiedenis van de patiënt bevraagd. Deze waren gebaseerd op de Doha-overeenkomstclassificatie, maar de clinici mochten ook andere vragen stellen. Naast het interview werd de Arabische versie van de Copenhagen Hip and Groin Outcome Score (HAGOS) ingevuld door de deelnemers. Deze vragenlijst is ontworpen om symptomen, pijn, functie in het dagelijks leven, functie in sport en recreatie, deelname aan fysieke activiteiten en heup- en/of liesgerelateerde levenskwaliteit te meten. De scores variëren van 0-100 en 0 staat voor extreme heup- en/of liesklachten.

Naast de inventarisatie van de symptomen werd het klinisch onderzoek uitgevoerd en bestond uit pijnprovocatietests (palpatie, weerstandstests, rekken), heupbereikbewegingsproeven en heupimpingementtests (flexie-adductie-interne rotatie (FADIR) en flexie-abductie-externe rotatie (FABER)). Met behulp van deze informatie en de informatie verkregen door het interview, werd de liespijn geclassificeerd aan de hand van de Doha-overeenkomst. Het was mogelijk om meerdere klinische entiteiten te classificeren en dit was ter beoordeling van de onderzoeker. De entiteiten werden gerangschikt als er meerdere oorzaken voor de liespijn waren geïdentificeerd.

De inter-onderzoeker betrouwbaarheid werd onderzocht met behulp van Cohen's Kappa statistiek. De interpretatie van de Kappa waarden was als volgt:

bijna perfect (κ = 0,81-1,00),
aanzienlijk (κ = 0,61-0,80),
matig (κ = 0,41-0,60),
redelijk (κ = 0,21-0,40),
licht (κ = 0-0,20),
en slecht (κ < 0).

Resultaten

Achtenveertig mannen met liespijn werden geïncludeerd in dit onderzoek. Achttien van hen hadden bilaterale symptomen en dus werden in totaal 66 zijden onderzocht. Voor de 4 klinische entiteiten van liespijn was de inter-onderzoekersbetrouwbaarheid redelijk voor adductor-gerelateerde, matig voor iliopsoas-gerelateerde en inguinale-gerelateerde, en licht voor schaamstreek-gerelateerde liespijn (Kappa volgens de dichotome schaalinterpretatie).

Wanneer de klinische entiteiten, in het geval er meerdere oorzaken voor liespijn werden geïdentificeerd, werden gerangschikt in afnemende volgorde van waargenomen klinisch belang, gaven de Kappa waarden een aanzienlijke betrouwbaarheid aan voor adductor-gerelateerd en iliopsoas-gerelateerd, een matige betrouwbaarheid voor inguinaal-gerelateerd en een geringe betrouwbaarheid voor schaambeen-gerelateerd. Dit is te zien in de interpretatie van de Kappawaarden op de ordinale schaal.

Bij zeven van de 48 deelnemers werd slechts 1 klinische entiteit gediagnosticeerd. Hier was de overeenkomst tussen de geblindeerde onderzoekers 100%. De meerderheid van de deelnemers werd echter geclassificeerd als met meer dan 1 klinische entiteit die de liespijn veroorzaakte en de inter-onderzoeker overeenstemming was hier veel lager. De onderzoekers waren het in 29% en 23% van de gevallen eens over dezelfde combinatie van classificaties.

Questions and thoughts

Er blijkt veel variatie te zijn in de diagnose van liesblessures tussen 2 onderzoekers. Zou het beïnvloed kunnen zijn door de verschillende beroepen van beiden (chirurg versus fysiotherapeut)? Het blijkt dat het gebruik van het Doha-classificatiesysteem voor liesletsels niet leidt tot uniformiteit in de diagnose tussen verschillende onderzoekers. De redenen kunnen gedeeltelijk worden verklaard door het feit dat het mogelijk was om meerdere klinische entiteiten te diagnosticeren die de liesverwondingen veroorzaakten en door het feit dat de onderzoekers werd gevraagd om deze entiteiten te rangschikken volgens hun perceptie van hun klinisch belang van meest naar minst belangrijk. Deze rangen werden geanalyseerd als een ordinale variabele, wat betekent dat de volgorde van belang is. Wanneer de klinische classificatie als zodanig werd gerangschikt, waren de onderzoekers het meer met elkaar eens.

Tabel 1 laat zien dat het onderzoek door de tweede onderzoeker bij een derde van de deelnemers niet op dezelfde dag werd uitgevoerd. Bij 13% werd het na 1-2 dagen uitgevoerd, bij 15% na 3-5 dagen en bij 6% na 6-7 dagen. Dit had voor- en nadelen kunnen hebben. Een vertraging in het tweede onderzoek kan de overeenstemming tussen de onderzoekers beïnvloed hebben, omdat de symptomen veranderd kunnen zijn. Aan de andere kant zou het vermijden van een herhalingsonderzoek op dezelfde dag mogelijk de provocatie en verergering van de symptomen tijdens het tweede onderzoek hebben kunnen beperken.

In het artikel stond het volgende: "Beide blinde onderzoekers waren het eens over dezelfde classificatie/combinatie van classificaties bij 14/48 (29%) van de deelnemers en 15/66 (23%) zijden". In minder dan een derde van de gevallen waren de onderzoekers het dus eens over de oorzaak van het liesletsel. Wanneer slechts 1 klinische entiteit van liespijn werd gedefinieerd, was de overeenkomst 100%, maar slechts 7 van de 48 deelnemers hadden unilaterale symptomen en slechts één klinische entiteit. Het lijkt duidelijk dat bij duidelijkere klinische beelden de overeenkomst veel hoger is dan wanneer gedacht wordt dat het liesletsel het gevolg is van verschillende problemen. Maar ik vraag me af hoe het mogelijk is dat een zeer gedetailleerd classificatiesysteem zoveel overlap heeft. Er wordt uitgelegd dat de onderzoeker de verwonding kon classificeren ook al waren niet alle criteria aanwezig. Ik hoor je inderdaad denken over het nut van de classificatie. Toen alleen de verwondingen die aan alle criteria van het classificatiesysteem voldeden werden geanalyseerd, was de interbeoordelaarsovereenkomst verbeterd.

Waarom hielden ze zich dan niet aan de 'regels' van het classificatiesysteem? De Doha-classificatie laat ruimte voor interpretatie, zoals beschreven door de auteurs: "De definitie voor iliopsoas-gerelateerde liespijn ("gevoeligheid van de iliopsoas en waarschijnlijker als er pijn is bij heupflexie met weerstand en/of pijn bij het strekken van de heupflexor") laat bijvoorbeeld een aanzienlijke mate van individuele interpretatie door de onderzoeker toe. Als een sporter milde secundaire symptomen heeft die zich voordoen tijdens een iliopsoas palpatietest, maar niet tijdens rek- of weerstandstests, kan de ene onderzoeker dit classificeren als iliopsoas-gerelateerde liespijn en de andere niet. Dit kan hebben geleid tot verschillende interpretaties en vervolgens tot minder overeenstemming. Aan de andere kant moedig ik je aan om kritisch te blijven en geen hokjes aan te vinken in je klinisch onderzoek. Klinisch redeneren blijft het belangrijkste onderdeel van je diagnostisch onderzoek.

Er werd een Arabische vertaling van de HAGOS-score gebruikt, maar deze versie moet nog worden gevalideerd. Dit vormt niet zozeer een probleem omdat de score alleen werd gebruikt om de basiskenmerken van de deelnemers te beschrijven.

Talk nerdy to me

Belangrijk bij het interpreteren van deze resultaten is dat beide onderzoekers deel uitmaakten van het panel van deskundigen dat betrokken was bij de ontwikkeling van het Doha-classificatiesysteem voor liesblessures dat in dit onderzoek is gebruikt. Ze hadden hun klinische expertise op dit gebied. Dit kan de generaliseerbaarheid van deze resultaten naar minder ervaren beoordelaars beperken. Het kan ook een vertekening in de resultaten hebben veroorzaakt, omdat de resultaten iets anders geformuleerd kunnen zijn. We zien dit bijvoorbeeld wanneer de auteurs zeggen dat de betrouwbaarheid schommelt tussen licht en substantieel. Dit geldt echter wel wanneer we kijken naar ordinale gegevens (wanneer de verschillende klinische entiteiten werden gerangschikt volgens hun klinisch belang). Als we echter kijken naar de nominale gegevens (wanneer er geen rangschikking is gemaakt van het belang van de verschillende oorzaken van liespijn binnen 1 patiënt), zien we dat de betrouwbaarheid tussen de beoordelaars varieert van licht tot matig. Hier zie je een voorbeeld van hoe resultaten soms net iets anders worden geformuleerd. Deze auteurs zijn betrokken geweest bij de ontwikkeling van deze classificatie en willen natuurlijk een goed resultaat. Het zou beter zijn geweest om dit onderzoek te laten uitvoeren door onafhankelijke beoordelaars die niet betrokken waren bij het deskundigenpanel of door minder ervaren onderzoekers. Maar dit kan natuurlijk nog steeds gebeuren in de toekomst.

Tabel 2 laat zien dat de prevalentie van schaamstreekgerelateerde, heupgerelateerde en andere oorzaken relatief laag was. De kappawaarde wordt echter beïnvloed door de prevalentie van de aandoening. Daarom kunnen de uitkomsten van schaamstreekgerelateerde, heupgerelateerde en andere oorzaken van liespijn onnauwkeurig zijn. De gemeten vertekeningsindex geeft een indicatie van de mate waarin de beoordelaars het oneens zijn over het aandeel positieve of negatieve gevallen. Als de bias hoog is, betekent dit dat de beoordelaars het meer oneens zijn. Dit kan leiden tot een overschatting van de kappawaarde.

Take home messages

Deze studie onderzocht de interbeoordelaarsbetrouwbaarheid van het Doha classificatiesysteem voor liesblessures. De resultaten geven aan dat de overeenstemming tussen beide onderzoekers goed was wanneer slechts 1 oorzaak van liespijn werd vastgesteld. In het geval dat er meerdere klinische entiteiten bestaan, was de betrouwbaarheid het grootst wanneer deze werd gerangschikt volgens het waargenomen klinische belang van het letsel voor adductor-, inguinale- en iliopsoas-gerelateerde liespijn, maar niet voor schaambeengerelateerde, heupgerelateerde en andere oorzaken van liespijn. Je zou kunnen zeggen dat zelfs de experts het niet altijd eens waren, zelfs wanneer ze strikt de klinische criteria gebruikten zoals voorgesteld in het Doha-akkoord. Ik raad je dus aan om vertrouwd te raken met de criteria voordat je ze gebruikt. Het is ook beter om je bevindingen duidelijk te documenteren zodat je je beslissingen beter kunt vergelijken met een andere collega en zodat je je diagnose beter kunt rechtvaardigen.