Ellen Vandyck
Forskningschef
I 2014 blev der udviklet et klinisk klassifikationssystem af et ekspertpanel fra Doha-aftalemødet. Klassifikationssystemet blev offentliggjort af Weir et al. (2015) og har fundet vej til klinikere, der arbejder med atleter og lyskeskader over hele verden. Da klassifikationssystemet for lyskeskader anvendes hyppigt, skal det sikres, at pålideligheden er tilstrækkelig. Det er, hvad denne artikel havde til formål at undersøge.
Doha-aftalens panel definerede 4 kliniske enheder af lyskesmerter: adduktor-relaterede, iliopsoas-relaterede, inguinal-relaterede og pubes-relaterede. Derudover blev der også defineret hofterelaterede årsager til lyskesmerter og andre årsager.
Denne undersøgelse blev sat i værk for at undersøge pålideligheden mellem bedømmerne ved brug af klassifikationssystemet. En kirurg og en fysioterapeut undersøgte uafhængigt af hinanden voksne mandlige atleter med lyskesmerter, der var begyndt gradvist og forværret ved træning, eller som var begyndt pludseligt og havde varet mere end 6 uger.
Ved hjælp af en semistruktureret dialog blev der spurgt ind til patientens symptomer og skadeshistorie. De var baseret på Doha-aftalens klassificering, men klinikerne fik også lov til at stille andre spørgsmål. Ved siden af interviewet blev den arabiske version af Copenhagen Hip and Groin Outcome Score (HAGOS) udfyldt af deltagerne. Dette spørgeskema er designet til at måle symptomer, smerter, funktion i dagligdagen, funktion i sport og fritid, deltagelse i fysiske aktiviteter og hofte- og/eller lyskerelateret livskvalitet. Scoren går fra 0-100, og 0 repræsenterer ekstreme hofte- og/eller lyskesymptomer.
Ved siden af registreringen af symptomerne blev der foretaget en klinisk undersøgelse, som bestod af smerteprovokationstest (palpation, modstandstest, udstrækning), hoftebevægelsestest og hofteimpingementtest (fleksion-adduktion-intern rotation (FADIR) og fleksion-abduktion-ekstern rotation (FABER)). Ved hjælp af disse oplysninger og oplysningerne fra interviewet blev lyskesmerterne klassificeret ved hjælp af Doha-aftalen. Det var muligt at klassificere flere kliniske enheder, og det var op til eksaminatorens skøn. Enhederne blev rangeret i tilfælde af, at der var identificeret flere årsager til lyskesmerterne.
Pålideligheden mellem eksaminatorerne blev undersøgt ved hjælp af Cohens Kappa-statistik. Fortolkningen af Kappa-værdierne var som følger:
Otteogfyrre mænd med lyskesmerter blev inkluderet i denne undersøgelse. Atten af dem havde bilaterale symptomer, og derfor blev 66 sider undersøgt i alt. For de 4 kliniske enheder af lyskesmerter var pålideligheden mellem undersøgere rimelig for adduktorrelaterede, moderat for iliopsoasrelaterede og lyskerelaterede og lille for skamrelaterede lyskesmerter (Kappa i henhold til fortolkningen af den dikotome skala).
Når de kliniske enheder, i tilfælde af at der blev identificeret flere årsager til lyskesmerter, blev rangeret i faldende rækkefølge efter opfattet klinisk betydning, indikerede Kappa-værdierne betydelig pålidelighed for adduktorrelaterede og iliopsoas-relaterede, moderat pålidelighed for lyskerelaterede og lille pålidelighed for skamrelaterede. Dette kan ses i fortolkningen af Kappa-værdierne på den ordinale skala.
Hos syv af de 48 deltagere blev der kun diagnosticeret 1 klinisk enhed. Her var overensstemmelsen mellem de blindede undersøgere 100 %. Størstedelen af deltagerne blev dog klassificeret som havende mere end 1 klinisk enhed, der forårsagede lyskesmerterne, og overensstemmelsen mellem undersøgerne var meget lavere her. Undersøgerne var enige om den samme kombination af klassifikationer på 29% og 23% af siderne.
Der ser ud til at være stor variation i diagnosen af lyskeskader mellem to undersøgere. Kan det have været påvirket af begges forskellige professioner (kirurg versus fysioterapeut)? Det ser ud til, at brugen af Doha-klassifikationssystemet for lyskeskader ikke fører til ensartethed i diagnosen mellem forskellige undersøgere. Årsagerne kan til dels forklares med, at det var muligt at diagnosticere flere kliniske enheder, der forårsagede lyskeskaderne, og med, at undersøgerne blev bedt om at rangordne disse enheder efter deres opfattelse af deres kliniske betydning fra mest til mindst vigtig. Disse placeringer blev analyseret som en ordinal variabel, hvilket betyder, at rækkefølgen har betydning. Når den kliniske klassifikation blev rangeret som sådan, var eksaminatorerne i højere grad enige.
Tabel 1 viser, at undersøgelsen af den anden undersøger ikke blev udført samme dag hos en tredjedel af deltagerne. Hos 13% blev det udført efter 1-2 dage, hos 15% efter 3-5 dage og hos 6% efter 6-7 dage. Det kunne have haft både fordele og ulemper. En forsinkelse i den anden undersøgelse kunne have påvirket overensstemmelsen mellem undersøgerne, da symptomerne kunne have ændret sig. På den anden side kan det at undgå en ny undersøgelse samme dag muligvis have begrænset provokation og forværring af symptomerne under den anden undersøgelse.
I artiklen stod der følgende: "Begge blinde undersøgere var enige om den samme klassifikation/kombination af klassifikationer hos 14/48 (29 %) af deltagerne og 15/66 (23 %) af siderne". I mindre end en tredjedel af tilfældene var undersøgerne således enige om årsagen til lyskeskaden. Når der kun blev defineret én klinisk enhed for lyskesmerter, var overensstemmelsen 100 %, men kun 7 ud af 48 deltagere havde ensidige symptomer og kun én klinisk enhed. Det virker indlysende, at overensstemmelsen er meget højere ved mere klare kliniske billeder, end hvis man tror, at lyskeskaden skyldes forskellige problemer. Men jeg undrer mig over, hvordan det er muligt for et meget detaljeret klassifikationssystem at have så meget overlapning. Det forklares, at undersøgeren kunne klassificere skaden, selv om ikke alle kriterier var til stede. Jeg kan godt høre, at du tænker over anvendeligheden af klassifikationen. Når kun de skader, der opfyldte alle kriterier i klassifikationssystemet, blev analyseret, blev overensstemmelsen mellem bedømmerne forbedret.
Så hvorfor holdt de sig ikke til klassifikationssystemets 'regler'? Doha-klassifikationen giver plads til fortolkning, som beskrevet af forfatterne: "For eksempel giver definitionen af iliopsoas-relaterede lyskesmerter ("ømhed i iliopsoas og mere sandsynligt, hvis der er smerter ved modstået hoftebøjning og/eller smerter ved udstrækning af hoftebøjeren") mulighed for en betydelig grad af individuel fortolkning fra undersøgerens side. Hvis en atlet har milde sekundære symptomer, der gengives under en iliopsoas-palpationstest, men ikke under stræk- eller modstandstests, kan den ene undersøger klassificere dette som iliopsoas-relaterede lyskesmerter, mens den anden måske ikke gør det. Det kan have ført til forskellige fortolkninger og dermed en lavere grad af enighed. På den anden side opfordrer jeg dig til at være kritisk og undgå at afkrydse felter i din kliniske undersøgelse. Klinisk ræsonnement er stadig den vigtigste del af din diagnostiske udredning.
Der blev brugt en arabisk oversættelse af HAGOS-scoren, men denne version mangler stadig at blive valideret. Det er ikke så stort et problem, da scoren kun blev brugt til at beskrive deltagernes baseline-karakteristika.
Det er vigtigt for fortolkningen af disse resultater, at begge forskere var en del af det ekspertpanel, der var involveret i udviklingen af Doha-klassifikationssystemet for lyskeskader, som blev brugt i denne undersøgelse. De havde deres kliniske ekspertise på dette område. Det kan begrænse generaliserbarheden af disse resultater til mindre erfarne bedømmere. Det kan også have forårsaget skævheder i resultaterne, da resultaterne kan være formuleret lidt forskelligt. Det ser vi for eksempel, når forfatterne siger, at pålideligheden svinger mellem lille og stor. Det gælder dog, når man ser på ordinale data (når de forskellige kliniske enheder blev rangeret efter deres kliniske betydning). Men når vi ser på de nominelle data (hvor der ikke blev foretaget en rangordning af vigtigheden af de forskellige årsager til lyskesmerter hos en patient), ser vi, at pålideligheden mellem bedømmerne svinger fra let til moderat. Her kan du se et eksempel på, hvordan resultaterne nogle gange er formuleret lidt forskelligt. Disse forfattere har været involveret i udviklingen af denne klassifikation og ønsker naturligvis et godt resultat. Det ville have været bedre at lade denne undersøgelse blive udført af uafhængige bedømmere, der ikke var involveret i ekspertpanelet, eller af mindre erfarne forskere. Men det kan selvfølgelig stadig ske i fremtiden.
Tabel 2 viser, at forekomsten af pubesrelaterede, hofterelaterede og andre årsager var relativt lav. Kappa-værdien er dog påvirket af sygdommens udbredelse. Derfor kan resultaterne af skamrelaterede, hofterelaterede og andre årsager til lyskesmerter være unøjagtige. Det bias-indeks, der blev målt, giver en indikation af, i hvor høj grad bedømmerne er uenige om andelen af positive eller negative sager. Når bias er høj, betyder det, at bedømmerne er mere uenige. Det kan resultere i en overvurdering af kappa-værdien.
Dette studie undersøgte interbedømmernes pålidelighed af Doha-klassifikationssystemet for lyskeskader. Resultaterne viser, at der var god overensstemmelse mellem de to undersøgere, når der kun blev identificeret én årsag til lyskesmerter. Hvis der findes flere kliniske enheder, var pålideligheden bedst, når den blev rangeret efter den opfattede kliniske betydning af skaden for adduktor-, inguinal- og iliopsoas-relaterede lyskesmerter, men ikke for pubis-relaterede, hofte-relaterede og andre årsager til lyskesmerter. Man kan sige, at selv eksperterne ikke altid var enige, selv når de nøje anvendte de kliniske kriterier, som blev foreslået i Doha-aftalen. Så jeg foreslår, at du sætter dig ind i kriterierne, før du bruger dem. Det er også bedre at dokumentere dine fund tydeligt, så du bedre kan sammenligne dine beslutninger med en anden kollega, og så du bedre kan begrunde din diagnose.