Ellen Vandyck
Tutkimuspäällikkö
Vuonna 2014 Dohan sopimuskokouksen asiantuntijapaneeli kehitti kliinisen luokittelujärjestelmän. Luokittelujärjestelmän julkaisivat Weir et al. (2015), ja se on löytänyt tiensä urheilijoiden ja nivusvammojen parissa työskentelevien lääkäreiden ulottuville kaikkialla maailmassa. Koska nivusvammojen luokittelujärjestelmää käytetään usein, on varmistettava, että sen luotettavuus on riittävä. Tätä pyrittiin tutkimaan tässä asiakirjassa.
Dohan sopimuspaneeli määritteli neljä nivuskivun kliinistä yksikköä: adduktiokipu, iliopsoas-kipu, inguinaalikipu ja häpykipu. Näiden lisäksi määriteltiin myös lonkkaan liittyvät syyt nivuskivulle ja muut syyt.
Tässä tutkimuksessa tutkittiin luokittelujärjestelmän käytön luotettavuutta arvioijien välillä. Kirurgi ja fysioterapeutti tutkivat itsenäisesti aikuisia miesurheilijoita, joilla oli nivuskipua, joka oli alkanut vähitellen ja pahentunut harjoituksen yhteydessä tai joka oli alkanut äkillisesti ja jatkunut yli 6 viikkoa.
Puolistrukturoidun keskustelun avulla kysyttiin potilaan oireita ja vammahistoriaa. Ne perustuivat Dohan sopimuksen mukaiseen luokitukseen, mutta lääkärit saivat esittää myös muita kysymyksiä. Haastattelun lisäksi osallistujat täyttivät Kööpenhaminan lonkka- ja nivusvaivojen tulosmittarin (HAGOS) arabian kielisen version. Kyselylomakkeella mitataan oireita, kipua, päivittäistä toimintakykyä, urheilun ja vapaa-ajan toimintakykyä, osallistumista fyysisiin aktiviteetteihin sekä lonkkaan ja/tai nivusiin liittyvää elämänlaatua. Pisteet vaihtelevat välillä 0-100, ja 0 tarkoittaa äärimmäisiä lonkka- ja/tai nivusoireita.
Oireiden kartoittamisen lisäksi tehtiin kliininen tutkimus, joka koostui kivun provokaatiotesteistä (tunnustelu, vastustestit, venyttely), lonkan liikelaajuustesteistä ja lonkan impingement-testeistä (fleksio-adduktio-sisäkierto (FADIR) ja fleksio-abduktio-sulkukierto (FABER)). Näiden tietojen ja haastattelussa saatujen tietojen perusteella nivuskipu luokiteltiin Dohan sopimuksen mukaisesti. Oli mahdollista luokitella useita kliinisiä kokonaisuuksia, ja tämä oli tutkijan harkinnassa. Yksiköt asetettiin paremmuusjärjestykseen siinä tapauksessa, että nivuskivulle oli löydetty useita syitä.
Tutkijoiden välistä luotettavuutta tutkittiin Cohenin Kappa-tilastolla. Kappa-arvojen tulkinta oli seuraava:
Tähän tutkimukseen otettiin mukaan 48 nivuskipua sairastavaa miestä. Kahdeksallatoista potilaalla oli molemminpuolisia oireita, joten kaikkiaan tutkittiin 66 puolta. Nivuskivun neljän kliinisen yksikön osalta tutkijoiden välinen luotettavuus oli kohtalainen adduktoreihin liittyvän kivun osalta, kohtalainen iliopsoas- ja inguinaalikivun osalta ja vähäinen häpyluun liittyvän nivuskivun osalta (Kappa dikotomisen asteikon tulkinnan mukaan).
Kun nivuskivun useiden syiden tunnistamisen yhteydessä kliiniset yksiköt asetettiin alenevaan järjestykseen niiden kliinisen merkityksen mukaan, Kappa-arvot osoittivat huomattavaa luotettavuutta adduktoreihin ja iliopsoasiin liittyvien kipujen osalta, kohtalaista luotettavuutta nivusiin liittyvien kipujen osalta ja vähäistä luotettavuutta häpyluuhun liittyvien kipujen osalta. Tämä näkyy ordinaaliasteikon Kappa-arvojen tulkinnassa.
Seitsemällä 48 osallistujasta diagnosoitiin vain yksi kliininen kokonaisuus. Tässä tapauksessa sokkoutettujen tutkijoiden välinen yksimielisyys oli 100 %. Suurimmalla osalla tutkimukseen osallistuneista oli kuitenkin luokiteltu nivuskipua aiheuttavaksi useampi kuin yksi kliininen tekijä, ja tutkijoiden välinen yksimielisyys oli tältä osin paljon vähäisempää. Tutkijat olivat yhtä mieltä samasta luokitusyhdistelmästä 29 prosentissa ja 23 prosentissa tapauksista.
Nivusvammojen diagnosoinnissa näyttää olevan paljon vaihtelua kahden tutkijan välillä. Olisiko siihen voinut vaikuttaa molempien eri ammatit (kirurgi vs. fysioterapeutti)? Vaikuttaa siltä, että Dohan luokittelujärjestelmän käyttö nivusvammojen yhteydessä ei johda siihen, että eri tutkijat tekisivät yhdenmukaisen diagnoosin. Syyt voivat osittain selittyä sillä, että nivusvammoja aiheuttaneita kliinisiä kokonaisuuksia oli mahdollista diagnosoida useita, ja sillä, että tutkijoita pyydettiin asettamaan nämä kokonaisuudet tärkeysjärjestykseen sen mukaan, miten tärkeinä he pitivät niiden kliinistä merkitystä, tärkeimmästä vähiten tärkeään. Nämä sijat analysoitiin ordinaalimuuttujina, mikä tarkoittaa, että järjestyksellä on merkitystä. Kun kliininen luokitus oli luokiteltu sellaisenaan, tutkijat olivat suuremmassa määrin samaa mieltä.
Taulukosta 1 käy ilmi, että kolmasosalle osallistujista ei tehty toisen tutkijan suorittamaa tutkimusta samana päivänä. 13 %:lla se tehtiin 1-2 päivän kuluttua, 15 %:lla 3-5 päivän kuluttua ja 6 %:lla 6-7 päivän kuluttua. Tässä olisi voinut olla hyviä ja huonoja puolia. Toisen tutkimuksen viivästyminen olisi voinut vaikuttaa tutkijoiden väliseen sopimukseen, koska oireet olisivat voineet muuttua. Toisaalta uusintatutkimuksen välttäminen samana päivänä on saattanut rajoittaa provosoitumista ja oireiden pahenemista toisen tutkimuksen aikana.
Artikkelissa todettiin seuraavaa: "Molemmat sokeat tutkijat olivat yhtä mieltä samasta luokituksesta/luokitusten yhdistelmästä 14/48 (29 %) osallistujalla ja 15/66 (23 %) puolella". Tutkijat olivat siis alle kolmanneksessa tapauksista yhtä mieltä nivusvamman syystä. Kun määritettiin vain yksi nivuskivun kliininen yksikkö, yhteisymmärrys oli 100 %, mutta vain seitsemällä 48 osallistujasta oli yksipuolisia oireita ja vain yksi kliininen yksikkö. Näyttää ilmeiseltä, että selkeämmissä kliinisissä kuvissa yhteisymmärrys on paljon suurempi kuin silloin, kun nivusvamman ajatellaan johtuvan eri ongelmista. Ihmettelen kuitenkin, miten on mahdollista, että hyvin yksityiskohtaisessa luokittelujärjestelmässä on niin paljon päällekkäisyyksiä. Selitetään, että tutkija saattoi luokitella vamman, vaikka kaikki kriteerit eivät täyttyneet. Kuulen kyllä, mitä mieltä olet luokittelun hyödyllisyydestä. Kun analysoitiin vain ne vammat, jotka täyttivät kaikki luokitusjärjestelmän kriteerit, luokittelijoiden välinen yksimielisyys parani.
Miksi he eivät siis noudattaneet luokitusjärjestelmän "sääntöjä"? Dohan luokitus jättää tulkinnanvaraa, kuten kirjoittajat kuvaavat: "Esimerkiksi iliopsoasiin liittyvän nivuskivun määritelmä ("iliopsoasien arkuus ja todennäköisemmin kipu lonkan vastakkaisessa taivutuksessa ja/tai kipu lonkan taivutuslihaksia venytettäessä") sallii huomattavan paljon yksilöllisiä tulkintoja tutkijalle. Jos urheilijalla on lieviä sekundaarisia oireita, jotka ilmenevät iliopsoas-palpaatiotestin aikana, mutta eivät venytys- tai vastustestien aikana, yksi tutkija voi luokitella tämän iliopsoas-lihakseen liittyväksi nivuskivuksi, mutta toinen ei. Tämä on saattanut johtaa erilaisiin tulkintoihin ja sen seurauksena alhaisempaan yksimielisyyteen. Toisaalta kannustan teitä pysymään kriittisenä ja välttämään ruutujen ruksimista kliinisessä tutkimuksessa. Kliininen päättely on edelleen tärkein osa diagnostiikkaa.
HAGOS-pisteytyksestä käytettiin arabiankielistä käännöstä, mutta tämä versio on vielä validoitava. Tämä ei ole niin suuri ongelma, koska pistemäärää käytettiin vain kuvaamaan osallistujien perusominaisuuksia.
Näiden tulosten tulkinnassa on tärkeää, että molemmat tutkijat kuuluivat asiantuntijaryhmään, joka oli mukana kehittämässä tässä tutkimuksessa käytettyä nivusvammojen Dohan luokitusjärjestelmää. Heillä oli kliinistä asiantuntemusta tällä alalla. Tämä saattaa rajoittaa tulosten yleistettävyyttä vähemmän kokeneisiin arvioijiin. Se on myös voinut aiheuttaa tulosten vääristymistä, koska tulokset on voitu muotoilla hieman eri tavoin. Tämä käy ilmi esimerkiksi siitä, kun kirjoittajat sanovat, että luotettavuus vaihtelee vähäisen ja huomattavan välillä. Tämä pätee kuitenkin, kun tarkastellaan ordinaalitietoja (kun eri kliiniset kokonaisuudet asetetaan paremmuusjärjestykseen niiden kliinisen merkityksen mukaan). Kun tarkastelemme kuitenkin nimellisiä tietoja (kun nivuskivun eri syiden tärkeyttä yhden potilaan kohdalla ei ole asetettu paremmuusjärjestykseen), huomaamme, että arvioijien välinen luotettavuus vaihtelee vähäisestä kohtalaiseen. Tässä näet esimerkin siitä, miten tulokset on joskus muotoiltu hieman eri tavalla. Nämä kirjoittajat ovat osallistuneet tämän luokituksen kehittämiseen ja haluavat ilmeisesti hyvän tuloksen. Olisi ollut parempi, että tämän tutkimuksen olisivat tehneet riippumattomat arvioijat, jotka eivät osallistuneet asiantuntijapaneeliin, tai vähemmän kokeneet tutkijat. Mutta tämä voi tietysti tapahtua vielä tulevaisuudessa.
Taulukosta 2 käy ilmi, että häpyyn, lonkkaan ja muihin syihin liittyvien syiden esiintyvyys oli suhteellisen alhainen. Kappa-arvoon vaikuttaa kuitenkin tilan yleisyys. Tämän vuoksi häpyluun, lonkkaan ja muihin nivuskivun syihin liittyvät tulokset voivat olla epätarkkoja. Mitattu harhaindeksi kertoo, missä määrin arvioijat ovat eri mieltä myönteisten tai kielteisten tapausten osuudesta. Kun puolueellisuus on suuri, se tarkoittaa, että arvioijat ovat enemmän eri mieltä. Tämä voi johtaa kappa-arvon yliarviointiin.
Tässä tutkimuksessa tutkittiin nivusvammojen Dohan luokitusjärjestelmän luotettavuutta arvioijien välillä. Tulokset osoittavat, että molempien tutkijoiden välinen yksimielisyys oli hyvä, kun nivuskivun syy tunnistettiin vain yksi. Jos on olemassa useita kliinisiä kokonaisuuksia, luotettavuus oli paras, kun se asetettiin paremmuusjärjestykseen vamman koetun kliinisen merkityksen mukaan nivusvaivojen, nivusluun ja suolilihaksen aiheuttaman nivuskivun osalta, mutta ei häpyluuhun, lonkkaan tai muihin nivuskivun syihin liittyvien kipujen osalta. Voidaan sanoa, että asiantuntijatkaan eivät aina olleet samaa mieltä, vaikka he käyttivät tiukasti Dohan sopimuksessa ehdotettuja kliinisiä kriteerejä. Ehdotan siis, että tutustut kriteereihin ennen niiden käyttöä. On myös parempi dokumentoida havainnot selkeästi, jotta voit paremmin verrata päätöksiäsi toiseen kollegaan ja perustella diagnoosisi paremmin.