| 11 min læst

Sensitivitet, specificitet, prædiktive værdier og sandsynlighedsforhold for dummies

Diagnostisk validitet

Statistik er et af de mest forvirrende emner for fysioterapeuter og fysioterapeutstuderende. Det skyldes sandsynligvis, at vi bekymrer os mere om mennesker og sundhed end om matematik, ikke sandt?

Diagnostisk validitet

Jeg forstår godt, at du er mere interesseret i at vurdere din patient korrekt, god håndtering og de nyeste behandlingsmetoder, men jeg må fortælle dig, at du har brug for at kende de statistiske værdier for en særlig test og lige tal om prævalens, præ- og posttest-sandsynligheder for spørgsmål, du stiller dine patienter under hele din anamnestiske proces!
Jeg vil endda vove at påstå, at uden kendskab til de ovennævnte tal vil du ikke have nogen anelse om, hvor meget værdi du kan lægge i visse spørgsmål, du stiller din patient (og svarene på dem), og du vil udføre særlige tests uden egentlig at vide, hvad et positivt eller negativt resultat vil fortælle dig.
Når jeg ser eller hører, at en fysioterapeut udfører en særlig test som Thessaly-testen for menisklæsioner, at den er positiv, og at de bagefter er 100 % sikre på, at deres patient har en menisklæsion, får det mig til at krympe mig!
VÆR SØD AT HOLDE OP MED DET!

Derfor opfordrer jeg dig til at fortsætte med at læse mit indlæg, hvor jeg vil forsøge at give dig et indblik i, hvordan du kan og bør bruge statistik til at blive en bedre fysioterapeut, og hvordan den viden øger din bevidsthed om din kliniske ræsonneringsproces!

Generelt vil du starte med din screening, derefter din anamnese, efterfulgt af en grundlæggende vurdering. På baggrund af de oplysninger, du har fået i løbet af de ovennævnte dele, opstiller du dine hypoteser, som du enten vil bekræfte eller afvise.  Det er her, sensitivitet og specificitet kommer ind i billedet. Så lad os først se på, hvad sensitivitet og specificitet er! Den nemmeste måde er at se den korte video, vi lavede for et stykke tid siden:

Så for at opsummere det igen: Et negativt resultat i en 100 % sensitiv test kan udelukke sygdommen (SnNOut), og et positivt resultat i en 100 % specifik test kan udelukke sygdommen (SpPIn).

Et negativt resultat i en 100 % følsom test kan udelukke sygdommen (SnNOut), og et positivt resultat i en 100 % specifik test kan udelukke sygdommen (SpPIn)


Med de to huskeregler SnNOut og SpPIn er det relativt nemt at omsætte de to begreber til praksis.
For det meste får du en bedre forståelse af deres definition, og hvad de faktisk er, hvis du er i stand til at udregne disse værdier ved hjælp af en 2×2-tabel. Se vores næste video, som viser dig, hvordan du udfører beregningsdelen:

Desværre findes der i det virkelige liv næsten ingen 100 % nøjagtige tests, og derfor vil du få mange falsk-positive og falsk-negative resultater. Derudover fortæller sensitivitet og specificitet os, hvor ofte en test er positiv hos patienter, som vi allerede ved har sygdommen eller ej. I praksis ved vi dog ikke, om vores patienter har en bestemt tilstand eller ej. Det, vi i stedet gør i praksis, er at fortolke resultaterne af en positiv eller negativ test.
Man ved normalt ikke, hvor stor sandsynligheden er for, at patienten faktisk har sygdommen med et positivt udfald, og hvor stor sandsynligheden er for, at en patient ikke har sygdommen med et negativt udfald.
Disse værdier kaldes positiv prædiktiv værdi (PPV) og negativ prædiktiv værdi (NPV), også kaldet posttest-sandsynligheder. Du gættede det - vi har endnu en video, der forklarer disse værdier ved hjælp af 2×2-tabellen og viser dig, hvordan du udregner disse værdier:

Som nævnt i videoen er PPV og NPV gode værktøjer, hvis du har en god idé om prævalensen i din patientgruppe, og hvis denne prævalens er identisk med prævalensen i RCT'en, hvor du i første omgang har fået dine statistiske værdier for en bestemt test fra. Hvis det ikke er tilfældet, bliver PPV og NPV stort set ubrugelige.
Forestil dig, hvordan sandsynligheden for, at det forreste korsbånd (ACL) brister, ændrer sig i forskellige situationer: For eksempel vil forekomsten af patienter med en korsbåndsskade i en almen praksis være meget lavere end i en sportsklinik, der er specialiseret i knæskader. Jo højere prævalens, jo højere bliver din PPV og jo lavere bliver din NPV.
Måske laver vi også en video om det i fremtiden, men det er vigtigt at huske, at vi har brug for en bedre værdi end PPV og NPV, og det er her, sandsynlighedskvotienterne kommer ind i billedet.

Likelihood ratio kombinerer både sensitivitet og specificitet og fortæller os, hvor sandsynligt et givet testresultat er hos personer med tilstanden sammenlignet med, hvor sandsynligt det er hos personer uden tilstanden. Se følgende video om sandsynlighedskvotienter, og hvordan du kan udregne dem:

I eksemplet brugte vi Lachman-testen, som er en af de mest nøjagtige tests, der findes i klinisk praksis, men lad os se på vores elskede Thessaly-test, og hvordan vores eksempel udspiller sig der:
Ifølge Goossens et al. (2015) har Thessaly-testen en sensitivitet på 64 % og en specificitet på 53 %, hvilket resulterer i en LR+ på 1,36 og en LR- på 0,68. Som du allerede kan se, er disse værdier ret tæt på LR = 1, hvilket fortæller os, at de vil ændre sandsynligheden for, at en person har en menisklæsion, meget lidt. For at anvende disse værdier på eksemplet med vores korsbåndsoverrivning ved vi, at korsbåndsoverrivninger ofte ledsages af meniskoverrivninger. Selvom vores patient ikke rapporterer om nogen låsende eller fastlåsende fornemmelser, vurderer vi vores præ-test-sandsynlighed til ca. 30%.
Vores nomogram kommer til at se sådan ud:

Nomogram thessaly

Baseret på de (mere præcise) beregninger ender vi med følgende sandsynligheder for posttest:
- Odds for prætest: Prævalens/(1-prævalens) = 0,3/(1-0,3) = 0,43
- Post-test odds (LR+): 0,43 x 1,36 = 0,58
- Posttest-sandsynlighed (LR+): posttest-odds / (posttest-odds+1) = 0,58/(0,58+1) = 0,37 (altså 37 %)
- Posttest-odds (LR-): 0,43 x 0,68 = 0,29
- Post-test sandsynlighed (LR-): post-test odds / (post-test odds+1) = 0,29/ (0,29+1) = 0,22 (22%)

Så med en positiv Thessaly-test har du øget dine chancer for en mensisk læsion fra en antaget 30 % til 37 %, og med en negativ Thessaly-test har du reduceret dine chancer til 22 %.
Kan du se, hvorfor jeg flipper ud, hvis folk udfører en test og derefter antager, at deres patient helt sikkert har eller ikke har en bestemt tilstand? Og alt dette er baseret på en antagelse om oddsene før testen, som de fleste endda glemmer at tage i betragtning!

Hvis du vil udføre flere tests, for eksempel hvis du vil tilføje Anterior Drawer-testen i vores ACL-eksempel, skal du basere din præ-test-sandsynlighed på post-test-sandsynligheden for Lachman-testen. Så i tilfælde af en positiv Lachman vil du starte med en præ-test-sandsynlighed på 95%, og med en negativ Lachman vil du starte med en præ-test-sandsynlighed på 19%.
De fleste tests har enten et positivt eller negativt udfald, men der er også testklynger med flere udfald. Så hvis du f.eks. tager klyngen af Laslett, vil du for 2 ud af 5 positive tests ende på en LR+ på 2,7, for 3/5 på en LR+ på 4,3 osv.

Vær dog opmærksom på, at med en meget høj præ-test-sandsynlighed har endnu en test ikke megen værdi, og det er bedre at starte din behandling. Det samme gælder for en meget lav prætestsandsynlighed, og i så fald tester man ikke og behandler heller ikke tilstanden.


Hvis en patient f.eks. kommer til dig med pludseligt opståede lændesmerter, neurologiske symptomer i begge ben, problemer med vandladning og sadelanæstesi, vil du være ret sikker på, at denne patient har cauda equina-syndrom, hvilket er et rødt flag og kræver akut operation. Så hvis du er 99 % sikker på din diagnose, vil en test med lige ben (SLR) med en LR- på 0,2 reducere sandsynligheden efter testen til 95 %, hvilket stadig er meget højt, og du vil stadig gerne sende denne patient til operation.
Hvis testen til gengæld var positiv, ville du sandsynligvis gå fra 99 % til 100 % sikkerhed, så hvorfor overhovedet teste, især hvis der er tale om en akut henvisning til operation?

Det samme gælder for en meget lav præ-test-sandsynlighed. Hvis en patient kommer til dig uden udstrålende smerter under knæet, er chancen for, at denne patient har et radikulært syndrom på grund af en diskusprolaps, meget lille, lad os sige 5 %. Så hvad ville der ske i dette tilfælde, hvis du brugte spejlreflekskameraet med en LR+ på 2.0? Du ville ende med en sandsynlighed efter testen på 10 %, og hvis testen er negativ, ville sandsynligheden efter testen være faldet til måske 4 %. Så hvis man er næsten sikker på, at en patient ikke har en bestemt sygdom, hvorfor så overhovedet teste den?
I praksis afhænger beslutningen om at foretage en bestemt test selvfølgelig altid af forskellige faktorer som f.eks. omkostninger, sygdommens sværhedsgrad, risici ved testen osv.

Lad os nu vende tilbage til det, jeg påstod i begyndelsen, nemlig at statistiske værdier hjælper dig med at evaluere resultatet af dine spørgsmål under optagelsen af patienthistorien.
Faktisk kan hvert spørgsmål ses som en særlig test, hvor svaret (ja eller nej) enten vil øge eller mindske sandsynligheden for, at en patient har en bestemt tilstand. Det er også grunden til, at en grundig anamnese for det meste er vigtigere end specialtestning, fordi du dybest set udfører en række specialtest i træk,
hvis du er en god kliniker, der forstår at danne en hypotese ud fra din patients svar.

Så lad os tage et andet eksempel: Hvordan påvirker et positivt svar på spørgsmålet om langvarig brug af kortikosteroider chancen for et spinalbrud?
Ifølge Henschke et al. (2009) har langvarig brug af kortikosteroider en positiv LR+ på 48,5. Prævalensen (præ-testsandsynlighed) af en rygmarvsfraktur, der præsenterer sig for primær pleje, kan estimeres mellem 1%-4% ifølge Willi ams et al. (2013) hos patienter med lænderygsmerter.
Så med langvarig brug af kortikosteroider vil vi ende med en sandsynlighed for efter test på 33 %, selvom vi kun antog 1 % af prævalensen i dette eksempelberegning.
Jeg synes, det er rimeligt at sige, at dette spørgsmål om kortikosteroider altid bør stilles i screeningsproceduren for spinalfrakturer!
Lad os nu tage et kig på et andet rødt flag, der almindeligvis bruges til screening for malignitet hos patienter med lændesmerter: snigende begyndelse af lændesmerter.
Ifølge Deyo et al. (1988 , jeg indrømmer, at dette er en ret gammel undersøgelse), LR+ for dette spørgsmål er 1,1. Ifølge Henschke et al (2009) er forekomsten af ​​malignitet hos patienter med lænderygsmerter endda lavere end 1 %, men vi vil beregne med denne 1 % blot for nemheds skyld.
Så det lumske røde flag øger post-testsandsynligheden for malignitet som årsag til lænderygsmerter fra 1 % til præcis 1,1 %. Jeg tror, ​​vi kan blive enige om, at dette røde flag skal smides ud af enhver retningslinje, hvori det er opført.

Ortopædisk fysioterapi af over- og underekstremiteterne

Øg din viden om de 23 mest almindelige ortopædiske patologier på bare 40 timer uden at bruge en formue på CPD-kurser

Jeg ved, at dette var et langt indlæg, og tillykke og respekt, hvis du nåede hertil! Mit mål var at give dig en forklaring på, hvordan du arbejder med statistiske værdier som sensitivitet, specificitet, PPV, NPV og især likelihood ratios, og at gøre dig opmærksom på deres betydning i hele din fysioterapeutiske proces.
Det ville være fantastisk, hvis du kunne tage højde for forekomsten af en bestemt hypotese hos dine fremtidige patienter, have en idé om, hvilken indflydelse dine anamnestiske spørgsmål har på præ-test-sandsynligheden, og du kunne evaluere styrken af din særlige test korrekt.

Statistik gør mig fugtig

Du er velkommen til at stille spørgsmål i kommentarfeltet og dele dette blogindlæg, hvis du fandt det nyttigt!

Tak, fordi du læste med!

Kai

Referencer

Goossens P, Keijsers E, van Geenen RJ, Zijta A, van den Broek M, Verhagen AP, et al. Gyldigheden af Thessaly-testen til evaluering af meniskrevner sammenlignet med artroskopi: en undersøgelse af diagnostisk nøjagtighed. J.Orthop.Sports Phys.Ther. 2015;45(1):18-24, B1

Henschke N, Maher CG, Ostelo RW, de Vet HC, Macaskill P, Irwig L. Røde flag til at screene for malignitet hos patienter med lændesmerter. Cochrane Database Syst.Rev. 2013;(2):CD008686. doi(2):CD008686.

Williams CM, Henschke N, Maher CG, van Tulder MW, Koes BW, Macaskill P, et al. Røde flag til screening for vertebral fraktur hos patienter med lændesmerter. Cochrane
Database Syst Rev 2013;1:CD008643.

Physiotutors startede som et passioneret studenterprojekt, og jeg er stolt af at kunne sige, at det har udviklet sig til en af de mest respekterede udbydere af efteruddannelse for fysioterapeuter i hele verden. Vores hovedmål vil altid være det samme: at hjælpe fysioterapeuter med at få mest muligt ud af deres studier og karriere, så de kan yde den bedste evidensbaserede behandling til deres patienter.
Tilbage
Download vores GRATIS app