Sensitivitet, spesifisitet, prediktive verdier og sannsynlighetsforhold for dummies

Statistikk er et av de mest forvirrende temaene for fysioterapeuter og fysiostudenter. Mest sannsynlig er dette på grunn av det faktum at vi bryr oss mer om mennesker og helse enn vi bryr oss om matte, ikke sant?
Vel, jeg forstår at du er mer interessert i å vurdere pasienten din riktig, god håndtering og de nyeste behandlingsmetodene, men jeg må fortelle deg at du trenger å vite de statistiske verdiene til en spesiell test og partall om prevalens, pre-test , og post-test sannsynligheter for spørsmål du stiller pasientene dine under hele din anamnestiske prosess!
Jeg vil til og med tørre å si at uten kjennskap til de ovennevnte tallene, vil du ikke ha noen anelse om hvor mye verdi du kan sette på visse spørsmål du stiller pasienten din (og svarene på dem), og du vil utføre spesielle tester uten egentlig å vite det hva et positivt eller negativt utfall vil fortelle deg.
Når jeg ser eller hører at en fysioterapeut utfører en spesiell test som Thessalia-testen for menisklesjoner, er den positiv, og de er 100 % sikre på etterpå, at pasienten deres har en menisklesjon, det får meg til å krype!
VENNLIGST SLUTT Å GJØRE DET!
Derfor oppfordrer jeg deg til å fortsette å lese innlegget mitt der jeg skal prøve å gi deg et innblikk i hvordan du kan og bør bruke statistikk for å bli en bedre fysioterapeut og hvordan den kunnskapen øker din bevissthet om din kliniske resonneringsprosess!
Generelt vil du starte med screening, deretter anamnese, etterfulgt av en grunnleggende vurdering. På grunnlag av informasjonen du fikk under de nevnte delene, danner du dine hypoteser som du enten vil bekrefte eller avvise. Det er her sensitivitet og spesifisitet spiller inn. Så la oss først se på hva sensitivitet og spesifisitet er! Den enkleste måten er å se den korte videoen vi har laget for en stund siden:
Så for å oppsummere det igjen: Et negativt utfall i en 100 % sensitiv test kan utelukke sykdommen (SnNOut) og et positivt utfall i en 100 % spesifikk test kan utelukke sykdommen (SpPIn).
Et negativt utfall i en 100 % sensitiv test kan utelukke sykdommen (SnNOut) og et positivt utfall i en 100 % spesifikk test kan utelukke sykdommen (SpPIn)
Med de to mnemonikkene SnNOut og SpPIn er det relativt enkelt å sette disse to konseptene ut i livet.
Mesteparten av tiden vil du få en bedre forståelse av definisjonen deres og hva de faktisk er hvis du er i stand til å beregne disse verdiene ved hjelp av en 2×2-tabell. Se vår neste video, som viser deg hvordan du gjør beregningsdelen:
Dessverre, i det virkelige liv, er det knapt noen 100% nøyaktige tester, og det er grunnen til at du vil ha mange falske positive og falske negative resultater. På toppen av det, forteller sensitivitet og spesifisitet oss hvor ofte en test er positiv hos pasienter som vi allerede vet har sykdommen eller ikke. I praksis vet vi imidlertid ikke om våre pasienter har en bestemt tilstand eller ikke. Det vi heller gjør i praksis er å tolke resultatene av en positiv eller negativ test.
Du vil vanligvis ikke vite hva sannsynligheten er for at pasienten faktisk har sykdommen med et positivt utfall og hvor stor sannsynligheten er for at en pasient ikke har sykdommen med et negativt utfall.
Disse verdiene kalles positiv prediktiv verdi (PPV) og negativ prediktiv verdi (NPV), også kalt post-test sannsynligheter. Du gjettet det – vi har en annen video som forklarer disse verdiene ved hjelp av 2×2-tabellen og viser deg hvordan du beregner disse verdiene:
Nå, som nevnt i videoen, er PPV og NPV gode verktøy hvis du har en god ide om utbredelsen av pasientgruppen din og hvis denne prevalensen er identisk med prevalensen av RCT, hvor du har fått dine statistiske verdier fra for en bestemt test i første omgang. Hvis dette ikke er tilfelle, blir PPV og NPV ganske ubrukelig.
Tenk deg hvordan sannsynligheten for at et fremre korsbånd (ACL) ruptur før test endres i forskjellige settinger: For eksempel vil forekomsten av pasienter med ACL-rift i allmennpraksis være mye lavere enn på en idrettsklinikk som er spesialisert på kneskader. Jo høyere prevalens, jo høyere PPV og jo lavere NPV vil være.
Kanskje vi lager en video om det også i fremtiden, men det er viktig å huske at vi trenger en bedre verdi enn PPV og NPV, som er der sannsynlighetsforholdene spiller inn.
Sannsynlighetsforholdet kombinerer både sensitivitet og spesifisitet og forteller oss hvor sannsynlig et gitt testresultat er hos personer med tilstanden, sammenlignet med hvor sannsynlig det er hos personer uten tilstanden. Se følgende video om sannsynlighetsforhold og hvordan du kan beregne dem:
I eksemplet brukte vi Lachman-testen, som er en av de mest nøyaktige testene som finnes i klinisk praksis, men la oss se på vår elskede Thessalia-test og hvordan eksemplet vårt spiller der ute:
I følge Goossens et al. (2015) har Thessaly-testen en sensitivitet på 64 % og en spesifisitet på 53 %, noe som gir en LR+ på 1,36 og en LR- på 0,68. Som du allerede kan se, er disse verdiene ganske nær LR = 1, noe som forteller oss at de vil endre sannsynligheten for at en person har en menisklesjon svært lite. For å bruke disse verdiene på eksemplet med vår ACL-tåretilfelle, vet vi at ACL-rifter ofte er ledsaget av meniskrifter. Selv om pasienten vår ikke rapporterer noen låse- eller fangefornemmelser, anslår vi vår sannsynlighet før test til omtrent 30 %.
Nomogrammet vårt vil se slik ut:
Basert på de (mer nøyaktige) beregningene ender vi opp med følgende sannsynligheter etter test:
– Odds før test: Prevalens/(1-prevalens) = 0,3/(1-0,3) = 0,43
– Odds etter test (LR+): 0,43 x 1,36 = 0,58
– Post-test sannsynlighet (LR+): post-test odds / (post-test odds+1) = 0,58/(0,58+1) = 0,37 (altså 37 % )
– Odds etter test (LR-): 0,43 x 0,68 = 0,29
– Post-test sannsynlighet (LR-) : post-test odds / (post-test odds+1) = 0,29/ (0,29+1) = 0,22 ( 22% )
Så med en positiv Thessalia-test har du økt sjansene dine for en menslesjon fra antatt 30 % til 37 %, og med en negativ Thessaly-test har du redusert sjansene dine til 22 %.
Se hvorfor jeg gruer meg hvis folk utfører en test og deretter antar at pasienten deres definitivt har eller ikke har en bestemt tilstand?! Og alt dette er basert på en antagelse om pre-test odds, som de fleste til og med glemmer å ta i betraktning!
Hvis du ønsker å utføre flere tester, si at du vil legge til Anterior Drawer-testen i vårt ACL-eksempel, vil du basere din pre-test sannsynlighet på post-test sannsynligheten for Lachman testen. Så i tilfelle av en positiv Lachman, vil du starte med en pre-test sannsynlighet på 95%, og med en negativ Lachman, vil du starte med en pre-test sannsynlighet på 19%.
Mens de fleste tester enten har et positivt eller negativt utfall, er det også testklynger med flere utfall. Så hvis du for eksempel tar klyngen til Laslett, vil du for 2 av 5 positive tester ende opp på en LR+ på 2,7, for 3/5 på en LR+ på 4,3 osv.
Vær imidlertid oppmerksom på at med en svært høy sannsynlighet før test, har en annen test liten verdi, og det er bedre å starte behandlingen. Det samme gjelder for en svært lav sannsynlighet før test, i så fall tester du ikke og heller ikke behandler tilstanden.
For eksempel, hvis en pasient får plutselig innsettende korsryggsmerter, nevrologiske symptomer i begge bena, problemer med vannlating og sadelbedøvelse, vil du være ganske sikker på at denne pasienten har cauda equina syndrom, som er et rødt flagg og krever akutt kirurgi. Så hvis du er si 99 % sikker på diagnosen din, vil en straight leg test (SLR) med en LR- på 0,2 redusere post-test sannsynligheten til 95 %, som fortsatt er veldig høy og du vil fortsatt sende denne pasienten for operasjon.
På sin side, hvis testen var positiv, ville du sannsynligvis gått fra 99 % til 100 % sikkerhet, så hvorfor bry deg med å teste i utgangspunktet, spesielt hvis dette er en hastehenvisning til operasjon?
Det samme gjelder for en svært lav sannsynlighet før test. Hvis en pasient presenterer seg for deg uten å utstråle smerte under kneet, er sjansen for denne pasienten for radikulært syndrom på grunn av en skiveprolaps svært lav, si at vi antar 5%. Så hva ville skje i dette tilfellet hvis du utførte speilreflekskameraet med en LR+ på 2.0? Du ville ende opp med en post-test-sannsynlighet på 10%, og hvis testen er negativ, ville post-test-sannsynligheten blitt redusert til kanskje 4%. Så hvis du er nesten sikker på at en pasient ikke har en bestemt sykdom, hvorfor teste den i utgangspunktet?
Selvfølgelig, i praksis avhenger beslutningen om å gjøre en bestemt test alltid av ulike faktorer som kostnader, alvorlighetsgraden av en sykdom, risikoen ved testen, etc.
La oss nå komme tilbake til det jeg hevdet i begynnelsen, at statistiske verdier hjelper deg med å evaluere utfallet av avhøret ditt mens du tar pasienthistorien.
Faktisk kan hvert spørsmål sees på som en spesiell test, der svaret (ja eller nei) enten vil øke eller redusere sannsynligheten for at en pasient har en bestemt tilstand. Dette er også grunnen til at en grundig anamnese for det meste er viktigere enn spesiell testing fordi du i utgangspunktet utfører en serie spesialtester på rad,
hvis du er en god kliniker som vet hvordan du kan danne en hypotese basert på pasientens svar.
Så la oss ta et annet eksempel: Hvordan påvirker et positivt svar på spørsmålet om langvarig bruk av kortikosteroider sjansen for et ryggradsbrudd?
I følge Henschke et al. (2009) har langvarig bruk av kortikosteroider en positiv LR+ på 48,5. Prevalensen (pre-test sannsynlighet) av et ryggradsbrudd som presenteres for primærhelsetjenesten kan estimeres mellom 1%-4% ifølge Willi ams et al. (2013) hos pasienter som har smerter i korsryggen.
Så ved langvarig bruk av kortikosteroider vil vi ende opp med en sannsynlighet etter test på 33 %, selv om vi antok bare 1 % av prevalensen i denne eksempelberegningen.
Jeg synes det er rettferdig å si at dette spørsmålet om kortikosteroider alltid bør stilles i screeningsprosedyren for ryggbrudd!
La oss nå ta en titt på et annet rødt flagg som ofte brukes i screening for malignitet hos pasienter med korsryggsmerter: Slumsk begynnelse av korsryggsmerter.
I følge Deyo et al. (1988 , jeg innrømmer at dette er en ganske gammel studie), LR+ for dette spørsmålet er 1.1. I følge Henschke et al (2009) er forekomsten av malignitet hos pasienter med korsryggsmerter enda lavere enn 1 %, men vi vil beregne med denne 1 % bare for enkelhets skyld.
Så det lumske røde flagget øker sannsynligheten for malignitet etter test som årsak til korsryggsmerter fra 1 % til nøyaktig 1,1 %. Jeg tror vi kan bli enige om at dette røde flagget bør kastes ut av enhver retningslinje der det er oppført.
Ortopedisk fysioterapi av øvre og nedre ekstremiteter
Øk kunnskapen din om de 23 vanligste ortopediske patologiene på bare 40 timer uten å bruke en formue på CPD-kurs
Jeg vet at dette var et langt innlegg og gratulerer og respekterer hvis du kom hit! Målet mitt var å gi deg en forklaring på hvordan du kan jobbe med statistiske verdier som sensitivitet, spesifisitet, PPV, NPV, og spesielt sannsynlighetsratioene og gjøre deg oppmerksom på deres betydning i hele din fysioterapeutiske prosess.
Det ville være fantastisk om du kunne ta hensyn til utbredelsen av en viss hypotese med dine fremtidige pasienter, ha en ide om innvirkningen av dine anamnestiske spørsmål på sannsynligheten før test, og du kunne evaluere kraften til din spesielle testing på riktig måte.
Still gjerne spørsmål i kommentarfeltet og del dette blogginnlegget hvis du synes det var nyttig!
Takk for at du leser!
Kai
Referanser
Kai Sigel
Administrerende direktør og medgründer Physiotutors
NYE BLOGGARTIKLER I INNKASSEN DIN
Abonner nå og motta et varsel når den siste bloggartikkelen er publisert.