Чутливість, специфічність, прогнозні значення та відношення правдоподібності для фіктивних змінних

Статистика - одна з найбільш заплутаних тем для фізіологів та студентів-фізіологів. Швидше за все, це пов'язано з тим, що ми більше дбаємо про людей і здоров'я, ніж про математику, чи не так?
Я розумію, що ви більше зацікавлені в правильній оцінці пацієнта, хорошому поводженні з ним і новітніх методах лікування, але я повинен сказати вам, що вам потрібно знати статистичні значення спеціального тесту і навіть цифри про поширеність, дотестову і післятестову ймовірності питань, які ви ставите пацієнтам під час всього анамнестичного процесу!
Я б навіть наважився сказати, що без знання вищезгаданих цифр ви не матимете уявлення про те, наскільки цінними можуть бути ті чи інші питання, які ви ставите пацієнтові (і відповіді на них), і ви будете проводити спеціальні тести, не знаючи, що покаже вам позитивний чи негативний результат.
Коли я бачу або чую, що фізіотерапевт виконує спеціальний тест, такий як тест Фессалії на ураження менісків, і він дає позитивний результат, і після цього він на 100% впевнений, що у його пацієнта є ураження менісків, мене аж пересмикує від жаху!
БУДЬ ЛАСКА, ПРИПИНІТЬ ЦЕ РОБИТИ!
Ось чому я закликаю вас продовжувати читати мою статтю, в якій я спробую дати вам уявлення про те, як ви можете і повинні використовувати статистику, щоб стати кращим фізіологом, і як ці знання підвищують вашу обізнаність у процесі клінічного мислення!
Як правило, ми починаємо зі скринінгу, потім збираємо анамнез, після чого проводимо базову оцінку. На основі інформації, яку ви отримали під час вищезгаданих частин, ви формуєте свої гіпотези, які ви хотіли б або підтвердити, або спростувати. Саме тут вступають у гру чутливість і специфічність. Тож давайте спочатку розберемося, що таке чутливість і специфічність! Найпростіший спосіб - переглянути коротке відео, яке ми зробили нещодавно:
Отже, підсумуємо ще раз: Негативний результат 100% чутливого тесту може виключити захворювання (SnNOut), а позитивний результат 100% специфічного тесту може підтвердити захворювання (SpPIn).
Негативний результат 100% чутливого тесту може виключити захворювання (SnNOut), а позитивний результат 100% специфічного тесту може підтвердити захворювання (SpPIn)
За допомогою двох мнемонік SnNOut і SpPIn відносно легко застосувати ці дві концепції на практиці.
Здебільшого ви краще зрозумієте їх визначення і те, чим вони є насправді, якщо зможете обчислити ці значення за допомогою таблиці 2×2. Дивіться наше наступне відео, в якому ми покажемо вам, як виконати розрахункову частину:
На жаль, в реальному житті навряд чи існує 100% точних тестів, тому у вас буде багато хибнопозитивних і хибнонегативних результатів. Крім того, чутливість і специфічність показують, наскільки часто тест виявляється позитивним у пацієнтів, про яких ми вже знаємо, що вони хворіють чи ні. Однак на практиці ми не знаємо, чи є у наших пацієнтів певна хвороба, чи ні. На практиці ми скоріше займаємося інтерпретацією результатів позитивного чи негативного тесту.
Зазвичай ви не знаєте, яка ймовірність того, що у пацієнта дійсно є хвороба з позитивним результатом, і наскільки висока ймовірність того, що у пацієнта немає хвороби з негативним результатом.
Ці значення називаються позитивною прогностичною цінністю (PPV) і негативною прогностичною цінністю (NPV), які також називають пост-тестовими ймовірностями. Ви вже здогадалися - у нас є ще одне відео, яке пояснює ці значення за допомогою таблиці 2×2 і показує, як їх обчислити:
Як згадувалося у відео, PPV та NPV є чудовими інструментами, якщо ви маєте уявлення про поширеність у вашій групі пацієнтів, і якщо ця поширеність ідентична поширеності в РКД, звідки ви отримали статистичні значення для конкретного тесту в першу чергу. Якщо це не так, PPV та NPV стають практично марними.
Уявіть, як змінюється дотестова ймовірність розриву передньої хрестоподібної зв'язки (ПХЗ) в різних умовах: Наприклад, поширеність пацієнтів з розривом ПКС в загальній практиці буде набагато нижчою, ніж у спортивній клініці, яка спеціалізується на травмах колінного суглоба. Чим вища поширеність, тим вищою буде ваша PPV і нижчою NPV.
Можливо, в майбутньому ми також зробимо відео про це, але важливо пам'ятати, що нам потрібна краща цінність, ніж PPV і NPV, і саме тут в гру вступають коефіцієнти ймовірності.
Коефіцієнт вірогідності поєднує в собі як чутливість, так і специфічність і показує, наскільки ймовірним є певний результат тесту у людей із захворюванням, порівняно з тим, наскільки ймовірним він є у людей без захворювання. Подивіться наступне відео про відношення правдоподібності та про те, як його розрахувати:
У нашому прикладі ми використовували тест Лахмана, який є одним з найточніших тестів, що застосовуються в клінічній практиці, але давайте подивимося на наш улюблений тест Тессалі і на те, як наш приклад виглядає в ньому:
За даними Goossens et al. (2015), тест Фессалії має чутливість 64% і специфічність 53%, що дає LR+ 1,36 і LR- 0,68. Як ви вже бачите, ці значення досить близькі до LR = 1, що говорить нам про те, що вони дуже мало змінять ймовірність того, що у людини буде ураження меніска. Щоб застосувати ці значення до прикладу нашого випадку з розривом хрестоподібної зв'язки, ми знаємо, що розриви хрестоподібної зв'язки часто супроводжуються розривами менісків. Хоча наш пацієнт не скаржиться на відчуття блокування або защемлення, ми оцінюємо нашу попередню вірогідність приблизно в 30%.
Наша номограма матиме такий вигляд:
На основі (більш точних) розрахунків ми отримуємо такі пост-тестові ймовірності:
- дотестові шанси: Поширеність/(1-поширеність) = 0,3/(1-0,3) = 0,43
- Посттестові шанси (LR+): 0,43 x 1,36 = 0,58
- Пост-тестова ймовірність (LR+): пост-тестові шанси / (пост-тестові шанси+1) = 0,58/(0,58+1) = 0,37 (тобто 37%)
- Пост-тестові шанси (LR-): 0,43 x 0,68 = 0,29
- Післятестова ймовірність (LR-): післятестові шанси / (післятестові шанси+1) = 0,29/ (0,29+1) = 0,22(22%)
Таким чином, з позитивним тестом Фессалі збільшується ймовірність ураження менструального апарату з передбачуваних 30% до 37%, а з негативним тестом Фессалі - зменшується до 22%.
Розумієте, чому я божеволію, коли люди роблять тест, а потім припускають, що їхній пацієнт точно має або не має певного захворювання?! І все це базується на припущенні про шанси перед тестуванням, які більшість людей навіть забувають взяти до уваги!
Якщо ви хочете виконати кілька тестів, наприклад, додати тест на передню шухляду в нашому прикладі ACL, ви базуватимете свою попередню ймовірність на пост-тестовій ймовірності тесту Лахмана. Таким чином, у випадку позитивного Лахмана ви почнете з ймовірністю 95%, а у випадку негативного Лахмана - з ймовірністю 19%.
Хоча більшість тестів мають або позитивний, або негативний результат, існують також кластери тестів з декількома результатами. Якщо взяти, наприклад, кластер Ласлетта, то для 2 з 5 позитивних тестів ви отримаєте LR+ 2,7, для 3/5 - LR+ 4,3 і т.д.
Однак пам'ятайте, що при дуже високій вірогідності попереднього тесту ще один тест не має особливої цінності, і краще почати лікування. Те ж саме стосується дуже низької дотестової ймовірності, в цьому випадку ви не проводите тестування і не лікуєте захворювання.
Наприклад, якщо до вас звернувся пацієнт з раптовим нападом болю в попереку, неврологічними симптомами в обох ногах, проблемами з сечовипусканням і сідельною анестезією, ви будете впевнені, що у нього синдром кінського хвоста, що є тривожним сигналом і вимагає термінового хірургічного втручання. Отже, якщо ви, скажімо, на 99% впевнені у своєму діагнозі, тест з прямою ногою (SLR) з LR- 0,2 знизить посттестову ймовірність до 95%, що все одно дуже високо, і ви все одно захочете відправити цього пацієнта на операцію.
У свою чергу, якби тест був позитивним, ви, ймовірно, перейшли б від 99% до 100% впевненості, тож навіщо взагалі турбуватися про тестування, особливо якщо це термінове направлення на хірургічне втручання?
Те ж саме стосується і дуже низької ймовірності попереднього тестування. Якщо пацієнт звертається до вас без іррадіюючого болю нижче коліна, ймовірність корінцевого синдрому через грижу міжхребцевого диска у цього пацієнта дуже низька, скажімо, припустимо, 5%. Що ж станеться в цьому випадку, якщо ви використаєте дзеркальну камеру з LR+ 2.0? У підсумку, ймовірність після проведення тесту становитиме 10%, а якщо тест буде негативним, то ймовірність після проведення тесту знизиться до 4%. Тож якщо ви майже впевнені, що у пацієнта немає певного захворювання, навіщо взагалі його тестувати?
Звичайно, на практиці рішення про проведення певного тесту завжди залежить від різних факторів, таких як вартість, тяжкість захворювання, ризики тесту тощо.
Тепер повернемося до того, що я стверджував на початку, що статистичні значення допомагають вам оцінити результат вашого опитування під час збору історії хвороби.
Фактично, кожне питання можна розглядати як спеціальний тест, в якому відповідь (так чи ні) або збільшує, або зменшує ймовірність того, що у пацієнта є певний стан. Це також є причиною того, чому ретельний анамнез у більшості випадків важливіший за спеціальне тестування, оскільки ви, по суті, виконуєте серію спеціальних тестів поспіль,
якщо ви хороший клініцист, який знає, як сформувати гіпотезу на основі відповідей пацієнта.
Візьмемо інший приклад: Як позитивна відповідь на питання про тривале застосування кортикостероїдів впливає на ймовірність перелому хребта?
За даними Henschke et al. (2009), тривале застосування кортикостероїдів має позитивний LR+ 48,5. Поширеність (дотестова ймовірність) перелому хребта, з яким звертаються за первинною медичною допомогою, може бути оцінена в межах 1%-4%, згідно з данимиWilliams et al. (2013) у пацієнтів з болем у попереку.
Отже, при тривалому застосуванні кортикостероїдів ми отримаємо післятестову ймовірність 33%, хоча в цьому прикладі ми припускали лише 1% поширеності.
Думаю, справедливо буде сказати, що це питання про кортикостероїди слід завжди ставити під час скринінгу переломів хребта!
Тепер давайте розглянемо ще один "червоний прапорець", який зазвичай використовується при скринінгу на злоякісні новоутворення у пацієнтів з болем у попереку: Підступний початок болю в попереку.
За даними Deyo et al. (1988 рік, я визнаю, що це досить старе дослідження), LR+ для цього питання становить 1,1. За даними Henschke et al (2009), поширеність злоякісних новоутворень у пацієнтів з болем у попереку навіть нижча за 1%, але ми будемо рахувати з цим 1% просто для простоти.
Отже, підступний початок захворювання підвищує післятестову ймовірність злоякісного новоутворення як причини болю в попереку з 1% до рівно 1,1%. Я думаю, ми можемо погодитися, що цей червоний прапорець слід викреслити з усіх настанов, в яких він згадується.
Ортопедична фізіотерапія верхніх та нижніх кінцівок
Підвищіть свої знання про 23 найпоширеніші ортопедичні патології всього за 40 годин, не витрачаючи купу грошей на курси підвищення кваліфікації
Я знаю, що це був довгий пост, і я вітаю і поважаю вас, якщо ви дочитали його до кінця! Моїм завданням було пояснити вам, як працювати зі статистичними показниками, такими як чутливість, специфічність, PPV, NPV і, особливо, відношення ймовірності, а також дати вам зрозуміти їхню важливість у всьому фізіотерапевтичному процесі.
Було б фантастично, якби ви могли враховувати поширеність певної гіпотези серед ваших майбутніх пацієнтів, мати уявлення про вплив ваших анамнестичних запитань на вірогідність дотестового діагнозу, а також правильно оцінювати силу вашого спеціального тестування.
Не соромтеся ставити запитання в коментарях і ділитися цією статтею, якщо вона виявилася для вас корисною!
Дякуємо, що прочитали!
Кай!
Посилання
Кай Сіґел
Генеральний директор та співзасновник Physiotutors
НОВІ СТАТТІ БЛОГУ У ВАШІЙ ПОШТОВІЙ СКРИНЬЦІ
Підпишіться зараз і отримуйте сповіщення, коли буде опублікована остання стаття блогу.