| 11 دقيقة للقراءة

الحساسية والخصوصية والقيم التنبؤية ونسب الاحتمالية للمبتدئين

صلاحية التشخيص

الإحصاء هو أحد أكثر المواضيع إرباكاً لطلاب الفيزياء والفيزيائيين. ربما يرجع ذلك على الأرجح إلى حقيقة أننا نهتم بالناس والصحة أكثر من اهتمامنا بالرياضيات، أليس كذلك؟

صلاحية التشخيص

حسناً، أفهم أنك مهتم أكثر بتقييم مريضك بشكل صحيح، وحسن التعامل، وأحدث طرق العلاج، ولكن يجب أن أقول لك أنك بحاجة إلى معرفة القيم الإحصائية للاختبار الخاص وحتى الأرقام المتعلقة بالانتشار، واحتمالات ما قبل الاختبار، وما بعد الاختبار للأسئلة التي تطرحها على مرضاك خلال عملية التشخيص بأكملها!
بل إنني أجرؤ على القول إنه من دون معرفة الأرقام المذكورة أعلاه، لن يكون لديك أدنى فكرة عن القيمة التي يمكنك أن تضعها على بعض الأسئلة التي تطرحها على مريضك (وإجاباتها) وستقوم بإجراء اختبارات خاصة دون أن تعرف حقًا ما الذي ستخبرك به النتيجة الإيجابية أو السلبية.
عندما أرى أو أسمع أن طبيباً فيزيائياً يجري اختباراً خاصاً مثل اختبار ثيسالي للكشف عن آفات الغضروف الهلالي، وتكون النتيجة إيجابية، ويكونون متأكدين 100% بعد ذلك أن مريضهم مصاب بآفة في الغضروف الهلالي، فإن ذلك يجعلني أشعر بالاشمئزاز!
من فضلك توقف عن فعل ذلك!

لهذا السبب أحثك على متابعة قراءة منشوري الذي سأحاول فيه أن أعطيك نظرة ثاقبة حول كيفية استخدامك للإحصاءات لكي تصبح طبيباً فيزيائياً أفضل، وكيف تزيد هذه المعرفة من وعيك بعملية التفكير السريري!

بشكل عام، ستبدأ بالفحص، ثم الفحص الطبي، ثم الفحص الطبي، يليه التقييم الأساسي. استناداً إلى المعلومات التي حصلت عليها خلال الأجزاء المذكورة أعلاه، تقوم بتكوين فرضياتك التي ترغب في تأكيدها أو رفضها.  وهنا يأتي دور الحساسية والخصوصية. لذا دعونا أولاً نلقي نظرة على ماهية الحساسية والنوعية! أسهل طريقة هي مشاهدة الفيديو القصير الذي أعددناه منذ فترة:

إذاً لتلخيص الأمر مرة أخرى يمكن للنتيجة السلبية في اختبار حساس بنسبة 100% أن تستبعد المرض (SnNOut) ويمكن للنتيجة الإيجابية في اختبار محدد 100% أن تستبعد المرض (SpPIn).

النتيجة السلبية في اختبار حساس بنسبة 100% يمكن أن تستبعد المرض (SnNOut) والنتيجة الإيجابية في اختبار محدد 100% يمكن أن تستبعد المرض (SpPIn)


من السهل نسبيًا تطبيق هذين المفهومين على أرض الواقع من خلال استخدام مفهومي SnNOUT و SpPIn.
في معظم الأحيان، ستحصل على فهم أفضل لتعريفها وما هي في الواقع إذا كنت قادرًا على حساب هذه القيم باستخدام جدول 2×2. شاهد الفيديو التالي الذي سيوضح لك كيفية إجراء الجزء الخاص بالحساب:

لسوء الحظ، في الحياة الواقعية، لا تكاد توجد اختبارات دقيقة بنسبة 100%، ولهذا السبب سيكون لديك الكثير من النتائج الإيجابية الكاذبة والسلبية الكاذبة. وعلاوة على ذلك، تخبرنا الحساسية والنوعية بعدد المرات التي يكون فيها الاختبار إيجابيًا لدى المرضى الذين نعرف بالفعل أنهم مصابون بالمرض أم لا. ولكننا في الممارسة العملية لا نعرف ما إذا كان مرضانا يعانون من حالة معينة أم لا. ما نفعله بالأحرى في الممارسة العملية هو تفسير نتائج الاختبار الإيجابية أو السلبية.
لن تعرف عادةً ما هي احتمالية إصابة المريض بالمرض فعليًا بنتيجة إيجابية وما هي احتمالية عدم إصابة المريض بالمرض بنتيجة سلبية.
وتسمى هذه القيم بالقيمة التنبؤية الإيجابية (PPV) والقيمة التنبؤية السلبية (NPV)، وتسمى أيضًا احتمالات ما بعد الاختبار. لقد خمنت ذلك - لدينا فيديو آخر يشرح هذه القيم بمساعدة جدول 2×2 ويوضح لك كيفية حساب هذه القيم:

الآن، كما ذكرنا في الفيديو، فإن PPV و NPV هما أداتان رائعتان إذا كانت لديك فكرة جيدة عن مدى انتشار مجموعة المرضى لديك وإذا كان هذا الانتشار مطابقًا لانتشار اختبار RCT، حيث حصلت على قيمك الإحصائية لاختبار معين في المقام الأول. إذا لم يكن هذا هو الحال، تصبح القيمة العادلة للمبيعات قبل البيع والقيمة العادلة الصافية قبل الشراء عديمة الفائدة إلى حد كبير.
تخيل كيف يتغير احتمال حدوث تمزق في الرباط الصليبي الأمامي (ACL) قبل الاختبار في أوضاع مختلفة: على سبيل المثال، سيكون معدل انتشار المرضى الذين يعانون من تمزق الرباط الصليبي الأمامي في عيادة عامة أقل بكثير من عيادة رياضية متخصصة في إصابات الركبة. كلما زادت نسبة الانتشار، كلما زادت قيمة صافي القيمة المضافة إلى القيمة المضافة إلى القيمة العادلة.
ربما سنقوم بعمل فيديو عن ذلك أيضًا في المستقبل، ولكن من المهم أن نتذكر أننا نحتاج إلى قيمة أفضل من قيمة PPV و NPV، وهنا يأتي دور نسب الاحتمالية.

تجمع نسبة الاحتمالية بين كل من الحساسية والخصوصية وتخبرنا بمدى احتمالية ظهور نتيجة اختبار معين لدى الأشخاص المصابين بالحالة المرضية، مقارنة بمدى احتمالية ظهورها لدى الأشخاص غير المصابين بالحالة المرضية. شاهد الفيديو التالي عن نسب الاحتمالات وكيفية حسابها:

في هذا المثال، استخدمنا اختبار لاكمان، وهو أحد أكثر الاختبارات دقة في الممارسة السريرية، ولكن دعونا ننظر إلى اختبار ثيسالي المحبوب وكيف يلعب مثالنا هناك:
وفقًا لغوسينز وآخرون. (2015)، تبلغ حساسية اختبار ثيسالي 64% وخصوصية 53%، مما ينتج عنه اختبار LR+ بنسبة 1,36 و LR- بنسبة 0,68. كما ترى بالفعل، فإن هذه القيم قريبة جداً من LR = 1، وهو ما يخبرنا أنها ستغير احتمال إصابة الشخص بآفة في الغضروف الهلالي بشكل ضئيل جداً. ولتطبيق هذه القيم على مثال حالة تمزق الرباط الصليبي الأمامي، نعلم أن تمزق الرباط الصليبي الأمامي غالباً ما يكون مصحوباً بتمزق في الغضروف الهلالي. على الرغم من أن مريضنا لم يُبلغ عن أي إحساس بالانغلاق أو الالتصاق، إلا أننا نقدر احتمالية حدوث ذلك قبل الاختبار بحوالي 30%.
سيبدو مخططنا الاسمي بهذا الشكل:

الرسم البياني الاسمي ثيساليا

استنادًا إلى الحسابات (الأكثر دقة)، نحصل في النهاية على الاحتمالات التالية بعد الاختبار:
- احتمالات ما قبل الاختبار: معدل الانتشار/(1 - معدل الانتشار) = 0,3/(1-0,3) = 0,43
- احتمالات ما بعد الاختبار (LR+): 0,43 × 1,36 = 0,58
- احتمال ما بعد الاختبار (LR+): احتمالات ما بعد الاختبار / (احتمالات ما بعد الاختبار + 1) = 0,58/(0,58+1) = 0,37 (أي 37%)
- احتمالات ما بعد الاختبار (LR-): 0,43 × 0,68 = 0,29
- احتمال ما بعد الاختبار (LR-): احتمالات ما بعد الاختبار / (احتمالات ما بعد الاختبار + 1) = 0,29/ (0,29 + 1) = 0,22(22%)

لذلك مع اختبار ثيسالي الإيجابي، تكون قد زادت فرص إصابتك بآفة حسية من نسبة مفترضة تبلغ 30% إلى 37%، ومع اختبار ثيسالي السلبي، تكون قد قللت فرصك إلى 22%.
أترى لماذا أشعر بالفزع إذا أجرى الناس اختبارًا ثم افترضوا أن مريضهم مصاب أو غير مصاب بحالة معينة بالتأكيد! وهذا كله مبني على افتراض احتمالات ما قبل الاختبار، والتي ينسى معظم الناس أخذها في الاعتبار!

إذا كنت ترغب في إجراء اختبارات متعددة، لنفترض أنك تريد إضافة اختبار الساحب الأمامي في مثالنا للرباط الصليبي الأمامي، فستبني احتمال ما قبل الاختبار على احتمال ما بعد اختبار لاكمان. لذا في حالة وجود لاكمان إيجابي، ستبدأ باحتمال 95% قبل الاختبار، وفي حالة وجود لاكمان سلبي، ستبدأ باحتمال 19% قبل الاختبار.
في حين أن معظم الاختبارات إما أن تكون نتيجتها إيجابية أو سلبية، إلا أن هناك أيضاً مجموعات اختبارات ذات نتائج متعددة. لذا، إذا أخذت مجموعة لاسليت على سبيل المثال، فبالنسبة لاختبارين من أصل 5 اختبارات إيجابية سينتهي بك الأمر عند مستوى LR+ 2.7، وبالنسبة لـ 3/5 عند مستوى LR+ 4.3، إلخ.

ومع ذلك، انتبهي إلى أنه مع وجود احتمال كبير جداً قبل الاختبار، فإن اختباراً آخر ليس له قيمة تذكر ومن الأفضل أن تبدئي علاجك. وينطبق الأمر نفسه على الاحتمالية المنخفضة جدًا قبل الاختبار، وفي هذه الحالة لا تجري الاختبار ولا تعالج الحالة أيضًا.


على سبيل المثال، إذا جاءك مريض يعاني من بداية مفاجئة لآلام أسفل الظهر وأعراض عصبية في كلا الساقين ومشاكل في التبول وتخدير السرج، فستكون متأكداً تماماً من أن هذا المريض يعاني من متلازمة ذنب الفرس، وهو ما يعد علامة حمراء ويتطلب جراحة عاجلة. لذا، إذا كنت متأكداً من تشخيصك بنسبة 99% على سبيل المثال، فإن اختبار الساق المستقيمة (SLR) مع نسبة LR- 0.2 سيقلل من احتمال ما بعد الاختبار إلى 95%، وهي نسبة لا تزال مرتفعة جداً وستظل ترغب في إرسال هذا المريض لإجراء عملية جراحية.
في المقابل، إذا كانت نتيجة الاختبار إيجابية، فمن المحتمل أن تنتقل من 99% إلى 100% من اليقين، فلماذا تكلف نفسك عناء إجراء الاختبار في المقام الأول، خاصةً إذا كانت هذه إحالة عاجلة لإجراء عملية جراحية؟

وينطبق الأمر نفسه على احتمال منخفض للغاية قبل الاختبار. إذا جاءك مريض بدون ألم إشعاعي تحت الركبة، فإن فرصة إصابة هذا المريض بمتلازمة الجذور بسبب انفتاق القرص منخفضة جداً، ولنفترض أن تكون 5%. إذن ما الذي سيحدث في هذه الحالة إذا قمت بإجراء SLR مع LR + 2.0؟ سينتهي بك الأمر باحتمال بعد الاختبار بنسبة 10%، وإذا كان الاختبار سلبيًا سينخفض احتمال ما بعد الاختبار إلى ربما 4%. لذا، إذا كنت شبه متأكد من عدم إصابة المريض بمرض معين، فلماذا تختبره في المقام الأول؟
بالطبع، في الممارسة العملية، يعتمد قرار إجراء اختبار معين دائماً على عوامل مختلفة مثل التكاليف وشدة المرض ومخاطر الاختبار وما إلى ذلك.

والآن دعنا نعود إلى ما ادعيته في البداية، وهو أن القيم الإحصائية تساعدك على تقييم نتائج استجوابك أثناء أخذ تاريخ المريض.
في الواقع، يمكن اعتبار كل سؤال بمثابة اختبار خاص، حيث أن الإجابة (بنعم أو لا) ستزيد أو تقلل من احتمال إصابة المريض بحالة معينة. وهذا هو السبب أيضاً في أن الفحص الشامل للسوابق المرضية يكون في معظم الأحيان أكثر أهمية من الفحوصات الخاصة لأنك تقوم أساساً بإجراء سلسلة من الفحوصات الخاصة المتتالية
إذا كنت طبيباً جيداً يعرف كيف يكوّن فرضية بناءً على إجابات المريض.

لذا دعونا نأخذ مثالاً آخر: كيف تؤثر الإجابة الإيجابية على السؤال حول الاستخدام المطول للكورتيكوستيرويدات القشرية على فرصة حدوث كسر في العمود الفقري؟
وفقًا لهينشكه وآخرون. (2009)، فإن الاستخدام المطول للكورتيكوستيرويدات القشرية له معدل إيجابي لنسبة الاستجابة السريعة + 48.5. يمكن تقدير معدل انتشار (احتمال ما قبل الاختبار) كسور العمود الفقري التي تظهر في الرعاية الأولية بين 1%-4% وفقًا لويليصباحا وآخرون (2013) في المرضى الذين يعانون من آلام أسفل الظهر.
لذلك مع استخدام الكورتيكوستيرويدات القشرية لفترات طويلة، سينتهي بنا الأمر باحتمال ما بعد الاختبار بنسبة 33% على الرغم من أننا افترضنا 1% فقط من الانتشار في هذا المثال الحسابي.
أعتقد أنه من الإنصاف أن نقول إن هذا السؤال عن الكورتيكوستيرويدات القشرية يجب أن يُطرح دائمًا في إجراء فحص كسور العمود الفقري!
دعونا الآن نلقي نظرة على علامة حمراء أخرى تُستخدم عادةً في فحص الأورام الخبيثة لدى المرضى الذين يعانون من آلام أسفل الظهر: بداية خبيثة لآلام أسفل الظهر.
وفقًا لما ذكره ديو وآخرون. (1988، أعترف أن هذه دراسة قديمة جدًا)، فإن معدل الاستجابة المنخفضة + لهذا السؤال هو 1.1. وفقًا لهينشكي وآخرون (2009)، فإن نسبة انتشار الأورام الخبيثة لدى المرضى الذين يعانون من آلام أسفل الظهر أقل من 1%، ولكننا سنحسب هذه النسبة 1% فقط للتبسيط.
لذا فإن ظهور العلم الأحمر الخفي يزيد من احتمالية الإصابة بالورم الخبيث كسبب لآلام أسفل الظهر من 1% إلى 1,1% بالضبط. أعتقد أننا يمكن أن نتفق على أن هذه العلامة الحمراء يجب أن تُطرد من أي دليل إرشادي يتم إدراجها فيه.

العلاج الطبيعي لتقويم العظام في الأطراف العلوية والسفلية

عزز معرفتك حول أكثر 23 مرضًا من أمراض العظام شيوعًا في 40 ساعة فقط دون إنفاق ثروة على دورات التطوير المهني المستمر

أعلم أن هذا كان منشورًا طويلًا وأهنئكم وأحترمكم إذا وصلتم إلى هنا! كان هدفي هو أن أقدم لك شرحًا حول كيفية التعامل مع القيم الإحصائية مثل الحساسية والنوعية و PPV و NPV، وخاصةً نسب الاحتمالية وتوعيتك بأهميتها في عملية العلاج الطبيعي بأكملها.
سيكون من الرائع أن تأخذ في الحسبان مدى انتشار فرضية معينة مع مرضاك المستقبليين، وأن يكون لديك فكرة عن تأثير أسئلتك الخاصة على احتمال ما قبل الاختبار، وأن تتمكن من تقييم قوة الاختبار الخاص بك بشكل صحيح.

الإحصائيات تجعلني أشعر بالرطوبة

لا تتردد في طرح الأسئلة في التعليق ومشاركة هذه التدوينة إذا وجدت أنها مفيدة!

شكراً لك على القراءة!

كاي

المراجع

Goossens P, Keijsers E, van Geenen RJ, Zijta A, van den Broek M, Verhagen AP, et al. صلاحية اختبار ثيسالي في تقييم تمزقات الغضروف الهلالي مقارنةً بتنظير المفاصل: دراسة دقة التشخيص. J.Orthop.Sports Phys.Ther. 2015;45(1):18-24, B1

Henschke N, Maher CG, Ostelo RW, de Vet HC, Macaskill P, Irwig L. Red flags to screening for malignancy in patients with low-back-back pain. Cochrane Database Syst.Rev. 2013؛(2):CD008686. doi(2):CD008686.

Williams CM, Henschke N, Maher CG, van Tulder MW, Koes BW, Macaskill P, et al. علامات حمراء لفحص كسور الفقرات لدى المرضى الذين يعانون من آلام أسفل الظهر. كوكرين
قاعدة بيانات كوكرين Syst Rev 2013;1:CD008643.

بدأ برنامج "فيزيوتورز" كمشروع طلابي شغوف وأنا فخور بأن أقول أنه تطور ليصبح واحداً من أكثر مزودي التعليم المستمر احتراماً لأخصائيي العلاج الطبيعي حول العالم. سيظل هدفنا الرئيسي هو نفسه دائماً: مساعدة أخصائيي العلاج الطبيعي على تحقيق أقصى استفادة من دراستهم ومسيرتهم المهنية، وتمكينهم من تقديم أفضل رعاية قائمة على الأدلة لمرضاهم.
رجوع
حمِّل تطبيقنا المجاني