ダミーのための感度、特異度、予測値、尤度比

統計学は、理学療法士や理学療法を学ぶ学生にとって、最も混乱しやすいテーマの一つである。 おそらくこれは、私たちが数学よりも人間や健康に気を遣っているからだろう。
まあ、あなたが患者を適切に評価すること、良いハンドリング、最新の治療法に関心があるのはわかるが、特別な検査の統計的な値や、アナムネスティック・プロセス全体で患者に質問する際の有病率、検査前、検査後の確率についての数字まで知っておく必要があると言わざるを得ない!
あえて言うなら、上記の数字を知らなければ、患者にする質問(とその答え)にどれだけの価値を置くことができるのかがわからなくなり、プラスかマイナスかの結果が何を物語るのかがよくわからないまま、特別な検査を行うことになる。
理学療法士が半月板病変に対してテッセリーテストのような特別なテストを行い、それが陽性で、その後に患者が半月板病変であることを100%確信しているという話を見聞きすると、私はぞっとする!
そんなことはやめてくれ!
この記事では、より良い理学療法士になるために統計学をどのように活用できるのか、また活用すべきなのか、そしてその知識によって臨床推論プロセスに対する意識をどのように高めることができるのかについて述べる!
一般的には、まずスクリーニングを行い、次にアナムネシスを行い、基本的な評価を行う。 前述のパートで得た情報を基に、あなたは確認したい、あるいは否定したい仮説を立てる。 ここで感度と特異度が重要になる。 そこでまず、感度と特異度とは何かを見てみよう! 一番簡単な方法は、少し前に作った短いビデオを見ることだ:
というわけで、もう一度まとめる: 100%感受性の検査で陰性であれば病気を除外することができ(SnNOut)、100%特異的検査で陽性であれば病気を除外することができる(SpPIn)。
100%感受性のある検査で陰性であれば病気を除外することができ(SnNOut)、100%特異的な検査で陽性であれば病気を除外することができる(SpPIn)。
SnNOutとSpPInの2つのニーモニックがあれば、この2つのコンセプトを実践するのは比較的簡単だ。
ほとんどの場合、2×2の表を使ってこれらの値を計算することができれば、その定義と実際の値をよりよく把握することができる。 次のビデオでは、計算の仕方を紹介する:
残念ながら、現実の生活では100%正確な検査はほとんどないため、偽陽性や偽陰性の結果が多くなる。 その上、感度と特異度によって、すでに病気であることがわかっている患者とそうでない患者で、検査が陽性になる頻度がわかる。 しかし実際には、患者が特定の状態にあるかどうかはわからない。 私たちが実際に行うのは、陽性または陰性の検査結果を解釈することである。
通常、患者が実際にその病気にかかっている確率がどの程度か、また、患者がその病気にかかっていない確率がどの程度かまではわからない。
これらの値は陽性適中率(PPV)と陰性適中率(NPV)と呼ばれ、検査後確率とも呼ばれる。 ご想像の通り、2×2表を使ったこれらの値の説明と計算方法を紹介する別のビデオがある:
さて、ビデオで述べたように、PPVとNPVは、患者群の有病率について十分な考えがあり、この有病率がRCTの有病率と同じであれば、素晴らしいツールである。 そうでなければ、PPVもNPVもほとんど意味がない。
前十字靭帯(ACL)断裂のテスト前の確率が、さまざまな環境でどのように変化するかを想像してみよう: 例えば、一般診療所におけるACL断裂患者の有病率は、膝の怪我を専門とするスポーツクリニックよりもはるかに低いだろう。 有病率が高ければ高いほど、PPVは高くなり、NPVは低くなる。
しかし、PPVやNPVよりも優れた値が必要であることを忘れてはならない。
尤度比は、感度と特異度の両方を兼ね備えており、ある検査結果が、その疾患を持つ人においてどの程度可能性が高いかを、その疾患を持たない人においてどの程度可能性が高いかと比較して教えてくれる。 尤度比とその計算方法について、以下のビデオをご覧いただきたい:
この例では、臨床の現場で最も正確な検査のひとつであるラクマン・テストを使ったが、私たちの大好きなテッサリー・テストと、この例がどのように作用するのかを見てみよう:
グーセンスらによれば、「このようなことは、このような弊害をもたらす可能性がある」という。 (2015)によると、Thessalyテストの感度は64%、特異度は53%で、LR+は1,36、LR-は0,68となる。 すでにおわかりのように、これらの値はLR=1にかなり近く、半月板病変がある確率をほとんど変えないことを物語っている。 これらの値をACL断裂の例に当てはめると、ACL断裂はしばしば半月板断裂を伴うことがわかっている。 この患者はロッキングやキャッチングの感覚を訴えていないが、検査前の確率は約30%と推定される。
ノモグラムはこのようになる:
より正確な)計算に基づくと、テスト後の確率は以下のようになる。
- テスト前の確率: 有病率/(1-有病率)=0,3/(1-0,3)=0,43
- 試験後のオッズ(LR+): 0,43 x 1,36 = 0,58
- テスト後の確率(LR+): 試験後のオッズ/(試験後のオッズ+1)=0,58/(0,58+1)=0,37(だから 37%)
- テスト後のオッズ(LR-): 0,43 x 0,68 = 0,29
-テスト後の確率(LR-): テスト後の確率/(テスト後の確率+1) = 0,29/(0,29+1) = 0,22(22%)
つまり、テッセリーテストが陽性であれば、メンヘル病変の可能性は30%から37%に増加し、テッセリーテストが陰性であれば、その可能性は22%に減少する。
もし人々が検査を行い、その患者がある状態に間違いなくある、あるいはないと決めつけるとしたら、なぜ私がパニックになるのかわかるだろうか? そしてこれはすべて、ほとんどの人が考慮することさえ忘れている、テスト前の確率の仮定に基づいている!
複数の検査を行いたい場合、例えばACLの例で前方引き出し検査を追加したい場合、検査前の確率を、検査後の確率であるラクマン・テストを基準にする。 つまり、ラクマン陽性の場合は検査前確率95%、ラクマン陰性の場合は検査前確率19%でスタートすることになる。
ほとんどの検査は陽性か陰性の結果を示すが、複数の結果を示す検査群もある。 つまり、たとえばラスレットのクラスターを例にとれば、5件中2件が陽性ならLR+は2.7、3/5ならLR+は4.3といった具合だ。
しかし、検査前の確率が非常に高い場合、別の検査はほとんど意味がなく、治療を開始した方がよいことに注意してほしい。 検査前の確率が非常に低い場合も同様で、その場合は検査を行わず、治療も行わない。
例えば、突然の腰痛、両脚の神経症状、排尿障害、サドル麻酔を訴える患者がいた場合、この患者は馬尾症候群であり、緊急手術が必要な赤信号であることは間違いない。 つまり、診断が99%確実な場合、LR-が0.2の直脚検査(SLR)を行えば、検査後の確率は95%に低下する。
もし検査が陽性だった場合、おそらく99%から100%の確信が得られるだろう。
テスト前の確率が非常に低い場合も同様である。 膝下に放散痛のない患者が来院した場合、この患者が椎間板ヘルニアによる放散性症候群である可能性は非常に低く、仮に5%とする。 では、この場合、一眼レフをLR+2.0で撮影したらどうなるだろうか? 検査後の確率は10%で、検査が陰性であれば検査後の確率は4%程度まで下がるだろう。 では、もし患者がある病気にかかっていないとほぼ確信しているのなら、そもそもなぜ検査をするのか?
もちろん実際には、ある検査を行うかどうかの判断は、費用、病気の重症度、検査のリスクなど、さまざまな要因によって常に左右される。
さて、冒頭で私が主張したことに戻ろう。統計的な数値は、患者さんの問診の結果を評価するのに役立つということだ。
実際、すべての質問は特別なテストと見なすことができ、その答え(イエスかノーか)によって、患者がある状態にある確率が高くなるか低くなるかのどちらかになる。 また、患者の答えに基づいて仮説を立てる方法を知っている優秀な臨床医であれば、
、基本的に特別な検査を連続して行うことになるため、特別な検査よりも徹底的なアナムネシスが重要な場合がほとんどである理由もここにある。
では、別の例を挙げてみよう: コルチコステロイドの長期使用に関する質問に対する肯定的な回答は、脊椎骨折の可能性にどう影響するか?
によると ヘンシュケほか (2009)によると、コルチコステロイドの長期使用はLR+が48.5と陽性である。 Williamsらによると、プライマリ・ケアに来院する脊椎骨折の有病率(検査前確率)は1%~4%と推定される。 (2013)は、腰痛を呈する患者を対象としている。
従って、コルチコステロイドを長期間使用した場合、この計算例では有病率を1%と仮定しているが、検査後の確率は33%となる。
副腎皮質ステロイドに関するこの質問は、脊椎骨折のスクリーニング検査で常に尋ねられるべきだと思う!
では、腰痛患者の悪性腫瘍スクリーニングによく使われる、もう一つの赤信号を見てみよう: 腰痛が発症した。
によると Deyo et al. (1988年、かなり古い研究であることは認める)、この質問のLR+は1.1である。 Henschke et al (2009)によると、腰痛患者における悪性腫瘍の有病率は1%よりさらに低いが、ここでは簡単のため1%として計算する。
つまり、レッドフラッグの陰性の発症は、検査後に腰痛の原因として悪性腫瘍の確率を1%からちょうど1,1%に高めることになる。 この赤旗が掲載されているガイドラインは、すべて除外されるべきだということに同意できると思う。
長文になったことは承知しているが、ここまで辿り着けたならおめでとうと敬意を表したい! 私の目標は、感度、特異度、PPV、NPV、特に尤度比のような統計的数値の扱い方について説明し、理学療法プロセス全体におけるそれらの重要性を認識してもらうことだった。
もし、あなたが将来の患者について、ある仮説の有病率を考慮に入れ、アナムネスティックな質問が検査前の確率に与える影響について考えを持ち、特別な検査の検出力を適切に評価することができれば、素晴らしいことだ。
コメントで質問したり、このブログ記事が役に立ったと思ったらシェアしてほしい!
読んでくれてありがとう!
甲斐
参考文献
カイ・シゲル
フィジオチューターズCEO兼共同創設者
新着ブログ記事を受信する
今すぐ登録して、最新のブログ記事が掲載されたら通知を受け取ろう。