学ぶ
統計的検出力とは何か?| 統計力とは何か?
検出力とは、一連の同一の研究で、統計的に有意な効果(例えばp<0.05)があった場合に、それを検出できる長期的な確率である。 一連の同一研究で2型過誤が起こる確率は、検出力(1-ß、多くの場合20%)のマイナス1である。
例えば。
100の研究が、同じ集団内で、同じ治療A対治療Bの構成で実施されている。 これらの100の研究(同じ母集団、同じ分散、同じ標準偏差)に対して統計学的解析を行うと、平均して約20の研究では統計学的に有意な効果が認められない。 これは第2種の過誤率、つまり偽陰性であり、統計的検出力(1-ß)に直接関係する。
つまり、簡単に言えば、検出力が不十分な研究では、実際に差があるにもかかわらず、統計的に有意な効果が示されることは少ないということである。
これはパワーに影響する。
パワーは、p値と同じように、いくつかの要因に影響される。
- サンプルサイズ:サンプル数が多い=検出力が高い(グループ間の差が明確、データノイズが少ない)
- 分散:分散が小さい=パワーが大きい
- 効果量:効果量が大きい=検出力が高い(テストで発見しやすい)。
- 統計的検定の種類:検定によっては、より多くの仮定と引き換えに、より大きな検出力が得られるものもある(統計学にタダ飯はない)。
しかし、統計的な検出力(例えば、「統計的な検出力」)を理解することは極めて重要である。 80%)は、1つの測定手段、1つの時点、1つの効果量に対して存在する。
検出力が低い=信頼できない研究
つまり、パワー不足の研究は2型過誤(偽陰性)のリスクを増大させるが、1型過誤(偽陽性)のリスクも増大させ、効果を膨らませることになる。 これは「勝者の呪い」と呼ばれている。 これが、統計的検出力を低下させることなく、サンプルサイズに複数のアウトカム指標を投入し、複数の時点で測定することができない理由である。 優秀な研究者や臨床医は、二次的アウトカム指標は示唆に過ぎないことを知っている。 それらの提案を確認するためには、新たな研究が必要だ。 上記の問題は多重比較問題と呼ばれる。
これは少し直感に反するように聞こえるだろう。 例を見てみよう。
例えば。
あなたは200人の学生を2つのグループに分けて講義することにした。 あなたの研究の目的は、一方のグループと他方のグループとで、女性の方が多いといった性差があるかどうかを調べることである。 違いはない。 そして、目の色、髪の色、人差し指の長さ、ベンチプレスのPR、QOL、年齢、兄弟の数などを見る。 どこかで統計的に有意な結果に遭遇する可能性はある。 これが多重比較問題である。
ソリューション
検出力不足の研究や偽陽性・偽陰性のリスクを避けるため、研究者は十分な検出力をもって研究を計画しなければならない。 そのためには、サンプルサイズ、効果量、分散、使用する統計検定などの要因を考慮する必要がある。 多重検査は偽陽性のリスクももたらすが、有意水準を調整したり、偽発見率をコントロールするなどの方法で対処できる。 統計的検出力の概念と仮説検定におけるその重要性を理解することで、研究者は信頼できる有意義な結果を生み出す研究を計画することができる。
参考文献
今学んでいることが好きか?
フィジオチューターアセスメントブックを購入する
- 600ページ以上の電子書籍
- インタラクティブ・コンテンツ(ダイレクト・ビデオ・デモンストレーション、PubMed記事)
- 最新の研究によるすべての特別検査の統計値
- 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷 で利用できる。
- その他にもいろいろある!