p値の価値

himaginary氏がp値について取り上げています。この中で,Philip B. Starkが次のように述べております(訳は,himaginary氏のもの)

 科学の進歩の一部は、データに関する説明の候補を除外することから成り立っている。p値は、ある説明が適切かどうかを評価する助けとなる。評価の対象となる説明は「帰無仮説」と呼ばれることが多い。
 もしp値が小さければ、説明が誤っているか、説明は正しいが何か起こり難いことが起きたか、のいずれかである。その起こり難いことの確率はp値に等しい。小さなp値は説明が誤っている強い証拠である。即ち、データはその説明に疑義を投げ掛けている、ということである。
 もしp値が大きければ、その説明はデータを適切に表現している。ただ、それでもその説明が誤っている可能性はある。大きなp値は説明が正しい証拠にはならない。説明が誤っている証拠の欠如は、説明が正しい証拠ではないのだ。もしデータが少量もしくは低品質ならば、あまり証拠を提供することはできず、そこで話は終わる。
 説明が適切か否かの明確な線引きは存在しない。科学的な文脈が問題となるのだ。
 p値は説明が正しいと仮定して計算される。p値は説明が正しい確率ではない。
 p値は効果の大きさないし重要性を測るわけではないが、実際の効果と偽の効果を区別する助けになる。その点で、効果量や信頼区間の推計を補完する。
 また、p値は、「効果量」という概念が意味を持たない状況でも使用できることがある。そのため、効果量や信頼区間の推計が役に立たない状況でも役に立つ可能性がある。…
 多くの分野や多くの学術誌では、p値が0.05のようなある閾値より低い場合、そしてその場合のみ、結果が科学的に立証された、と見做している。これは科学としても統計学としても劣悪なやり方であり、pハッキングや選択的報告や多重性の無視や不適切ないし不自然な帰無仮説といった方法で分析を「弄ぶ」インセンティブを研究者に与えてしまう。
こうした誤用は、後で間違いであることが明らかになったり再現ができなかったりする科学的「発見」につながりかねない。それが現在の科学の「再現性危機」の一因となったのである。

コメントを残す

メールアドレスが公開されることはありません。

Time limit is exhausted. Please reload CAPTCHA.

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください