医学論文の英語校正ならジーニアスプラス

仮説の検証が可能な統計を設定しよう!

仮説の検証が可能な統計を設定しよう!

1224206_s研究を実施するときに、得られたデータを客観的に評価するときに統計学的に検定を行うことが多いですが、適切な統計手法を選んで実行することが必要です。最低限の生物統計に関する知識が必要といえます。しかし詳しく統計学を学ぶ前に、押さえておきたい最低限のことについて今回は説明してみたいと思います。

 

統計法も研究前に決める

研究計画書を作成するときにサンプルサイズを最初の段階で決めておくことはすでに述べているのですが、統計手法についても研究を行う前に決めておくことが必要です。世の中には様々な統計手法が存在しています。手当たり次第に実施すると少しずつ結果が異なることがあります。

もし最初の段階で指定していない場合には、都合のよい方法を選択してしまう可能性があり、いわゆる「後出しじゃんけん」状態になってしまうことがあります。これでは研究の公平性が担保されません。よってどのような集団にどんな統計手法をどの段階で用いて検定するのかを指定しておくことが重要です。

主に介入を要する研究においてはこのような厳密な方法をとることが一般的です。後ろ向きの観察研究においてはその限りではありませんが、どちらにしても計画段階でどのような統計手法を用いるかについては十分に議論を尽くしておくことが重要です。

最初の段階で統計まで含めて議論しておけば論文の「方法」の部分はもう書くことができます。それだけかけたからと言って英文校正にだすのは請求ですが…。

 

仮説の検証が可能な統計法を用いる

そもそも統計を使う目的というのは、何らかの差を検出するために行うのですが、結果は実質的な差、比べる群内のばらつき、サンプル数に依存します。つまり数を増やせば非常に小さな差であっても統計学的には有意になってしまう可能性があるということが言えます。

自分が示そうと思っている仮説が正しく検証できているかどうかは、実質的な差がきちんと存在していて初めて成立するものであるはずです。

サンプルサイズが少なかった

という言い訳を時々耳にすることがありますが、それはどんな研究結果においても大なり小なり成立しうることですので、結果が有意でなかったときにはサンプルサイズが小さかったことだけで説明しようとしてしまうのは乱暴なのです。

また適切な統計モデルを選択するということと正しい前提に基づいたモデルのあてはめ、というのも重要です。

線形の関係(Yに対するXの関係が直線的であること。Xが1増えるとYがいくつ増える、というのが正比例するもの)になっていなければ成立しないモデルであるにもかかわらず、YとXの関係がU字型の相関を持っている、などの状況ではうまく当てはまりません。

また、「比例ハザードモデル」という医学研究でよくつかわれる統計モデルは、二つの曝露状態におけるハザード関数が平行であることが前提として必要です。そういった前提が崩れてしまったときの対処方法も含めて計画しておく必要があります。

このように、統計モデルの最低限の前提を確認することは非常に重要です。

 

エフェクトサイズと信頼区間について

エフェクトサイズ、というのは実質的な効果量のことを指します。何かの治療が、何もしなかった場合に比べてどのくらい効果があるのか、あるいは何かの危険因子がある場合、ない場合と比べてどのくらい危険性があがるのか、ということを示します。多くの場合は発生率の比をとるか差をとることになります。

そして真実の値というのはサンプル集団に応じて微妙に変化します。この真実の値のばらつき具合を表現したものが信頼区間ということになります。統計モデルでは一つの効果量である点推定値と信頼区間(通常は95%信頼区間)が出力されます。

比で効果の比較を行った場合には、発生率比が大きくなるときは信頼区間の下限が1を超えていると有意である、と言えます。逆に発生率比が下回るときには信頼区間の上限が1を下回るときに有意であると判断されます。いずれにしても信頼区間の中に1を含まないことで統計学的な有意性を示すことができます。

差で効果の比較を行った場合には0を信頼区間の中に含まないことで統計学的な有意性を示すことができます。

さらに効果の差の逆数、特に発生率の引き算の逆数を取ることでNumber needed to treat(=何人に治療薬を使うとイベントの発生を防ぐことができるか)を求めることができます。これも効果の大きさを表現するのに便利な指標になります。

重要なのは、単にP値のみに着目するのではなく、効果の大きさ自体に着目するということです。

 

まとめ

このように、研究を実施することを決めた後には研究計画の中に統計学的な検討を加えることが必須です。統計を考慮に入れることで前もって症例数を見積もることができ、また効果の推定を正しく行うことができます。最初の段階で計画しておくことが重要ということになります。

効果の推定は比や差で表現しますが、信頼区間がそれぞれ1,0を跨がないことで統計学的な有意性を示すことができます。

重要なのは、統計学的に有意であるかどうかだけではなく、効果の大きさを表現すること、そのために点推定値と信頼区間を評価することが重要です。研究計画段階でそのような統計学的な検討をしっかり行っておくことが重要です。