西洋科学を用いた医学研究では、仮説を設定し、仮説を検証する研究が主流です。研究計画を明確にし、仮説を立てたあと、その仮説を検証できる適切な統計方法を選択できるか否かが、研究結果と論文の質に大きく関わります。臨床研究では、治療の効果の大きさを求めることが目的であり、治療方法が病気を治癒できる程度と範囲をデータを基に求める必要があります。今回の記事では、仮説の検証が可能な統計の設定の方法について説明します。
仮説検定とは
仮説検定、もしくは統計学的仮説検定とは、母集団について立てられた仮説を、サンプリングと呼ばれる標本(研究の対象者)に基づいて検証することを目的としたものです。客観的に実証できる方法であり、西洋科学の基本でもあります。仮説が100パーセント実証されることはまずなく、仮説の実証においては、仮説とのずれももちろん見られます。そのずれに有意性があるか否かを検証するのも統計法の大切な目的です。100パーセント実証されず、まれに実証されないケースもあります。まれに実証されない事象がありますが、その「まれ」という基準は曖昧なものです。したがって、人の判断基準に判断されないために、まれの基準を定める有意水準も同じく設定します。
統計法の決定は研究前に行います。これは西洋科学は仮説の科学であり、仮説を実証していくことが研究方法です。したがって、設定した仮説を実証するための過程、研究方法を先に計画しなければならないので、仮説検証のための統計法も同様に研究計画を立てている際に決定しなければいけません。そして仮説の検証が可能な統計を用いることは言うまでもありません。仮説の検証ができる統計法を用いるためには、まず一番明らかにしたいことを1つ定めた主要評価項目と、それに伴い検証したい副次評価項目(複数可)を設定し、研究を経て何を明らかにしたいのかを明確化します。そして、それらの評価項目を検証する適切な統計法を選ぶことが研究の成功に関わってきます。統計法の方法やソフトなどは多岐にわたるので、選択は慎重にならなければいけません。
仮説の検証における決まり事
まず、研究者の考えを仮説として立てます。その際、「結果はこうなる」と断定的な言い方をします。曖昧な表現になってはいないかを、英文校正の際には注意深く英文を吟味しましょう。そして、自分の仮説を否定する帰無仮説も立てます。帰無仮説とは統計的に否定することができる仮説を指します。検証結果が正しいか間違っているかの判断が曖昧になってしまった時に、間違っていないので正しいという結論付けをしてしまわないために帰無仮説を設定することが大切です。統計法を決定したあとは、実際に仮説が実証できるかどうか実験・検証を行います。自分の仮説が正しいと実証するだけでなく、帰無仮説もきちんと否定できるかどうかも実証しましょう。帰無仮説を否定できるのであれば、研究者が立てた仮説が正しいと結論付けることができます。
エフェクトサイズ、信頼区間について
信頼区間とは、立てた仮説が実証される確率のことです。前述したように100パーセント実証される仮説はまずなく、「まれな事象」はかならずあります。信頼区間で表された確率は、同じ研究を行った場合同じ結果が得られる確率のことで、逆に言えば、数パーセントの確立で実証されないことを指します。臨床研究等で仮説検定を用いて仮説を実証する際、治療効果がある、もしくはないの二択でディスカッションをしてしまうのは望ましくありません。それよりも、その治療法の効果の大きさを示すことのほうが医学界にとっては価値ある情報になります。医療業界に従事する研究者はその結果を基に、自身の患者の治療法を決定します。つまり、仮説検定の主な目的は、「Decision Making(決定)」の指標を示すことであり、治療効果の大きさを示すことが医療の進歩にもつながります。したがって、研究者は仮説検証においてその仮説の信頼区間も併記することが重要となります。
留意点
研究対象者の規模により、有意差は変わってしまいます。例えば、研究対象者の人数が多いため、治療効果が少なくても「統計法により有意」と示すことができる場合もあり、反対に、人数が少ないため、治療効果が大きくても「統計的には有意ではない」と結論づけられてしまうこともあります。しかし実際に治療効果が大きく臨床的に有意であるとされるならば、統計法だけによって仮説の実証をすることが避けられなければいけません。臨床研究を行う研究者は、統計学による有意と臨床的な優位を区別し、臨床的な優位も検証し、研究デザインに入れることが大切です。論文において曖昧な表現は禁物です。仮説の実証、帰無仮説の否定が断定的かつ矛盾のない表現で記述されているか、優位性が明確に書かれているかを英文校正で必ず確認し、論理的かつ明瞭に詳述しましょう。