人を対象とした研究(臨床研究)を実施する上で、どんな人を対象にして、どのくらいの人数規模で実施するか、ということは非常に切実です。また対象者の選び方によっては大きく偏りがでてしまうことがあります。研究の対象となる集団を適切に選び出し、適切な人数だけを偏りなく集めるためにはどうすればいいのでしょうか?今回はその解説を行います。
対象者が母集団の代表となるように設定する
ある研究を実施するとき、対象となる集団を想定しますが、そういった対象集団のことを「母集団」と言います。より正確に言えば、母集団とは、「条件を満たすすべての患者」ということになります。研究対象者はその母集団から「ランダムに」抽出した代表者である必要があります。現実の世界から限られた数の標本を集めることを「サンプリング」といい、そのような集団のことを「サンプル」と呼びます。よく誤解されるポイントですが、選び出された集団のことを母集団とは呼ばないことに注意しましょう。
ではどのように選んでくるのでしょうか?そこら辺にいる人を捕まえてくればよい、という条件のものから、ある特定の疾病、あるいは投薬を受けている患者であって、研究に適したタイミングである、という厳しい条件が必要な場合もあり、サンプリングの難易度はバラエティーに富んでいます。しかしここで注意したいのは、背景特性に偏りがあると、選択バイアスを生じうるため、比較の質を落としかねない、ということです。
母集団を適切に設定するために選択基準と除外基準をしっかり決める必要があります。これを元にして現実の世界では研究対象者を集めてきます。
偏りがないように集めるにはどうしたらよいでしょうか?一人の医療従事者の担当する患者さんだけよりも複数のほうがよいですし、病院全体の傾向をつかむのに1つの病棟だけよりも複数の病棟のほうがよいでしょう。また、より大規模な研究となってきた場合には単施設よりは多施設のほうが偏りは少ないとされます。このように施設を増やすことで、単純にサンプル数を増やすという事以上のメリットがあるのです。
必要十分な対象者を設定する
では、対象者の数はどのように決めるのでしょうか?それには2つの約束があります。
- 必要対象者を研究開始前に決める必要がある
- 必要対象者数は主要評価項目に対して求める必要がある
対象者数を研究開始前に決める必要性について
「サンプルサイズ設計」という言葉をお聞きになったことはあるでしょうか?これは研究を始める前に必ず行う統計手法の1つで、必要な標本の数を見積もるために行います。
多ければ多いほどよいのか、というとそうではありません。数が多すぎることで統計学的な有意差が付きやすくなるのが一つ目の理由です。事前の仮説があって、その仮説を示すに必要十分な症例数というのは計算上求めることができます。詳しくは正書に譲りますが、そのサンプルサイズ設計に基づいて必要症例数を算出することを事前に行うことが求められるのです。また、もう一つの理由としては、コストがかかりすぎる、ということです。対象者1人増える毎に書かねばならぬ書類はそれだけ増えますし、検査や治療薬にもお金がかかります。なのでできる限り最小限で抑えたい、というのが偽らざる本音でもあるのです。
必要対象者数は主要評価項目に対して求めなければならない点について
臨床試験のエンドポイントというのは一次エンドポイントと二次エンドポイントとありますが、必ず一次エンドポイントに基づいて設計を行う必要があります。これは、例えばランダム化比較試験などを行うときにはそのエンドポイントに基づいてサンプル設計をし、ランダム化を行うからです。二次エンドポイントに基づいて計算としてしまうと、後出しじゃんけんになってしまうというのが問題です。また、特に介入研究においてはプライマリーエンドポイントのみが本来の正しい結果として解釈されます。つまりそれ以外のアウトカムを中心に論じるときにはすでにそれは介入研究の域を出てしまっているかも知れないのです。
まとめ
以上まとめますと、必要症例数は事前に十分な検討を行う必要があるということ、そして一次エンドポイントに基づいて症例数設計を行うということが最重要ポイントとなります。これは決まりきったお作法なので、きちんと従来からの方法を押さえておけばよいということになります。また、文章としては非常に明快であり、すでに出版されている数多くの論文にある記載から大きく外れることは少ないと思われますので、過去の論文を読み込んで記載の参考にされるとよいと思います。もちろん剽窃は問題です。英文校正に出す際にはそういった剽窃がないかについてご自身での確認や専用のソフトウェア、あるいは校正者に直接お願いされることをお勧めします。