医学論文の英語校正ならジーニアスプラス

適切なデータ収集と解析をする

適切なデータ収集と解析をする

688402_s捏造・改ざん・盗用は研究における三大御法度です。そしてこのようなことが起こらないようにするためには研究者自身が心を強く持つこと(一種の職業倫理ですね)が大事ですが、そういった不正が起こらない仕組みを整えることも重要です。研究に必要なデータの収集、保管、加工、解析のあり方について説明したいと思います。

 

1.収集するデータの種類と方法

研究で必要なデータを集める際には、データソースとデータ抽出方法によって注意すべき事がかわります。以前から臨床試験といえば患者個票(case report form:CRF)を記載し、事務局に提出する、というのが王道でしたが、近年は電子カルテなどのデータベースから必要なデータを抽出するという研究も徐々に増えてきました。

いずれの場合においても電子カルテなどの診療情報を元にしているのであればそれが「原資料」ということになります。

 

2.収集するデータの品質

データベースからどのようにデータを引っ張ってきたか、プログラムを保管してプロセスを管理しておく必要があるでしょう。

診療記録から転記して作成するCRFは、原資料ときちんと整合性がとれているかをモニタリングする必要がある場合があります。

同じように診療記録からの転記をパソコンやタブレット上でおこなうこともあります。Electric data capture (EDC)といわれますが、代表的なのがREDCapなどですが、これは修正した場合に自動的にログが残ることで改ざんを防止する仕組みになっています。

研究を実施するためのデータがどのように現実に起こっていることを反映しているか、プロセスを含めて透明性を高め、追跡可能性(トレーサビリティ)を担保しておくことが重要です。

 

3.データクリーニングと解析について

収集してきたデータをそのままの形で解析することはできません。欠損の確認、外れ値、入力ミス、転記ミスなどがあるかもしれません。また解析に必要な変数を既存のパラメータの組み合わせによって生成する必要もあります。

そのようなプロセスをデータクリーニングといいます。

研究期間中にデータを預かるデータセンターが重大な欠損値、外れ値、入力・転記ミスが疑われるデータについて、研究を実施している施設に照会をするといったことがモニタリングといいます。実際に施設を訪問することもあります。

データ固定後は研究者自身によりデータ加工を行うことになります。このときにどのようにデータを加工したか、欠損値をどのように扱ったかなどはすべて研究論文に記載することが必要なことです。

あとから結果に疑義が生じた場合にそれを追跡できることが必要ですので、クリーニングのプロセスや解析のプロセスの可視化しておくことが望まれます。そこで研究者自身が解析ソフトなどをプログラミングベースで取り扱えるようにしておくことが重要です。

 

4.データの保管について

医学研究のデータは個人情報だらけです。従ってその取り扱いはたとえ氏名や住所などの個人を識別する情報が削除されていても十分に注意を払って取り扱うべきです。

連結表がある場合はその連結表を使って個人を特定することができるため、研究用データとは別に保管する必要があります。

そして、研究結果の信頼性担保のため、研究が終わって成果が発表されてからもさらに数年間は保管することが義務づけられています。

侵襲(軽微な侵襲を除く。)を伴う研究であって介入を行うものを実施する場合には、少なくとも、当該研究の終了について報告された日から5年を経過した日又は当該研究の結果の最終の公表について報告された日から3年を経過した日のいずれか遅い日までの期間、適切に保管(医学系指針第 20 (5))

このように研究対象者の情報保護と研究結果の信頼性担保の意味からデータ保管については細心の注意を払う必要があります。

 

5.データの”操作”をしない

捏造・改ざんは厳禁です。しかし人間は弱い生き物です。成果を出さねばならないプレッシャーなどが人の心を歪めてしまうことは残念ながらありえます。

重要なことは、そういったことが起こらない体制を整えることです。組織としてガバナンスを確立することに合わせ、研究者個人のレベルでも透明性を高めておくことが重要です。

組織として不正を防止する手立てとして以下のような方法が考えられます。

  • 監査証跡を残せるEDCをデータ収集に用いる
  • 研究計画書・解析計画書の事前提出
  • セキュアなデータ保管のためのサイバースペースの確保(入退室管理などの物理的管理も含める)
  • モニタリング手順、データクリーニングのプロセス可視化
  • 解析プログラムのダブルチェック(別の共著者に実施してもらうなど)
  • 解析実施記録(またはログ)保管の義務化
  • 論文執筆時に剽窃防止のため英文校正前後で剽窃チェックツールを使用する

研究の種類によってはここまでの厳しさは要求されないでしょうが、これらの法規はどんどん厳しい方向に向かっています。できることからはじめてみてはいかがでしょうか。

 

まとめ

捏造・改ざん・盗用の三大御法度を防止するためにも研究用データの管理の一連のプロセスの可視化は非常に重要です。何より研究対象者のプライバシー保護のためにも個人情報保護の重要性はますます重要性を増しています。