メタアナリシス(解析)とは?意味と読み方・書き方

メタアナリシスとは、バイアスや偶然の影響を最小限にするための解析方法です。
ここ数年、わが国でも(Evidence-based medicine, 科学的根拠に基づく医療)に対する関心が高まり、メタアナリシスという用語も注目されつつあります。

しかし、メタアナリシス自体はそれほど新しいものではありません。1976年にGlassがEducational Researchに発表したのがメタアナリシスの歴史の始まりで、当初は統計学的有意差を検定することがメタアナリシスの目的でした。

※システマティックレビューを詳しく知りたい方はこちらのページを見て下さい。

その後、複数の社会学者の手によって育て上げられ、オッズ比(odds ratio, OR)やリスク比(risk ratio, RR)、平均値の差(absolute difference, AD)などの効果量(effect size)が推定できるようになりました。

同じ研究テーマのデータから統計的に統合することは1900年頃に既に行われていますから、研究統合の歴史は決して短くありません。

研究結果をオッズ比などで定量的に表す分析がメタアナリシスで、Evidence-based medicineの検証手順でまとめた分析がシステマティックレビューです。システマティックレビューは批判的吟味という過程を重視しており、定量的に表す(オッズ比)かは問いません。

メタアナリシス(メタ解析)の方法


ここでは、統計学的手法のひとつであるメタアナリシスの入門として全体像をご紹介しますが、その前に統計の理由についての誤解を解いておきたいと思います。

統計は研究データが出た後にだけ使うものと思っている方はいらっしゃらないでしょうか。

データをまとめて計算処理して有意差を求めたりすることは検定であって、統計の一部でしかありません。疑問を解明しようとしたりするところから研究が始まります。テーマを証明するためには研究をデザインし、データを取り、検定を行ないます。

この研究の道のりを明るく照らすのが統計学です。本来、統計学とは研究のはじめから終わりまで一貫して利用するものです。

テーマの決定からデータの検討まで

メタアナリシスの手順は表のようになります。研究テーマを決定し、複数の研究データを統合しようと仮説を立てるところからメタアナリシスが始まります。

次に仮説を証明する方法をできるだけ具体的にデザインし、評価する指標(エンドポイント)を決定します。

メタアナリシスでは研究資料の収集後、採用するデータを決定しますが、この採用基準はデザインの段階で決めておかなければなりません。また、統計解析方法(検定方法)や統合データの評価方法についてもデザインの段階で決定します。

1. 研究テーマの決定と仮説の設定
2. デザインとエンドポイント
3. 研究資料の収集
4. 適格基準によるデータ抽出
5. 抽出データの統合
6. 統合データの検討

一次的分析とメタアナリシス

一次的分析とは、「収集されたデータを、そのデータを収集した目的のために分析すること」、言い換えると「あるテーマについての研究で被験者からデータを収集したときに行う分析」です。この一次的分析の流れをメタアナリシスの流れと比較してみます。

一次的分析では、まず研究テーマを決定し仮説を立て、研究方法をデザインしエンドポイントを設定します。デザイン時には被験者(患者・学生など)をどのように選択するのかの基準を決めておきます。

また、統計解析方法(検定方法)やデータの評価方法についてもデザインの段階で決定します。あとは完成したデザインに沿って分析を進めていきます。収集したデータを決定し、結論を得れば分析終了です。

メタアナリシス論文の読み方


メタアナリシスには再現性がなければいけませんから、明確で系統的な手順で資料を検索する必要があります。

はじめてメタアナリシスを行う研究者は、その作業の膨大さに驚くかもしれません。地道な作業ですが、メタアナリシスのテーマに関連する資料をもれなく探します。

次に、集めた研究資料を選択します。ここで適切な適格基準の作成が求められます。
苦労して集めたデータを最大限に生かせるような適格基準を、数値データを眺める前に完成させてしまいます。

研究資料の収集

メタアナリシスにおいて収集対象となるのは、対象とする母集団に存在するすべての研究資料です。

1. 学術雑誌に掲載されたすべての原著
2. 1に加え、短報、学会発表、博士論文や専門書などに発表されたあらゆる研究
3. 1に加え、未発表だがすでに終了している学術雑誌に掲載予定の原著
4. 2に加え、未発表だがすでに終了しているあらゆる研究

すべての資料を解析に利用することでバイアスを排除します。

しかし、妥当性のないような、精度の低い研究をたくさん集めるのは考えものです。メタアナリシスの精度を保つためには、精度の高い研究のみを解析の対象とする必要があるからです。

したがって、すべての研究を収集するといっても、やみくもに多数の研究を対象とするのではなく、メタアナリシスのテーマや目的に応じた母集団を決めておくことが必要になります。

資料収集の母集団を決めたら、MDLINEなどを利用して研究資料を収集していきます。

資料収集の対象とする母集団

メタアナリシスの資料収集対象となる母集団としては、上にあげた4つがあり、それぞれに以下のような特徴があります。

メタアナリシスにおいては、「1.学術雑誌に掲載されたすべての原著」が選択されることが最も多いと考えられます。その理由は、研究の信頼性が高いこと、収集が比較的容易であることの2つでしょう。この母集団の欠点としては公開バイアスの危険性があげられます。

公開バイアスとは、学術雑誌などに掲載された論文データの偏りのことを指します。雑誌には有意差のある結果が掲載されやすいため偏り(出版バイアス)が生じるのです。

「2. 1に加え、短報、学会発表、博士論文や専門書などに発表されたあらゆる研究」は1に比べて公開バイアスを小さくできますが、反面、研究の信頼性は1に劣ります。研究資料を選択する基準を正しく設けることで、信頼性を大きく損ねる危険を回避できます。しかし、収集に必要な時間と労力は1よりはるかに大きくなるでしょう。

「3. 1に加え、未発表だがすでに終了している学術雑誌に掲載予定の原著」は信頼性が高く新しい研究結果を1に追加できます。原著のみからなるメタアナリシスを行うのであれば、1よりも望ましいでしょう。原著になるような研究であれば、学会などで発表されている可能性がありますから、日常から専門的な学会・研究会に参加したりする努力が必要でしょう。

「4. 2に加え、未発表だがすでに終了しているあらゆる研究」は4つの中で最も公開バイアスを小さくすることができます。しかし、収集に必要な労力は計り知れません。

どの母集団を選択するにしても、選択した理由をプロトコールに記載しておかなければなりません。

適格基準の作成

メタアナリシスでは、収集した研究資料の中から統計解析に利用する資料を選び出します。その基準となるものが「適格基準」です。適切な適格基準でバイアスを排除し、メタアナリシスの再現性を保証するものです。

・研究デザイン

研究デザインには、様々なものがあります。メタアナリシスでは基本的に同一の研究デザインの研究データを統合します。

特に、実験的研究であるランダム化比較試験(randomized controlled trial, RCT)と非ランダム化比較試験は、後者で有意差が出やすいというデータがあるので、統合すべきではないでしょう。RCTのみを対象にしたメタアナリシスは、米国医療政策研究局が1993年に発表したエビデンスレベル分類で最高レベルに位置しています。

非実験的研究を統合するメタアナリシスでは、どの研究デザインの統合が正しい結論を導くかは判断できません。研究デザインの違いに関わらず、すべての非実験的研究を統合したほうがいいかもしれません。ただ、研究デザインの違いによって統計学的に不均一な場合があり、均一性の検討が必要です。

・出版・研究の時期

出版・研究の時期については、選択した理由とともにその時期を明記します。新しい情報はなるべく含むようにします。

・言語

言語については、英語が対象になるケースが多くなってしまいます。
MEDLINEでは、英語抄録が掲載されない雑誌の研究文献については、題名しか掲載されません。題名のみでは内容を判断し難いため、全文が英語で記載された論文か、抄録が英語で記載された論文のみがデータ抽出の対象となりやすいのです。

英語抄録のない他言語の文献の情報を得るには、論文を手に入れて翻訳するしか方法がなく、費用も時間もかかります。しかし、可能な限り英語以外の言語による研究資料も収集するのが理想です。

・複数発表における選択基準

同じ被験者のデータが2つ以上の論文に掲載されることがあります。これらの論文のデータをメタアナリシスで統合するのは誤りです。メタアナリシスは「互いに独立な研究を統合する」統計解析であるからです。複数発表の研究資料がある場合は、その中からどれを選択するかの基準が必要です。

・サンプル数、観察期間

メタアナリシスのデータ統合方法の1つであるgeneral variance-based methodでは、サンプル数の少ない研究結果が統合結果に大きな影響を及ぼす傾向があります。この方法を用いるときは、サンプル数の少ない研究を除外する基準を作成します。

研究テーマによっては、観察期間の適格基準が必要となることがあります。
例えば、喫煙と肺癌の発生率の関係を調べるときに、喫煙開始5年後と20年後では発生率に差があると推察されます。このような場合は、研究テーマを「20年以上の喫煙での肺癌発生率」、適格基準を「20年以上の観察期間」などとします。

サンプル数、観察期間については適格基準による不適格論文の除外を行わずに、統計処理ののちにサンプル数、観察期間について検討する方法もあります。

上の例で言えば、「5年以上の喫煙」と「20年以上の喫煙」についてそれぞれデータを統合し、2つの統合結果に差があるかを検討します。このような分析を感度分析といいます。

・類似治療・曝露および類似効果の許容範囲

治療や曝露およびその効果を統合する際に、どの程度までを同じとみなして統合するのかは重要なポイントです。同じとみなす範囲は広すぎても狭すぎても問題があります。

例えば、降圧薬の効果を調べようとするときに、β遮断薬、Ca拮抗薬、ACE阻害薬などあらゆる降圧薬を対象にすれば、データ統合によって得られた効果は過剰に普遍的になってしまいます。

逆に条件を厳しく、例えば降圧薬を1種類だけにすれば、統計学的妥当性は高くなりますが、適格基準を満たす論文が少なくなり、「検出力を上げる」というメタアナリシスの目的の1つが果たせない可能性が増えてしまいます。

・基準を満たした不完全な報告の適格性

収集した研究報告の中には、上記の適格基準すべてを満たしてはいるものの、学会発表の抄録やレターなど、研究論文を比較して不完全な報告もあります。

これらの不完全な報告は、適格基準を満たすかどうか判断できないこと、投稿論文で行われるような精度での査読が行われていない可能性があること、という理由で不適格になり得ます。

しかし、不完全な報告の研究が雑誌の論文より質が劣るとは一概にいえないこと、公開バイアスの存在を考えれば、適格基準を満たす報告はメタアナリシスに含めるほうがよいでしょう。サンプル数・観察期間と同様に、適格基準を作成せずに不完全な報告を含める場合と含めない場合の統合データを求め、感度分析を行うという方法もあります。

メタアナリシスグラフの容易な書き方

ペン
対象となるデータが揃ったら、データを統合します。統合の方法は1つではありません。それぞれの方法の特徴を知り、データを処理する意図によって使い分けます。統合の計算には統計ソフトウェアやネットワーク上のエクセル解析シートなどを利用しましょう。

メタアナリシスでのデータ統合方法

基本的なデータ統合方法は、以下にあげた4つです。分析のために利用する研究結果が「2×2分割表」で提示されるタイプ(例:薬剤の治療効果のあるなしをみた研究)の場合には、以下のすべての方法を適用できます。

収集した研究データデータ統合の方法モデル
2×2分割表Mantel-Haenszel method母数効果モデル
2×2分割表Peto method母数効果モデル
2×2分割表、値の差general variance-based method母数効果モデル
2×2分割表、値の差DerSimonian-Laird method変量効果モデル

一方、研究結果が「値の差」として提示されるタイプ(例:2つの薬剤による血圧変化をみた研究)の場合には、general variance-based method(一般的な分散に基づく方法)または、DerSimonian-Laird methodの2つの統合方法を使用できます。

統合の方法を正しく選択できれば、正しいデータ統合を行えます。方法を正しく選択するために必要となる各方法の特徴をこれから紹介します。

母数効果モデル・変量効果モデルとデータ統合方法の選択

メタアナリシスの背景となる基本モデルには、母数効果モデル(fixed effect model)と変量効果モデル(random effect model)の2つがあります。

母数効果モデルは、「すべての研究における効果の大きさのばらつきは偶然誤差のみが原因であり、すべての研究における真の効果の大きさは共通である」という仮定のモデルです。

効果の大きさ(effect size)とは、オッズ比や平均値の差などの研究結果のことを指します。
例えば、薬剤Aの副作用をプラセボと比較した3つの研究結果であるオッズ比が、2.6,
4.8, 3.3 だったとします(2.6, 4.8, 3.3をそれぞれの研究の効果の大きさといいます)。

この結果のばらつきの原因は偶然による誤差のみだというのが母数効果モデルの考え方です。

一方、変量効果モデルは、「すべての研究における効果の大きさのばらつきは偶然誤差と研究ごとの偏りが原因である」という仮定のモデルです。
例えば、上記の薬剤Aの例での2.6と4.8の差の原因は誤差だけではなく、プロトコールや患者背景の違いなどによる影響もあるだろうと仮定するのが変量効果モデルです。

2つのモデルによるメタアナリシスにはそれぞれ異なった適性があります。
例えば薬剤の治療効果データを統合する場合を考えると、母数効果モデルは「収集した研究で治療の効果があったか」という分析に適し、変量効果モデルは「将来、治療の効果があるのか」という分析に適しています。

なぜなら、母数効果モデルでは本来存在するはずの各研究の偏りを無視しているため、統合データの母集団は各研究の母集団を足したものに近くなってしまうからです。変量効果モデルでは偏りを加味しているため、統合データの母集団はより包括的な母集団を想定することになります。

言い換えると、母数効果モデルでは研究内分散のみを統合データに反映させていて、変量効果モデルでは研究内分散と研究間分散の両者を統合データに反映させているということです。

では、変量効果モデルのほうが母数効果モデルより優れているのか、というとそうでもありません。

変量効果モデルでは研究間分散を加味しているため、均質性のないデータを変量効果モデルのもとに統合しても、不均質だという事実は解決しません。また、均質なデータに変量効果モデルを適用すると、母数効果モデルの統合結果に比べ信頼区間が広くなり慎重な結果になることがあります。

変量効果モデルを使ったときのメタアナリシスの統合データと母数効果モデルでの統合データの2つの結果の間には、差があまりない場合と大きな差がある場合があります。
差が少ないのは、統合する元の研究データ間のばらつきが強くなく、均質性があるときです。均質性があるときにはモデル選択の重要性は低いといえます。

しかし、ばらつきが大きくを認めるときは、2つの統合データに差が生じます。母数効果モデルでは異質性を仮定していませんので、不均質(異質)な研究データを母数効果モデルによる方法で統合してはいけません。

このような場合は、変量効果モデルによる方法を使用すべきです。

funnel pot

funnel potを作成すれば、公開バイアスを視覚的に検討することができます。
funnel potとはx軸に研究の効果、y軸に研究の例数または標準誤差の逆数をとり、各研究をプロットしたものです。x軸に対数オッズ比、対数リスク比、リスク差、平均値差などをとります。

あるテーマの研究データを、同一の母集団からまったく同じ条件で繰り返し測定してfunnel potを行うと、母集団全体から得られる効果の真の値を中心として左右対称にプロットされます。そして、例数が多いほど真の値に近い測定値が得られます。

したがって、公開バイアスがまったくなければ、funnel potは漏斗を逆さにした形状になります。もし、漏斗の形状の一部が欠けていれば、公開バイアスの存在を疑うことになります。

funnel potはメタアナリシスにおいて公開バイアスの存在を推定する手段として利用されています。

しかし、メタアナリシスでは同一の母集団からのデータのみを統合するとは限りません。そのためfunnel potが左右対称になる保証がないことも知っておかなければなりません。

まとめ

有名雑誌に掲載されたすべての研究報告の信頼性が高いとは限りません。自ら文献を読み、その信頼性と適用する価値を評価し選択した臨床研究報告が「入手できる最良の根拠」であるかを吟味します。

現代の医師に求められるのは文献検索だけでなく、質を評価して取捨選択する能力です。批判的吟味とは臨床研究結果の妥当性(validity)・重要性について、長所短所とも客観的に慎重に検証することです。

臨床研究の結果は偶然の影響にも左右されますので統計学的検定による精度評価が必要です。

創業4年で売上を1億⇒30億へ急増させた通販企業の秘密

薬事法ドットコムでは、多数の成功事例があります。
・やずや様・・・売上30億⇒470億
・サニーヘルス様・・・売上70億⇒500億
・新日本製薬様・・・売上30億⇒200億
・美容液I様・・・創業4年で売上30億
など
このような急成長を遂げた通販企業の秘密を知りたくありませんか?
無料メルマガでは、そのような成功企業の秘密を公開しています。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です