・もともとはBMJで認知症のうつについてのネットワークメタ解析の論文(BMJ 2021;372:n532 | doi: 10.1136/bmj.n532)が出たので、それについて記事にしようかと思ったら、思いがけない方向にいってしまったので、まとめておきます。

・そもそもネットワークメタ解析については、いろんな批判もあり、以前も触れたようにバイアスの影響をとても受けやすいこと(Trinquart L et al. PLoS One. 2012;7(4):e35219. doi: 10.137)や、組み込まれた各試験のエビデンスの質がわかりにくく(この点、従来の直接比較のメタ解析のforest plotは、何本の介入試験が統合されているのかなどの情報が明示されるため、まだ直感的にわかりやすい)、結果の解釈には注意を要します。

・その点において、2020年の藤田医大の岸先生らの報告(Kishi T et al. Mol Psychiatry. 2020 Nov 11. doi: 10.1038/s41380-020-00946-6)にみられたようなConfidence in Network Meta-Analysis (CINeMA)を用いたgrade表記などは、ネットワークメタ解析における結果の信頼性を併記するという点で素晴らしいものだと思いました。

・ネットワークメタ解析の結果に注意すべき具体例を挙げると、例えば2011年のBMJ誌に掲載された全般不安症に対するネットワークメタ解析の論文(BMJ. 2011 Mar 11;342:d1199. doi: 10.1136/bmj.d1199.)があります。

・結果を見ると、やたらフルオキセチンの結果が良好で、有効性に関して第一位、フルオキセチンすばらしいという結論になっているのですが、いざその根拠となった論文をみてみると、フルオキセチンについてはたった1つだけの介入試験しかなく、しかもフルオキセチンの症例数は33例、さらにこの介入試験は大うつ病に全般不安症を合併した症例に対するベンラファキシンとの比較試験です(純粋に全般不安症の患者を対象としたものではない)。

・従来のメタ解析においては、このような単一の介入試験がメタ解析の対象として組み込まれることはないので、まずこのようなバイアスリスクの高い結果を主張するようなことは起こりません。この報告をみて一気にネットワークメタ解析への信頼感が薄れ、警戒心が高まりました。少なくともこの報告については、科学的に信頼に足る結果とはとてもいえません。しかも著明な雑誌にこのような結果が掲載されてしまうのですから、恐ろしいことです。ネットワークメタ解析の結果については批判的に吟味しなくてはならないのはこのような理由からです。

・ちなみに現段階でそこそこあてにすべき全般不安症のネットワークメタ解析の結果は、2019年のlancet(Slee A. et al. Lancet. 2019 Feb 23;393(10173):768-777)あたりでしょうか。2020年にもより解析対象を絞ったネットワークメタ解析(Kong W. et al. Front Pharmacol. 2020 Nov 11;11:580858.)が出ていますので、こちらもチェックしておきたいところです。

・そのような実例を勉強会で具体的な例で示そうと思い、ちょうど良いと思って、統合失調症のpredominant negative symptom症例に対する介入試験のメタ解析の報告(Mark Krause et al. Eur Arch Psychiatry Clin Neurosci. 2018 Oct;268(7):625-639.)を基に、いかに従来型のメタ解析とネットワークメタ解析が異なり注意が必要かについて示そうと思ったら、思いがけず、元論文の間違いではないかという点を見つけてしまい(結果的に間違いとは言えなかったのですが)、corresponding authorのLeucht教授(世界的に超有名な方です)にメールしたところ、思いがけず返信をいただいて、その内容に納得したところです。

・まず、この論文の主要な結果を示します。

fig05s

・この図でわかるように、メタ解析が可能なのはアミスルプリドくらいしかなく、他の薬剤については介入試験が1つか2つ程度しかないため、エビデンスは不十分であり、明確な結論を引き出すことができないことがわかります。直接比較のメタ解析では、このようなこともforest plotから読み取れるのでわかりやすいです。

・ところが、実際のところ、このようなデータしかなくても強引にネットワークメタ解析を施行することはできてしまいます。この点については、この論文の著者もネットワークメタ解析を当初行おうと思ったけども、結果のinconsistencyが大きく断念したと記載されています

・いざネットワークメタ解析をしようと思った場合、特にmulti-armsの介入試験の場合には元データから新たにデータを作り直す必要がある場合があるため、multi-armsの介入試験(この図ではLecrubier 2006にあたる)については元論文をあたって、元データを取り出して、そこからRでのネットワークメタ解析に使用できるデータに変換する必要があります。

・そこで元論文(Acta Psychiatr Scand 2006: 114: 319–327)を眺めてみたところ、主要評価項目はSANS summary scoreとなっています。結果はどうかというと、24週間でのベースラインからの変化量は、アミスルプリド群 -4.3点(SD 4.9)、オランザピン20mg群 -4.0点(SD 5.1)、オランザピン 5mg群-4.7点(SD 5.3)、プラセボ群 -3.1点(SD 4.8)とのことでした。ここから標準化平均差(SMD)を出すことは各群のnがわかれば手計算で簡単にできて、アミスルプリド群は0.237(SE 0.21)、オランザピン群は5mgと20mgをひとまとめにして、0.178(SE 0.209)となります、アミスルプリド群とオランザピン群とのSMDは-0.06(SE 0.169)となります。

・さて、Krauseらの論文とおんなじかなと思い確認したら、なんとこの論文ではアミスルプリドのSMD 0.04、オランザピンのSMD -0.03とあるではありませんか。この理由がどうしてもわからなくて、だめもとでLeucht教授にメールしてみました。そしたら思いがけず返信をいただいて驚愕しました。

fig01s

・何度かやりとりをしたのですが、結論から言うと、Krauseらの論文では、主要評価項目としてPANSS negativeをまず第1に設定していて、その次にSANSなどとしており、どちらのデータもある場合にはPANSS negativeをとるということでした(Lecrubierらの論文の本文中にはPANSS negativeの数値がないのですが、おそらくどこからかデータをもってこられたのでしょう)。あらかじめ設定したルールに従って解析したということです。

・ただ陰性症状の評価尺度としてはSANSの方が優れているので、この点は確かに議論の対象となりうることだとメールにありました。Leucht教授は精神医学の分野におけるEBMにおいては世界トップクラスの業績を上げておられ、極めて重要な論文も数多く公表されおられる大先生で、お忙しい中このような日本の片田舎の一臨床医の質問にも丁寧にお答えいただき実にありがたいことでした。

・というわけで私は、SANSを使って勝手にネットワークメタ解析を進めたわけですが、その結果は以下となります。(いつものようにRのnetmetaパッケージを使って、頻度論によるネットワークメタ解析をしています)

fig02sfig03sfig04s

 

・このような解析をしてはいけませんよという注意喚起でやってみたネットワークメタ解析ですが、なにやら面白そうな結果がでてしまいました。Meiji SeikaファルマのMRさんが喜ぶかもしれない結果ですが、この結果も先に述べたようにエビデンスの質という観点から注意して解釈いただくことが必要となります(規模はまあまあ大きく、異質性も小さいのですが、アセナピンについては1つのグループだけからの2つの介入試験の結果から構成された結果のため)。

・ちなみにKrauseらのデータによるNMAでは問題となったinconsistencyの問題ですが、Lecrubierらの論文に関してSANSを使用すると、inconsistencyは問題なく、異質性に関する指標I^2についてもQ^het=0.343, d.f.=3から0となり(ネットワークメタ解析では、I^2=max((Q-d.f.)/Q,0)で決定するため)問題がない状況に落ち着いています。

・この結果にpartial agonistがどう食い込んでくるのかなど、今後注目すべき事柄となります。