-
メタ解析に思うこと
2020年05月12日
メタ解析といえば教科書的にはエビデンスの上位に位置するものとなりますが、解析対象となった論文の内容によっては、必ずしもそうではないものとなりうることに注意が必要な実例がいくつもありますので、とりあげてみたいと思います。
今回の記事を書くきっかけになった論文は2020年5月15日付のJournal of affective disorders誌に掲載された「Comparative efficacy and tolerability of pharmacological treatments for the treatment of acute bipolar depression: A systematic review and network meta-analysis」(文献1)となります。
私の知る限り、クエチアピン3)やルラシドン4)など特定の薬剤に着目したもの以外では、2014年に報告されたbipolar depressionのネットワークメタ解析(文献2)以来、6年ぶりのbipolar depression急性期に対する薬物療法のネットワークメタ解析の論文になります.
ネットワークメタ解析自体、結果のrobustnessという点で脆弱性を感じます。
MANGA study9)が報告されたころに、自分でWinBUGSを導入して手元にあった介入試験でネットワークメタ解析をしてみましたが、1つ論文が入るのとないのとで結果がコロコロ変わってしまってとまどった記憶があります。
publication biasの影響をとても受けやすい解析手法とはいえると思います。実際にそのような脆弱性を指摘した論文もあります(文献5)。
ネットワークメタ解析は、バイアスに対する脆弱性の高い解析手法として注意を要します。
また初期のころにはrankingといっておそらく統計の専門家なら疑問を感じるであろう有意差なき順位付けをしていた点で、違和感を感じてしまうこともあったのですが、とても流行っているので、とりあえずみてみようということになります。
今回の報告の新しい点は、これまでのbipolar depressionに対するメタ解析では気分安定薬や抗精神病薬などについては解析対象となっていたが、抗うつ薬も含めての薬剤毎の報告はなされてこなかったので、各抗うつ薬を含めて解析してみたということです(結果的にこれが落とし穴になってしまったのですが)
以下結果の概略です
方法と対象
Pubmed,Embaseなど主要な文献データベースの他、trial registerやICTRP(WHO’s International Clinical Trials Registry Platform)などを用いて非公表の結果も探索した
双極性うつ病急性期(DSM-IIIからDSM-5、ICD-10)に対する単剤療法(Olanzapine/fluoxetine合剤を除いて)の二重盲検無作為割付試験(プラセボ対照ないし実薬対照)
有効性についてはMADRSやHAM-Dなどの評価尺度が50%改善した割合(反応率)
忍容性については完遂率で評価(あらゆる理由による中断)
50 RCTを解析:抗精神病薬(クエチアピン、ジプラシドン、オランザピン、アリピプラゾール、カリプラジン、ルラシドン)、抗うつ薬(イミプラミン、tranylcypromine、フルオキセチン、パロキセチン、セルトラリン、モクロベミド、エスシタロプラム、ベンラファキシンフェネルジン、クロミプラミン、フルボキサミン、イダゾキサン、ブプロピオン)、気分安定薬(divalproex、ラモトリギン、カルバマゼピン、ガバペンチン、リチウム、合剤(オランザピン/フルオキセチン合剤))N=7528、プラセボ N=3920
方法:ネットワークメタ解析結果
有効性について、対プラセボで有意差があったのはtranylcypromine(対プラセボの反応率のOR 16.87 ,95%CI 4.52;62.91)、ベンラファキシン(OR 5.13 ,95%CI 2.23;11.83)、フルオキセチン(OR 3.76 ,95%CI 1.59;8.92)、divalproex(OR 2.94 ,95%CI 1.33;6.46)、イミプラミン(OR 2.87 ,95%CI 1.31;6.32)、オランザピン/フルオキセチン合剤(OR 2.57 ,95%CI 1.93;3.41)、ルラシドン(OR 2.53 ,95%CI 1.88;3.39)、クエチアピン(OR 1.87 ,95%CI 1.62;2.17)、カリプラジン(OR 1.58 ,95%CI 1.19;2.08)、ラモトリギン(OR 1.53,95%CI 1.23;1.90)、オランザピン(OR 1.49,95%CI 1.19;1.86)の順番であった。CANMATの最新のガイドライン20186)の推奨する、クエチアピン、ルラシドン、リチウム、ラモトリギン(以上第1選択)、divalproex、カリプラジン、OFC(以上第2選択)に近い結果となった(リチウムはnegativeだったが)
一方で、エスシタロプラム、カルバマゼピン、セルトラリン、リチウム、パロキセチン、アリピプラゾール、ガバペンチンなどは単剤では双極うつ病急性期にプラセボに対する明らかな優位性は確認できなかった
忍容性についてはアリピプラゾールのみプラセボと比較して有意に脱落が多い結果となった。ベンラファキシン、tranylcypromineはプラセボよりも脱落率が有意に低かった。
治療誘発性の躁転リスクについては、クエチアピンのみプラセボよりも有意にリスクを低下させるとの結果(OR=0.55)であったコメント
ルラシドンはOFCに近くなかなかいい印象なので、3月25日に発売されたラツーダは期待できそうです。(5月24日追記:発売されたじゃなくて発売承認されたの間違いでした。発売日は6月11日とのことです)
ここからは問題点の指摘になります。ベンラファキシンとフルオキセチンのORが良好な数値になっており、対プラセボでも有意にbipolar depressionの改善に有効であるかのようにみえていますが、実はこの結果は、ペンシルベニア大学のAmsterdamグループ単独の報告(例えば文献7、文献8)です。
このグループが主張し続けてきたのは、bipolar II depressionにおいては抗うつ薬単独であっても、躁転リスクはリチウムなどと変わらず、治療効果は良好ですよという主張であり、2000年前後くらいからずーっと一貫して主張し続けてこられたことなのです。
bipolar Iは含まないというのがポイントで、このグループはbipolar II depressionに限っては、抗うつ薬単独でも安全で有効ですよということをがんばって訴え続けておられるのです(おそらく世界的に広くは受け入れられてはいませんが)。
なので、今回のメタ解析のように、bipolar depressionとしてIもIIも一括りにしてしまうと、amsterdamグループの主張とは別の解釈が独り歩きしてしまい誤った解釈がなされてしまう危険すらあります。なので専攻医の皆さんは、メタ解析の結果だけをみるのではなく、必ずある程度はどのような文献が解析対象となったのか、目を通すようにしてみてください。
他にもネットワークメタ解析が変な結果を生み出した実例はあるのですが、ここでは割愛します。ひとえにメタ解析といっても、いろんな質のものがあるので注意してみることが必要です。
引用文献
1)Bahji A et al. J Affect Disord. 2020 May 15;269:154-184. doi: 10.1016
2)Taylor DM et al. Acta Psychiatr Scand. 2014 Dec;130(6):452-69
3)Kishi T et al. J Psychiatr Res. 2019 Aug;115:121-128. doi: 10.1016
4)Ostacher M, et al, World J Biol Psychiatry. 2018 Dec;19(8):586-601. doi: 10.1080
5)Trinquart L et al. PLoS One. 2012;7(4):e35219. doi: 10.137
6)Yatham LN et al. Bipolar Disord. 2018 Mar;20(2):97-170. doi: 10.1111
7)Amsterdam, JD,et al. Am. J. Psychiatry2010 Jul;167 (7), 792–800.
8)Amsterdam, JD J. Clin. Psychopharmacol.1998.;18 (5), 414‐417.
9)Cipriani A et al. Lancet. 2009 Feb 28;373(9665):746-58. -
SEP-363856とTAAR1アゴニスト作用
2020年05月08日
4月16日付のThe New England journal of medicine誌に「A Non-D2-Receptor-Binding Drug for the Treatment of Schizophrenia.」という論文が掲載されて、Non-D2か、なんだクロザピンのことか?と思ったら、まだ名前もついていない新規化合物(SEP-363856)の第2相試験の結果で、しかもよくわからない受容体がでてきたのでちょっと調べてみました。
よくわからない受容体というのは、TAAR1(trace amine-associated receptor 1)というもので、普段は細胞内にいたり、細胞膜に出てきてD2受容体と同時局在化したりしているそうです。
TAAR1のアゴニストというのが、trace aminesというものらしく、まずはそこからwikipediaなどで調べてみました。
trace aminesとは
モノアミン神経伝達物質に構造的に類似しているが、典型的なモノアミンと比較して、生体内での濃度が低いことが特徴で、TAAR1(trace amine-associated receptor 1)アゴニストとして機能する。
中枢神経におけるtrace aminesの生合成経路としては、チロシンからAADCによりtrace aminesの一種であるp-Tyramineが合成され、p-TyramineからはCYP酵素によりドパミンが合成される。ドパミンからはCOMTを介してtrace aminesの一種である3-Methoxytyramineが合成される。
生体内では中枢神経、末梢神経に分布している。
trace amineはモノアミン神経系におけるシナプス間隙におけるモノアミン神経伝達物質の量を制御する役割を有している。TAAR1(trace amine-associated receptor 1)とそのアゴニストの機能について
TAAR1(trace amine-associated receptor 1)はG蛋白共役型の細胞内受容体で、胃や小腸などに分布する他、中枢神経のモノアミン神経系のシナプス前終末内に分布しており、神経伝達物質の放出を調節する機能を有する。
(ここからは文献1からの引用となります)
アンフェタミンはTAAR1活性化作用を有する。
ノルエピネフリン、セロトニン、ヒスタミンはすべてTAAR1の部分アゴニストであり、ドパミンはTAAR1に親和性の高いアゴニストである(ドパミン過剰で自身の発火頻度を低下させる自己調節作用のように機能するのでしょうか。多分選択性が低いので、通常はそこまでTAAR1を介した作用は目立たないのでしょう)
中枢神経におけるTAAR1は辺縁系とアミン系において豊富に発現しており、腹側被蓋野/黒質ドパミン系と背側縫線核セロトニン系の投射先に一致している。これら神経伝達物質の活動性を制御するのに適した配置となっている。
TAAR1欠損マウスにおいては、ドパミン神経およびセロトニン神経の発火頻度が顕著に亢進しており、TAAR1活性化はモノアミン神経伝達をダウンレギュレートすることを示唆している。2004年にTAAR1の強力なアゴニストとして発見されたT1AMは動物モデルでの実験で、低用量では食行動減少、高用量では摂食行動の増加、一方で視床前野への投与で覚醒度の増加、NREM睡眠の減少などが観察された(これら作用はアドレナリン作動性およびヒスタミン作動性の調節によるものと推測された)。
またT1AMは学習促進効果も観察されている(これについてはヒスタミン神経系を介することを示唆する報告がある)。
TAAR1とドパミン系との関連については、TAAR1をノックアウトしたマウスでは、野生型のマウスと比較して運動機能、行動テストでは変化がないものの、アンフェタミンやMDMA投与後の運動量増加は野生型よりも多く、これら薬物への感受性亢進を示した。
一方TAAR1アゴニストは、アンフェタミン誘発性の運動亢進を抑制し、コカイン投与後の運動増加に対するオランザピン投与による抑制作用を増強した。
このことはTAAR1がドパミン作動性神経伝達を調節していることを示唆するものである。NMDA受容体拮抗薬もまた運動を増加させるが、この多動性は抗精神病薬によって抑制される。
ドーパミン作動性精神刺激薬と同様に、TAAR1アゴニストはNMDA受容体拮抗薬であるフェンサイクリジンによって誘発された過活動を抑制した。TAAR1のグルタミン酸神経系への影響を示唆するものである。
TAAR1アゴニストは、ラットにおいてPCP反復投与によって誘発された実行機能障害を完全に逆転させた。統合失調症の認知機能障害に対しても有効な可能性があるADHDの病態とドパミントランスポータ(DAT)の機能不全との関連が報告されている。
DATノックアウトマウスはADHDモデルマウスとして知られている。TAAR1アゴニスト投与はDATノックアウトマウスの多動性を改善することが報告されており、ADHDモデルマウスに対するメチルフェニデート類似作用を有する。
一方でTAAR1の欠損は、前頭前野におけるグルタミン酸伝達欠乏に関連する固執性と衝動性亢進と関連することが示されている。
TAAR1アゴニストは、強迫行為の動物モデルである、スケジュール誘発性多飲行動を抑制した。
強迫性障害とTAAR1の関連性を示唆するものであり、OCD治療に対する可能性も期待されている。
TAAR1部分アゴニストにおいては、ラットの強制水泳テストにおいて抗うつ薬類似作用を示し、ストレス誘発性高体温テストにおいて抗不安作用を示唆する効果をみせた。これら効果は部分アゴニストにおいてのみ観察された。
TAAR1部分アゴニストは動物モデルにおいてコカインの嗜癖行動を減少させ、依存症治療にも有望な可能性が示されている。
またTAAR1活性化は、覚醒剤により誘導される報酬と動機付けのプロセスを制御していることがわかっており、動物実験では覚醒剤を求める嗜癖行動を減少させることが示されている。TAAR1と睡眠覚醒リズムとの関連も報告されており、TAAR1過剰発現マウスでは覚醒亢進が、TAAR1ノックアウトマウスでは覚醒度の低下とNREM睡眠増加が報告されている。
TAAR1過剰発現はまた、青班核ノルアドレナリン作動性神経と腹側被蓋野のGABA作動性ニューロンの発火を増加させ、これらはいずれも覚醒促進と関連している。
これらのことよりTAAR1アゴニストはナルコレプシー治療にも適応できるのではないかと期待されている。
(ここまで文献1からの引用)
以上のように、TAAR1は中枢神経でいろいろな役割を果たしており、TAAR1アゴニストが基礎実験レベルで様々な精神疾患に対しても有効性が期待できることがわかりました。
続いて、今回の主役である、SEP-363856について、文献2で調べてみました。以下文献2からの引用となります。ただし、動物実験の細かいところはよくわからないため割愛しています。
SEP-363856について1950年代のクロルプロマジンの発見以来、多くの新規抗精神病薬が上市されてきたが、ほぼ同様な作用機序であり、D2受容体遮断やセロトニン2A受容体遮断を介した陽性症状の改善をターゲットとしてきた(セロトニン2A遮断が陽性症状の改善に寄与しているかどうかについては、あまり単純な話ではないため、ここでは触れないでおきます。たとえばセロトニン2A受容体と自我障害との関連については文献3などの興味深い報告がヒントになるかもしれません)。
一方で陰性症状や認知機能障害については現在の抗精神病薬による治療では治療効果は不十分である。さらにおよそ30%の患者が治療抵抗性といわれている。
従来の創薬戦略は、目的とする受容体に対する高い選択性と親和性を有する薬剤を開発することが主体であった。しかし精神疾患においてはターゲットとすべき受容体がよくわかっていない場合も多く、うまくいっていない。
そこで研究者らは、ターゲットとする受容体を決めるのではなく、疾患の臨床表現型を改善しうる薬剤を求めて開発を行う方向性も模索している。そのような創薬戦略で探索されている治療薬候補の中には、抗てんかん薬や抗ウイルス薬などが含まれている。
今回のSEP-363856開発においても、マウスの行動プラットフォームを用いたin vivoでの薬剤スクリーニングと、同時にin vitroでのD2受容体ないしセロトニン2A受容体への直接的な親和性がなく、抗精神病薬類似の効果を有する薬剤のスクリーニングを行い薬剤探索を行った。
SEP-363856はD2受容体ないしセロトニン2A受容体を介さずに、in vivoにおいて抗精神病薬様の効果を示し、統合失調症の陽性症状および陰性症状に対しての有効性が期待できる物質である。
詳細な作用メカニズムについては不明な点があるが、薬理学的解析によるとTAAR1(trace amine-associated receptor 1)およびセロトニン1A受容体に対するアゴニスト作用を有することを示唆する結果が得られている。
統合失調症のみならず、その他の精神疾患への有効性も期待できる薬剤と思われるSEP-363856の受容体親和性は、in vitroの実験により、TAAR1、セロトニン1A受容体、セロトニン7受容体、セロトニン1B 受容体、セロトニン1D受容体、セロトニン2B受容体、α2A受容体に対するアゴニスト作用を有し、D2受容体に対しては弱い部分アゴニスト作用を有することがわかっている。
細胞培養の研究により、TAAR1は通常細胞内に位置しているが、細胞膜においてD2受容体と同時に局在化することも明らかになっている。
SEP-363856はフェンサイクリジン投与マウスの過活動を抑制し、Prepulse Inhibitionの障害を改善するなど、抗精神病薬としての特性が期待できることが明らかとなった。またSmartcube Systemというマウスの行動観察プラットフォームにより、SEP-363856は抗精神病薬としての特性を有することがわかった。
SEP-363856 は 腹側被蓋野神経細胞を抑制するが、これはTAAR1 の活性化を介する可能性が高い。しかしながら抑制は記録された細胞の半分にしか認められず、SEP-363856による腹側被蓋野神経細胞の選択的な抑制を示唆している。
セロトニン1A受容体は、背側縫線核、皮質、大脳辺縁部前脳領域(海馬や扁桃体など)で高密度に発現しており、基底核、視床、黒質、腹側被蓋野では低密度に発現していることが確認されている。背側縫線核では、セロトニン1A受容体は自己受容体であり、神経細胞の発火を抑制する働きをしている。対照的に、海馬と扁桃体ではセロトニン1A受容体はシナプス後受容体として存在する。
セロトニン作動性神経系は統合失調症の病態生理に関与している可能性が報告されている、その一部はセロトニン2A拮抗薬の抗精神病作用と関連する可能性がある3)(セロトニン2A遮断薬のピマバンセリンが第2世代抗精神病薬との併用の統合失調症に対する第3相試験(NCT02970292)が2019年に終了し結果はnegativeでしたが、併用した抗精神病薬はリスペリドンなどのSDAも含まれており、すでにセロトニン2A受容体が強力に遮断された状況下で併用投与されており、これは問題だったと思われます)。
さらに、セロトニン2C拮抗薬およびセロトニン2A/セロトニン2Cの両方の受容体を標的とする化合物(例えばリタンセリン、バビカセリン、ミアンセリンなど)は、統合失調症において一定の有効性が期待できる可能性があることが報告されている(例えば Int Clin Psychopharmacol. 2002 Mar;17(2):59-64)。
うつ病や不安症に対するセロトニン1Aアゴニストの抗うつ薬併用の治療効果についてはエビデンスがあるが、これらの受容体が統合失調症にどのように寄与しているかについてはあまり知られていない。
統合失調症患者の大脳皮質と扁桃体におけるセロトニン1A受容体密度の変化が、死後脳研究6)や神経画像研究7)によって明らかにされている。
セロトニン1A受容体の活性化は、D2受容体遮断による錐体外路症状を防ぎ8)、前頭皮質のドパミン作動性神経伝達を調節し9)、NMDA受容体拮抗薬によって誘発された認知障害や社会的相互作用障害を減弱させることが、齧歯類モデル動物で示されている8)。
さらに、セロトニン1A受容体での部分アゴニスト作用とD2受容体の部分アゴニスト作用を有するアリピプラゾール、ブレクスピプラゾール、カリプラジン、セロトニン1A部分アゴニスト作用を有する、ペロスピロン、ルラシドンなどは、より治療上の利点が存在することが期待される。
TAAR1アゴニストや多くの抗うつ薬(特に セロトニン1A 活性を有するもの)はレム睡眠抑制作用を示すが、これはほとんどの D2 阻害作用を有する抗精神病薬では観察されない。したがって、SEP-363856 で観察された強いレム睡眠抑制作用は、TAAR1アゴニスト作用と セロトニン1A 受容体アゴニスト作用の相乗作用によるものである可能性がある。(ここまで文献2からの引用)
動物実験では統合失調症への効果が期待できそうなことがわかりました。最後に今回の第2相試験の報告の概略です。
SEP-363856の統合失調症に対する第2相試験4)
背景
SEP-363856の作用機序は十分にはわかっていないが、TAAR1とセロトニン1A受容体に対するアゴニスト作用があることが報告されている2)。
TAAR1アゴニスト作用により、中脳腹側被蓋野の神経発火を抑制し、ドパミン神経の発火を抑制する。
またSEP-363856はケタミンにより誘発された線条体ドパミン合成亢進を抑制することがマウスの実験で報告されている。
さらにシナプス前ドパミン神経の機能不全を改善することも報告されている。
セロトニン1Aアゴニスト作用を有しており、これを通じて背側縫線核の神経活動を減弱させることが報告されており、フェンサイクリジン誘発性の過活動をおそらくはセロトニン1A受容体活性化により抑制することが報告されている。
以上よりD2受容体を介さないメカニズムにより統合失調症に対する有効性が期待できるため、急性増悪を来した統合失調症患者において無作為割付比較試験を行った(第2相試験)対象と方法
無作為割付二重盲検プラセボ対照比較試験
18歳から40歳までの統合失調症患者(DSM-5)であり、2か月以内の期間において精神病症状の急性増悪をきたした入院患者。CGI-Sで4点以上かつPANSS totalで80点以上。これまでに3回以上の入院歴がある患者は除外
ヨーロッパと北部アメリカの34カ所の施設で行われた。
14日間までのスクリーニングとwashout期間を設けた。この間に全ての向精神薬は中断された
SEP-363856は1日1回眠前投与で用量は50mg~75mgまででflexible
試験期間は4週間
アカシジアなどのEPSに対して抗コリン薬ないしプロプラノロール併用は許可
ロラゼパム、テマゼパム、エスゾピクロンは不安や不眠に対して屯用での使用を許可
主要評価項目は、PANSS totalの4週間での変化量で、副次的評価項目としてCGI-S、BNSS(陰性症状尺度)、MADRSなど
SEP-363856群 N=120
プラセボ群 N=125
結果
エントリーされた患者の平均罹病期間は約5.4年程度。ベースラインのPANSS totalは約100点
4週間の試験期間中、抗不安薬の併用はSEP-363856群32名、プラセボ群30名、睡眠薬の併用はSEP-363856群10名、プラセボ群15名
脱落率はSEP-363856群26名(うち副作用10名、有効性欠如5名)、プラセボ群26名(うち副作用8名、有効性欠如4名)
有効性については、4週間のPANSS totalの変化量はSEP-363856群 -17.2点、プラセボ群 -9.7点で有意差あり
4週後のBNSSのプラセボ群との差は-4.3点(有意差あり)、MADRSの差は-1.8点で有意差あり
EPSの出現率はSEP-363856群 3.3%、プラセボ群 3.2%考察
結果をみて最初の印象は、プラセボの反応が大きいことでした(PANSS totalで10点近く)。このように大きなプラセボレスポンスの介入試験の結果は、ここ最近ではブロナンセリンのパッチ剤の第3相試験、ブレクスピプラゾールの第3相試験などでみられており、なぜここまでプラセボが大きな改善を示すのか、よくわからないといったところです(ドパミン過感受性との関連などが言われていますが、いまいち納得できてません。そういえば年々プラセボ反応率が上昇しているという論文も2017年に出てました5))。
TAAR1アゴニストについては覚醒亢進作用が言われていましたが、そのような副作用はなかったようでした。安全性はかなり高いようです。
第2相にしてはまあまあの規模の多施設介入試験で有効性が確認されましたので、第3相試験にも期待してしまいますが、このような形で第3相試験に進展した薬剤が多く敗れ去っているこれまでの経緯をみると、まだまだ油断はできないというところでしょうか。
1)Schwartz MD et al. Expert Opin Ther Targets. 2018 Jun;22(6):513-526.
2)Nina Dedic et al. J Pharmacol Exp Ther 371:1–14, October 2019
3)Preller KH et al. J Neurosci. 2018 Apr 4;38(14):3603-3611. doi: 10.1523/
4)Kenneth S. et al. N Engl J Med. 2020 Apr 16;382(16):1497-1506. doi: 10.1056
5)Leucht S et al. Am J Psychiatry. 2017 Oct 1;174(10):927-942
6)Brain Res 708:209–214
7)Arch Gen Psychiatry 59:514–520
8)Curr Opin Investig Drugs. 2010 Jul;11(7):802-12.
9)CNS Drugs. 2013 Sep;27(9):703-16. doi: 10.1007/s40263-013-0071-0. -
症状クラスタリングと治療反応性(2)
2020年04月26日
どの抗うつ薬がどの症状に効くのかの続きです。
Yale大学の研究グループからここ何年か症状クラスタリングによる報告が続いています
この報告を取り上げた理由は、このうちの1本の論文(文献8)に、これまで私自身があまり認識していなかった結果が示されていたことがあります。
デュロキセチンの用量効果関係です。
まず最初に、抗うつ薬の用量効果関係についても触れておきたいと思います。
最近の報告で抗うつ薬についての用量効果関係を示したもので、注目されたものに文献1があります。
用量が固定された介入試験における、用量効果関係について、いくつかの薬剤についてメタ解析を行ったものです。
公表、非公表を含む77の介入試験(シタロプラム:17、エスシタロプラム:16、フルオキセチン:27、ミルタザピン:11、パロキセチン:28、セルトラリン:11、ベンラファキシン:16、 投薬群 N=19364(プラセボ群:N=6881))が解析対象となりました。
SSRIについてはhayasakaらによる等価用量換算法が使用され、ひとくくりにして解析されました。
評価項目としては、約8週間(4-12週)の治療反応率(評価尺度の50%以上の改善として定義)、副作用による中断、あらゆる理由による中断が抽出されました。
その結果、治療反応率については、SSRIについてはフルオキセチン換算で20-40mg程度まで効果増加が見込まれ、そこからはやや低下ないし横ばい。
ベンラファキシンについては、75-150mg程度まで効果は用量とともに増加し、それ以上はゆるやかに増加。
ミルタザピンについては30mgまで効果は増加するが、それ以上だと効果が減弱する、との結果でした。
SSRI、ミルタザピンについては逆U字型の効果用量関係、一方でベンラファキシンについては臨床用量範囲内においては、ある用量までは効果が増加し、その後漸増傾向ということになります。
副作用による脱落については、予想通り用量と共に増加するとの結果でした。
SSRIやミルタザピンについては、臨床用量の範囲内においても効果が最大となる至適用量が存在する可能性があるといえます。
ただし、個々の患者についてはこの結果を一律に適応することはできず、例えば文献2にあるように、薬物代謝に個人差があることに注意を要します。
例えば、CYP2D6の遺伝子多型はパロキセチン代謝に影響をあたえます。
文献2によると、日本人15名中CYP2D6*10アリル保有者は11名、CYP2D6*10アリル非保有者は4名でした。
CYP2D6*10アリル保有者の薬物代謝速度定数Kmは50.5 ng/mlであり、一方で非保有者では122.5ng/mlと有意差があり、非保有者で代謝速度が遅く、同じ用量でもパロキセチン血中濃度が高い結果でした。
パロキセチンの有効性は39.1ng/ml以上で期待できるとの報告もあり、CYP2D6*10アリル保有者では、パロキセチンの用量がより高用量で十分な臨床効果がえられる可能性があり、至適用量が20mg以上に位置する可能性があります。
このように患者の個別性にも配慮が必要ということになります。
しかしおしなべると、SSRIについては、効果用量関係は逆U字型といえるのかもしれません。
これについては、臨床効果が期待できるセロトニントランスポータの占有率80%を超えると、それ以上の増量に意味がなくなるということを示唆するのではないかとの考察もあります。
SSRIの効果用量関係が逆U字型となる可能性については、古くからそのような報告はありました。
文献3ですが、1996年にはすでにフルボキサミンについて、効果が100mg程度で最大化し、それ以上ではむしろ有効性は減り、副作用は増加する傾向がみてとれるという効果用量関係が報告されています。
また2009年には文献4にあるようにパロキセチンについて、20mg投与で効果不十分な場合に、さらに増量した場合と、維持した場合とで有効性に有意差なく、20mを超えての使用がSPECTで評価したセロトニントランスポータ占有率を増やすことはなかったとの結果が報告されています。
さらにセルトラリンについても、2001年に公表された文献5にあるように、50mg投与3週間での非寛解群を50mg継続と150mg増量とに無作為割付し、その後の経過をみたところ、維持群と増量群とでその後の治療反応率(いずれも約40%)に有意差はなく、増量に治療的意義がないのではないかと考察されています。
さらにセルトラリンについては、近年日本の研究グループにより臨床的に重要なsingle blind studyの結果が報告されたことも忘れてはいけません(文献6)。
このSUN D studyは新規発症の大うつ病患者を対象とした大規模試験であり、実臨床に近い点で大きな意義があります。
2011名が対象となった大規模試験であり、試験は2段階にわけられました。第1段階では最初3週間でセルトラリン50mg(N=970)対セルトラリン100mg(N=1041)の介入試験が行われ、第2段階では寛解群はそのまま継続、3週後に非寛解群が、継続群とミルタザピン併用群とミルタザピン置換群に無作為割付し6週間経過観察されました。
最終的には8群の比較が行われたことになります。
最終的な結果は、新規発症の大うつ病について、セルトラリン50mgと比較して100mgまで増量して投与することの利益を全体として見出すことはできませんでした。3週後にセルトラリンで寛解しない群については、ミルタザピンとの併用ないし置換により9週後の治療的効果が増大したというものでした。
これまでミルタザピン併用の有効性は比較的規模の大きな2つの介入試験で否定的(文献7)となっていましたが、これらは慢性期で治療抵抗性の患者を対象としたものであり新規発症ではまた話が違うのかもしれません。
さて、前置きが長くなりましたが、今回の本題です。扱う論文は2本あります(いずれも同じ研究者の入ったグループからの報告です)。1本目は文献8、2本目は文献9となります。以下文献8の概略となります。
症状クラスタリングによる抗うつ薬の治療反応性予測
背景
・大規模試験におけるうつ病の因子分析により、うつ病の症状尺度は2個から5個程度のクラスターに小分類できることが報告されている。しかし、うつ病の臨床試験では、ほとんどが症状尺度の合計得点の変化を主要評価項目としており、下位尺度の変化まではわからない
・多くの患者は初期治療により寛解せず、複数の治療法の試行錯誤により結果的に寛解に至ることが多い。そのため、初期のうちから、患者の呈する症状の特徴から最も適した治療法が選択できるようになると、より患者の予後改善に寄与しうると思われる
・これまでにも、薬剤毎に有効性の高い症状を抽出する報告はなされている。例えばSSRIは気分の落ち込みの改善に有効であると言われてきた。また症状をサブグループ毎にまとめて解析を行い、ノルトリプチリンがエスシタロプラムより自律神経症状の改善に有効であり、一方でエスシタロプラムは気分の改善と認知機能の改善により有効であったとの報告がある。
・しかしながら従来型の統計解析手法は欠点があり、例えば因子分析は症状のクラスタリングにおいて複雑な組み合わせを生成しうる可能性がある。さらにクラスター数の選択などにおいて解析者のバイアスを受けやすい。
・一方で階層的クラスタリングは各症状を1つのクラスタに割り当てる決定論的な方法であり、クラスター数の事前指定が必要ではない点で優れている
・今回階層的クラスタリングを用いて、症状のクラスタリングを行い、治療法による反応性の違いを抽出した対象と方法
・STAR*Dの第1ステージ12週間(シタロプラム単剤によるオープン試験):平均罹病期間15.5年で80%が慢性期ないし反復性うつ病。HAM-D17で14点以上
・CO-MED試験:平均罹病期間18.7年で78%が反復性うつ病。現在のエピソードが2年以上の患者。HAM-D17で16点以上。エスシタロプラム単剤とエスシタロプラム+ブプロピオン、ベンラファキシン+ミルタザピンの無作為割付single blind比較試験。結果は単剤と併用療法寛解率に有意差なく、ベンラファキシン+ミルタザピンは最も副作用が多いとの結果であった
・そのほか、デュロキセチンの7つの介入試験(対プラセボないしactive comparator:パロキセチン、フルオキセチン、エスシタロプラム)を解析対象とした。いずれも8週間。デュロキセチンについては用量40-60mg/dayを低用量、80-120mg/dayを高用量とした
・症状評価尺度としてSTAR*DとCO-MEDでは自己記入式のQIDS-SR。その他の試験ではHAM-D17。しかしHAM-Dの“病識欠如”についてはQIDS-SRに対応する項目がないため除外した。また体重減少/食欲不振についての項目も試験毎に評価基準が異なったため除外した
・階層的クラスタリングは、各下位尺度の治療に対する反応の類似性によりクラスタリングを行った結果
・階層的クラスタリングの結果、3つの症状クラスターが区別された。QIDS-SRを用いた試験では、睡眠クラスター(入眠困難、中途覚醒、早朝覚醒)、中核的感情症状クラスター(気力減退/易疲労感、集中力低下/判断力低下、興味の減退、抑うつ気分、自己の無価値感)、非定型症状クラスター(精神運動焦燥、精神運動制止、希死念慮、過眠、性欲減退、心気症)に分類された。
HAM-Dを用いた試験では、睡眠クラスター(入眠困難、中途覚醒、早朝覚醒、易疲労感)、中核的感情症状クラスター(不安の身体症状、不安の精神症状、罪責感、興味の減退、抑うつ気分)、非定型症状クラスター(性欲減退、精神運動制止、希死念慮、精神運動激越、心気症)
→コメント:HAM-DとQIDS-SRのクラスタリングで疑問に感じる点はあります(HAM-Dにおいて易疲労感が睡眠に入っていることや、不安の精神症状、不安の身体症状が中核的感情症状に入っており、精神運動制止と性欲減退が非定型症状に入っていることなど。ただし、ただしこれらはあくまで治療に対する反応の類似性からのクラスタリングであり、各クラスターのネーミングの妥当性はそれほど重視すべきものではないのかもしれません)
各クラスターと治療反応性について
・どの薬剤においても、中核的感情症状クラスターの改善率は、非定型症状クラスターの改善率よりも有意に高かった。抗うつ薬により、中核的感情症状クラスターはより反応性が高い症状といえる。
・一方で非定型症状クラスターでは薬物療法による改善率があまり期待できない症状群であるといえる。
・STARDおよびCO-MED試験の解析において、睡眠クラスターについては、ベンラファキシン+ミルタザピン群は、シタロプラム群、エスシタロプラム+ブプロピオン群、エスシタロプラム群より有意に改善率(slope)が高かった。非定型症状クラスターについては、どの群も改善率有意差なし。中核的感情症状クラスターについては、ブプロピオン+エスシタロプラム群はシタロプラム群より有意に改善率が良好であった
・デュロキセチンの介入試験についての解析結果では、睡眠クラスターについては、高用量デュロキセチン群は、低用量デュロキセチン、エスシタロプラム、フルオキセチン、プラセボより有意に改善率が良好。パロキセチンはプラセボより有意に改善率が良好→コメント:これについてはやや意外な結果でした(鎮静作用の比較的期待できるエスシタロプラムの結果が意外なことと高用量デュロキセチンが睡眠に良いというのも意外でした)
・中核的感情症状クラスターについては、高用量デュロキセチンは、低用量デュロキセチン、エスシタロプラム、プラセボより有意に良好。パロキセチンは低用量デュロキセチン、エスシタロプラム、プラセボより有意に良好。
・非定型症状クラスターについては、高用量デュロキセチンは、低用量デュロキセチン、エスシタロプラム、フルオキセチン、パロキセチン、プラセボより有意に良好。パロキセチンは低用量デュロキセチン、エスシタロプラム、プラセボより有意に良好。エスシタロプラムはプラセボより有意に不良
考察
この論文で最も意外な結果は、高用量(80-120mg)デュロキセチンの効果が最も良好であったことでした。抗うつ薬の用量ー効果曲線については、これまでみたとおり、SSRIでは逆U字型のものが多く、高用量では逆に有効性が低下するとの報告が多くなっています。
しかしSNRIについては、文献1でみたように、ベンラファキシンは、用量増量とともにやや効果は増えていく傾向のようにみてとれました。デュロキセチンも同様の傾向があるのかもしれません。
ただしデュロキセチンについては、30mgと60mgの効果を比較した介入試験(文献10)で、30mgと60mgとで有意差がなく、用量を増やしても、この結果をみるとあまり臨床的意義はないのではないかと思われる結果もでており、このあたりの解釈には注意を要します。
日本では60mgを超えて使えないので、あまり実用的な結果ではないのかもしれません。
結果の一般化にはさらに検証が必要そうな印象です。続いて文献9の結果の概略にうつります
症状クラスタリングによる思春期うつ病に対する治療反応性
背景
・思春期うつ病の治療は困難であり、プラセボ反応率が高く、効果量は小さい。最適な治療法の探索は試行錯誤である。どの治療法がどの症状に適しているのかよくわかっていない。
・そこで思春期うつ病に対する介入試験(TADS)の結果を用いて、症状クラスタリングによる治療反応性の違いを探索した対象と方法
・TADSデータベースを使用
・TADSは12-17歳の大うつ病(DSM-IV)患者を対象とした介入試験(ステージ1からステージ3まであり、結果は文献11、文献12を参照)
・CDRS-Rで45点以上がエントリー
・階層的クラスタリングによりCDRS-Rの各尺度を治療反応の類似性によりクラスタリングを行った結果
・階層的クラスタリングの結果、CDRS-Rの下位尺度はクラスター1とクラスター2とにクラスター化された
・クラスター1は、睡眠障害、社会的引きこもり、学業の障害、過度の疲労感、焦燥感、自尊感情の低下、楽しみの喪失、抑うつ気分から構成される
・クラスター2は、食欲増加、身体症状、過度に泣くこと、食欲減退、罪業感、希死念慮、病的な観念から構成される
・全得点については、12週間でTDASステージ1の結果の通り、フルオキセチン+CBT群、フルオキセチン群において良好な改善度を示した
・クラスター1については、フルオキセチン+CBT群、フルオキセチン単独群の優位性がより目立つ結果となった
・一方でクラスター2については、どの群も同等の変化率を示し、プラセボ群の変化も大きく、プラセボでもよくなりうることを示唆する結果となった
・薬物療法の効果が期待できる症状尺度は、クラスター1(睡眠障害、社会的引きこもり、学業の障害、過度の疲労感、焦燥感、自尊感情の低下、楽しみの喪失、抑うつ気分)の合計といえるのかもしれない
・思春期うつ病において、食欲に関連した問題や、希死念慮、身体症状などは環境的介入により改善しうるといえるのかもしれない。再現性があるかどうかは今後のさらに研究が必要以上となります。思春期うつ病の希死念慮については精神療法が重要であるともいえるかもしれません。
このような治療反応性を元にしたクラスター解析により、また新たな知見が得られるかもしれません。これからの報告も期待されます。
1)Furukawa TA et al. Lancet Psychiatry. 2019 Jul;6(7):601-609.
2)Saruwatari J. et al. Pharmgenomics Pers Med. 2014 May 28;7:121-7
3)Walczak DD et al. Ann Clin Psychiatry. 1996 Sep;8(3):139-51.
4)Ruhé HG et al. Neuropsychopharmacology. 2009 Mar;34(4):999-1010
5)Schweizer E et al. Int Clin Psychopharmacol. 2001 May;16(3):137-43.
6)Kato T et al. BMC Med. 2018 Jul 11;16(1):103
7)Kessler DS et al., BMJ. 2018 Oct 31;363:k4218. doi: 10.1136/bmj.k4218
8)Chekroud AM et al. JAMA Psychiatry. 2017 Apr 1;74(4):370-378. doi: 10.1001
9)Bondar J et al. Lancet Psychiatry. 2020 Apr;7(4):337-343
10)J Clin Psychiatry. 2007 Dec;68(12):1921-30.
11)JAMA. 2004;292:807-820
12)Arch Gen Psychiatry. 2007;64(10):1132-1144 -
症状クラスタリングと治療反応性(1)
2020年04月22日
どの抗うつ薬がどの症状に効くのか、とても興味のある話題です。
そんな問いに答えようと計画された解析により、既存の臨床試験結果を解析し、抗うつ薬によりどのような症状が改善しやすいのかについて報告された論文があります。
今回と次回で、そのような報告をとりあげてみたいと思います(今回はエキスパートコンセンサスについての話題が中心で、目的とする論文にたどり着けませんでした)。
現在よく使用される抗うつ薬にはSNRI、SSRI、NaSSaなどがあります。
今年4月1日号のJournal of Affective Disorders誌に抗うつ薬の使用についての日本のエキスパートコンセンサス(114名のエキスパートの回答結果のまとめ)が公表されました1)。
結果の概略ですが、中等度から重度うつ病に対する第1選択薬としては、ミルタザピン、デュロキセチン、エスシタロプラム、ベンラファキシンといった順序になっています。
また主要症状毎に適応薬剤をみていくと、不安が主な症状の場合には、エスシタロプラムが第1選択、ついでセルトラリン、興味の減退が主な症状の場合には、デュロキセチン、ベンラファキシンといったSNRIが第1選択、不眠が主な症状の場合には、ミルタザピンが第1選択、食欲減退が主な症状の場合には、ミルタザピンが第1選択、焦燥感(精神運動激越)、易刺激性が主な症状の場合には、ミルタザピンが第1選択、希死念慮が主な症状の場合にはミルタザピンが第1選択となっていました。
皆さんの臨床的実感と一致するでしょうか。これはエキスパートコンセンサスですので、エビデンスとはいえないものです。
このような薬剤選択の根拠は何でしょうか?
手元にある範囲で、いくつかの比較試験やメタ解析の結果をみながら、各薬剤の特徴について振り返ってみたいと思います。
まずはミルタザピンです。2010年に急性期うつ病に対するミルタザピンとSSRIの有効性を比較した15の介入試験のindividual patient dataによるメタ解析結果が公表されました2)。HAM-D17得点の変化でSSRI全体(フルオキセチン N=411、パロキセチン N=391、セルトラリン N=290、フルボキサミン N=199、シタロプラム N=139)とミルタザピン N=1484が比較されました。
その結果、6週間での脱落率はミルタザピン 31.3%、SSRI 27.8%であり、忍容性に大差なく、寛解率(HAM-D17得点が7点以下で定義)でみた有効性については、1週目(3.4% vs 1.6%)、2週目(13.0% vs 7.8%)、4週目(33.1% vs 25.1%)、6週目(43.4% vs 37.5%)のいずれもSSRIより有意に高い寛解率を示しました。ミルタザピンはSSRIよりも効果の立ち上がりが速い(最初の2週間ではSSRIよりも74%大きな寛解率を示した)ということができそうで、このことは2011年のCochrane reviewにおいても支持されています3)。
個別のSSRIとの比較については、2018年のネットワークメタ解析でのhead-to-headの介入試験のみでの解析結果を参考にすると4)(supplementary materialのセクション8.1.1参照)、フルオキセチンとフルボキサミンに対して反応性が有意に良好との結果になっています。
対SSRIでの文献2での6週時点での有意差はこの2剤との比較試験の結果にひきずられたのかもしれません。
というわけで、ミルタザピンは治療効果の発現が速そうだという印象です(単に鎮静がかかってHAM-D得点の一部がよくなったせいじゃないかと思っていた時期もありましたが、文献2のように寛解率を尺度にしても速いので、単にそれだけではないのかもしれません)。
また焦燥感(精神運動激越)、易刺激性についてですが、不安を伴う大うつ病に対するミルタザピンの有効性に関するメタ解析5)において、HAM-Dの項目9(精神運動激越)、項目10(不安の精神症状)、項目11(不安の身体症状)の合計点において、プラセボよりも有意に良好な改善度を示し、その効果はアミトリプチリンと有意差がなかったとの結果が報告されています。SSRIなどと比較したものは見当たらない(ご存じでしたら教えてください)のですが、鎮静作用を有することからも、焦燥感への効果を期待してというところかもしれません。
続いて鎮静作用とも関連するのですが、不眠を伴う場合もエキスパートコンセンサスではミルタザピンが第1選択となりました。不眠に対するミルタザピンの効果ですが、ミルタザピンのS体のみからなるエスミルタザピンの原発性不眠症に対する第2相試験の結果が報告6)されており、エスミルタザピン1.5mg以上の用量(ミルタザピンでは3mgの低用量)において、PSGによる総睡眠時間が25分以上延長し、睡眠の質も改善されたことが報告されています。
この鎮静作用については、用量依存性に軽減する可能性も報告されており7)、ほんとかどうかわかりませんが、文献7では高用量になるとミルタザピンのノルアドレナリン賦活作用が、抗ヒスタミン作用に拮抗する可能性も考察されています(そうではなくて単なる耐性かもしれません。投与初期には問題があっても、15mgの固定用量で8日間投与を継続すると運転パフォーマンスはプラセボと有意差がなくなるという報告9)もあります)。
ただし、ミルタザピンは半減期が23-33時間と長く、健常者への午後9時半15mg単回投与でも投与2日目の翌朝7時でのドライブシミュレータ試験でブレーキングの遅延がみられたなどの報告8)があり、特に投与開始初期に運転などへの影響がありうることに注意が必要です。
というわけで、確かに不眠を伴う場合にはいいのかもしれませんが注意を要します。
さらに食欲減退を伴う場合もミルタザピンが第1選択となりました。これについては、抗うつ薬と体重増加に関するメタ解析10)の結果がわかりやすいのではないかと思います。
116の試験のメタ解析結果で、投与開始初期(4-12週)と4か月以上の維持療法期とで抗うつ薬がどの程度体重増加をもたらすかを検討したものです。
短期的投与では多くのSSRI、SNRIが体重変化なし、むしろ減少することが多いのに対し、ミルタザピンの体重増加作用はアミトリプチリンなどの三環系抗うつ薬と並んで目立っています(4-12週間の投与で2kgくらい増える結果)。
さらに8か月以上の投与期間でみても有意な体重増加効果があることが報告されています。
この報告でもう1つ面白いのは、SSRIの体重変化です。投与開始4-12週では体重が全体としては減るのに対して、投与期間が長くなると、全てではありませんが、パロキセチンなど一部のSSRIも有意な体重増加を示しているところです。
セルトラリンなどは長期使用しても増えないようですが、これは臨床経験とも一致する結果です。
というわけで、食欲減退についてもミルタザピンが第1選択となるのはよくわかるところです。
希死念慮についてもミルタザピンが第1選択となりました。これは難しいところで、臨床試験では、希死念慮の重篤なケースは除外することがほとんどなので、本当にシビアなケースに適応できる結果なのかは慎重を要するところです。
例えば文献11)のような報告があり、大半がベースラインのHAM-D項目3の自殺尺度が2点以下の患者を対象とした15の短期(6週間)プラセボ対照比較試験のpooled analysisにより、HAM-D項目3の得点は2週目から有意差をもってミルタザピンが有意に良好であるとの結果でした。
また6週間の経過中HAM-D項目3の得点が3点以上になる割合も2週目以降ミルタザピン群でプラセボ群より低く、そのオッズ比は0.38と有意に低い結果でした。
一方で希死念慮が比較的重度といってもよいHAM-D項目3の得点がベースラインで3点以上の患者についての結果も、少数ながら解析されています。
全体でミルタザピン群35名、プラセボ群44名がエントリーされており、項目3が3点以上であり続けた割合は、1週目 38.9%(プラセボ群)対41.2(ミルタザピン群)、2週目 22.2%対6.5%、3週目 9.4%対6.5%、4週目 5.9%対0.0%、5週目 3.6%対0.0%などとなっていました。
症例数が少ないため、統計的有意差はでなかったそうですが、興味深い結果といえます。
ただし、このようなミルタザピンの結果については、臨床試験に参加した純粋な患者集団(併存症などのない)に対する結果であることに注意が必要です。
我々が向き合うリアルワールドでは、こうはいきません。文献13にあるように、高齢者を対象とした長期観察研究では、ミルタザピンは自殺企図率の最も高かった抗うつ薬となっています。なぜこのような結果になったかについてですが、これが観察研究ゆえ、自殺リスクの高い患者に対してミルタザピンが多く処方された結果ともいえます。そして結果的に防げなかった症例がカウントされているとも考えられます。
リアルワールドでは、臨床試験と異なり、アルコール依存やパーソナリティ障害、bipolarityなど様々な併存症や病態を有する患者が訪れます。そのような個々の患者の希死念慮とどう向き合うかは、単純な臨床試験の結果を超えた力量が必要となります。
続いて、興味の減退で選ばれた、デュロキセチン、ベンラファキシンです。SNRIが選ばれました。この結果について思い浮かぶのは文献12です。
デュロキセチンについての大うつ病を対象とした7つの介入試験(プラセボ対照、ないしSSRI対照)のpooled analysisです。SSRIと比較してHAM-Dの下位尺度のどの項目がデュロキセチンでは良好な治療効果が見込めるかということを解析したものです。
デュロキセチンとプラセボと有意差がみられ、SSRIとプラセボの有意差がでなかった項目は、精神運動激越, 全身の身体症状, 性的関心, 心気症の4項目でした。またデュロキセチンがSSRIより有意に改善したのは、仕事と活動, 精神運動制止,性的関心,心気症の4項目でした。
確かに興味の減退によさそうな感じです。
というわけで、今回のエキスパートコンセンサスの結果を受けてざっと自分なりにこれまでの報告を概観してみました。もっといい報告があるかもしれません。ありましたら教えていただきたいです。
今回の本題の症状クラスタリングの論文には到達できませんでしたが、これらの事項を踏まえて、次回の勉強会の記事で症状クラスタリングの論文をみてみたいと思います。1)Sakurai H. et al. J Affect Disord. 2020 Apr 1;266:626-632.
2)Int Clin Psychopharmacol. 2010 Jul;25(4):189-98.
3)Watanabe N et al. Cochrane Database Syst Rev. 2011 Dec 7;(12):CD006528
4)Lancet. 2018 Feb 20. pii: S0140-6736(17)32802-7
5)Fawcett J et al. J Clin Psychiatry. 1998 Mar;59(3):123-7
6)Ruwe F et al. J Clin Psychopharmacol. 2016 Oct;36(5):457-64
7)Fawcett J et al. J Affect Disord 51 (1998) 267 –285 277
8)Ridout F. Hum Psychopharmacol. 2003 Jun;18(4):261-9.
9)Sasada K et al. Hum Psychopharmacol. 2013 May;28(3):281-6
10)Serretti A et al. J Clin Psychiatry. 2010 Oct;71(10):1259-72.
11)Kasper S et al. World J Biol Psychiatry. 2010 Feb;11(1):36-44
12)Mallinckrodt CH et al. Neuropsychobiology. 2007;56(2-3):73-85
13)Carol Coupland et al. BMJ 2011;343:d4551 doi: 10.1136/bmj.d4551 -
エビデンスの質について
2020年04月14日
エビデンスには質があり、時に著名な雑誌に掲載された論文についても結果がmisleadingである可能性があることに注意が必要です。
臨床家は論文の質の良し悪しを慎重に見極める必要があります。
最近ではNew England Journal of Medicine誌にCOVID-19に対するremdesivirのcompassionate use(患者自身の申し出を起点とした未承認薬の投与。薬剤が生命リスクの高い疾患を対象としたものであり、代替的治療法がないものの場合、未承認薬であっても条件付で投与が承認されるもの。日本でいうところの患者申出療養制度ないし拡大治験。両者はちょっと違いがあり、申し出のあった薬剤が治験中であれば、患者申出療養制度ではなく拡大治験に組み込まれる。この論文に日本での患者さん(in Japanとあるので国内投与でしょう)が9名入っていて、日本での患者申出療養制度での投与承認はまだ6件しかなく、その中にCOVID-19は入っていないので、拡大治験でしょうか?海外で行われているExpanded accessに参加する方法もありますが、それだと海外にいかないといけないので、国内実施であれば、拡大治験だったのでしょうか?どういういきさつでcompassionate useという表現が使用されているのかは興味があるところです)についての症例報告がありました1)が、これはオープン試験で対照もなくblindingもされていないので、エビデンスの質としては低めということになります。現在進行中のプラセボ対照二重盲検試験の結果次第では、結論はどうなるかわからないというところです。
さらに観察研究により得られる帰結の脆弱性について、精神科が関連する領域での実例を挙げてみたいと思います。
2000年のLancet誌にスタチン使用と認知症リスクの関連を調べたnested case-control study(以下に述べる今回問題にしている論文と同じスタイルです)の報告がなされました2)。nested case-control studyは前向き研究でありながら、前向きの観察期間終了後にcase-control studyを行うというもので、コホート研究とcase-control studyの良いところ取りのような研究デザインになります。
nested case-control studyについてはネットで閲覧可能な嶋本先生による文献3)にわかりやすい解説があります。
このLancet報告2)では、スタチン使用により、認知症(タイプは区別しない)の罹患リスクが7割くらいも有意に減るというインパクトのある結果でした。この結果もよくみるとスタチン使用歴2年未満の結果が全体の罹患リスクの結果に大きな影響を与えているように見え、2年以上使用の結果はそれほどリスクを下げているようにみえないことから慎重な解釈が必要なことはわかるのですが、それでも有名雑誌に掲載された結果の影響は大きく、その後しばらくはスタチンで認知症を防ぐという風潮になったのは想像に難くありません。
しかし、そのような幻想は2年後に同じくlancet誌に公表された2つの介入試験の結果4)5)で打ち砕かれます。
HPS 2002およびPROSPER試験とよばれるプラセボ対照無作為割付比較試験です。特徴はどちらも非常に大規模であること(HPS 2002はシンバスタチン群とプラセボ群いずれも10000名以上、PROSPER試験はプラバスタチン群、プラセボ群いずれも約3000名)さらに、どちらも長期間であること(HPS 2002は5年、PROSPER試験は約3.2年)です。
ここまで大規模な介入試験の結果のエビデンスの質はとても高くなります。
HPS 2002試験のエントリー患者は40-80歳で冠動脈疾患,非冠動脈性閉塞疾患,糖尿病などで治療中の患者で、主要評価項目はすべての原因による死亡、冠動脈性心疾患による死亡などで、結果はシンバスタチンは全死亡、冠動脈性心疾患による死亡を10%程度有意に低下させるというものでした。認知症発症率も評価されており、0.3%ずつで有意差がありませんでした(自殺企図率も0.1%ずつで有意差なし、その他の精神疾患の発症率もスタチン0.7%対プラセボ0.6%で有意差なし)。
スタチンは動脈疾患のリスクを有する患者について、約5年間の使用で認知症の発生リスクを低減させることはなかったとの結論になります。
PROSPER試験では、70-82歳で動脈疾患の既往(冠動脈、脳血管性、末梢性)ないし喫煙や高血圧、糖尿病などを有しハイリスクの患者が対象となりました。主要評価項目は冠動脈疾患死ないし非致死性心筋梗塞ないし致死性ないし非致死性脳梗塞の発生率であり、プラバスタチンはこれらすべての発生率を約15%有意に減少させるとの結果でした。一方で認知機能の低下についても評価されており、MMSE、語想起課題、stroop testなどで測定した認知機能の悪化度は有意差なしとの結果でした。
スタチンは約3.2年間の使用で認知機能の低下を有意に防ぐ効果はなかったということになります。
以上2つの質の高い長期大規模臨床試験の結果により、現在ではスタチンが認知症を防ぐ効果は(少なくとも5年程度の使用では)ないとの結論になっています。
だからといって、観察研究の意味がないわけではありません。介入研究が困難なほど長期間にわたる暴露の結果がどうかについては観察研究に頼らざるをえません。
スタチンと認知症リスクについても、最近でも観察研究の結果が報告されて続けており6)、それはもはや介入研究では手が届かない10年単位の観察期間を設けた長期試験であったりします。
そこでは、エビデンスの質は低いものの、高用量のスタチンでは認知症発症リスクが低かったなどの報告もみられています。
より長期の経過をみていくことの意義は、アルツハイマー型認知症のアミロイドβ仮説において、アルツハイマー型認知症発症の15-20年前からAβ pathologyが徐々に脳内で進行しているとの仮説があるためです
この仮説を検証するには、MCIレベルの患者への介入では時すでに遅く(最近の抗Aβ抗体による第3相試験がことごとく失敗しているように)、もっと早期からの介入が必要ではないかとの推測になります。
スタチンは基礎実験でAβを減少させるとの報告7)があり、そうであれば、HPS 2002ないしPROSPER試験の15年予後などはとても興味があるところです。
HSP 2002については最後の患者のエントリーから23年くらいたっているため、もし予後がわかれば、何か興味深いデータが得られるかもしれません。
このように観察研究と介入試験では結果が異なることがよくあります。この差の原因の1つはIncident biasとして説明されています。
そもそも観察研究においては、スタチンを内服した群とそうでない群とで、性質が異なる(健康に対する意識が高いなど)だろうというものです。
おそらくはこのような取り除けないbiasの影響により観察研究の結果が影響を受けてしまったのではないかと考えられています。
以上エビデンスの質が重要であるとの一例をみてみました。
さて、前置きが長くなりましたが、今回の本題です。観察研究では、結果についてどう考えればいいのか、解釈に困る論文がでることもしばしばあります。
今回の論文はコホート研究の結果ですので、エビデンスの質は高いわけではなく、数年後にはひっくり返っている結果かもしれませんが、いったいどうしてこうなったのか。考えてもわかりません。
どう解釈すればいいのか、いいアイデアがあったら教えていただきたいです。
困った論文はこちら”Associations of Benzodiazepines, Z-Drugs, and Other Anxiolytics With Subsequent Dementia in Patients With Affective Disorders: A Nationwide Cohort and Nested Case-Control Study.”8)です
気分障害患者において、ベンゾジアゼピン、Z-drugsないしその他の抗不安薬使用とその後の認知症発症リスクについてのnested case-control studyになります。内容はざっと以下のようになります背景
ベンゾジアゼピン系薬剤は、その抗不安作用、催眠作用のため多くの国で処方されているが、長期使用に伴う有害事象が注目を集めている。
長期使用による認知症リスクについては、2018年にメタ解析が出版され、5本のコホート研究と10本の症例対照研究が解析対象となり、全体としてあらゆるベンゾジアゼピン系薬剤の使用による認知症発症のオッズ比は未使用と比較して1.38と有意差をもって上昇するとの結論9)であり、さらに初発症状バイアス(疾患の発症初期にベンゾが処方されやすくなるバイアス)やうつや不安併存などの交絡因子を考慮してもなおわずかに有意であるとの結論であった10)。しかし、recall biasなどが問題となる症例対照研究がメタ解析の対象として多く含まれており、用量と発症リスクの関連を調べたいくつかの報告の結果は一定しておらず、用量と発症の関係、長時間作用型と短時間作用型とのリスクの違い、暴露期間によるリスクの違いなどはよくわかっていない。
コホート研究での結果は、結論が一定していない。
これまでの報告では、ベンゾジアゼピンを処方するに至った適応症に関連する交絡因子の調整が不適切であった。気分障害は認知症リスクと関連していると言われているが、しばしばベンゾジアゼピン系薬剤が併用される。また多くのコホート研究による報告のほとんどが高齢者集団を対象としており、終末期におけるベンゾジアゼピンの使用もしばしば行われているが、終末期状態であることについての解釈は行われていない。
今回、併存症による交絡を最小化するために、気分障害患者を対象に、ベンゾジアゼピンとZ-drugsを使用した場合に将来の認知症リスクがどうなるかについてコホート研究を行った。さらにベンゾジアゼピンのタイプ(長時間か短時間か)、Z-drugsかどうかで認知症リスクが違うかどうかについても検証した。
対象と方法
デンマークで、1996年1月から2015年12月までの間で、気分障害(F3)で最初に受診した患者 N=245541
the Danish Psychiatric Central Research Registerもしくはthe Danish National Patient Registryもしくはthe Danish National Prescription Registryなどの患者登録データベースを使用しICDコードで気分障害、認知症患者を同定。処方データベースで処方内容、量、期間を同定した。
前向きコホート研究、nested case-control studyを行った。
共変量として、うつ病のタイプ(bipolar、軽度反復性、中等度反復性、重度反復性、持続性抑うつ障害など)、診断時期、アルコール乱用歴、物質使用障害歴、糖尿病、心血管疾患、抗精神病薬処方の有無、抗うつ薬処方の有無、教育歴(低、中、高、不明)、性別、年齢、婚姻状態を抽出結果
気分障害患者の75.9%(N=171287)がベンゾジアゼピンないしZ-drugsを使用
うち63.1%(N=148620)はエントリー前に1度以上ベンゾないしZ-drugsの処方歴あり(prevalent user)
55.7%の患者はベンゾジアゼピンとZ-drugの両者を処方
フォローアップ期間の中央値は6.1年
9776名が認知症と診断
調整後のnested case-control studyでは、ベンゾジアゼピンないしZ-drugs処方により認知症リスクの有意な上昇なし。長時間作用型、短時間作用型いずれも有意差なし
一方コホート研究においては、ベンゾジアゼピン処方はエントリー後2年間において、認知症リスクを低減させた(調整後ハザード比 0.82)、Z-drugs使用も有意に認知症リスクを低減(調整後ハザード比 0.82)。エントリー後2-20.1年までの結果は認知症リスクについて有意差なし(ベンゾジアゼピン処方による調整後ハザード比 0.97)、Z-drugs使用の調整後ハザード比 0.96
コホートでの解析ではベンゾの通算用量や期間と認知症リスクとの有意な関連はなかった。一方でnested case-control研究での解析結果では、最も通算用量の少ないベンゾジアゼピンを処方された群は、全く処方されたことのない群と比較して、わずかな認知症リスクの上昇がみられた(オッズ比 1.08)。
一方で最も通算用量の多い処方を受けた群は有意に認知症発症リスクが低い(オッズ比 0.83)結果となった。このパターンはすべてのタイプ(ベンゾ、Z-drugs、短期作用型、長期作用型)の薬剤でみられた。
議論
前向き研究として過去最大規模の観察研究の結果
Nested case-control studyの結果では通算低用量のベンゾ使用歴でわずかに認知症リスクの増加、一方通算高用量のベンゾ処方はむしろ認知症リスクを下げる結果となった
コホート研究の解析結果で2年間の認知症リスクが低い結果については、気分障害と診断された患者について、最初2年間は臨床家が認知症と診断しにくいことと関連している可能性がある。
認知症発症率について、うつ病の重症度やアルコール乱用などの交絡因子について調整したstudyはこれまでになく、その点で新しい知見となる
意外なことにベンゾの通算処方量が最高に属する群は認知症リスクの低下と関連するとの結果となった。これは過去にスイスでの症例対照研究で報告された傾向11)と類似している。今後の検証課題となるコメント
最も通算用量が多い、というのがどのくらいか明示されていなくて、具体的にどのくらいかがよくわからなかったです。supplementary figure S1ではtotal defined daily dose(DDD)で1500くらいが最大になっているので、たとえばジアゼパムのDDDは10mg、ロラゼパムは2.5mgなどとWHOが決めているので、これの1500倍の総処方量が最高通算処方量クラスということになるのでしょうか。結構な量ですね。
今回の割と規模の大きなコホート研究では、ベンゾジアゼピンやZ-drugsが認知症リスクの増加と関連するという明らかな証拠は得られませんでした。
それどころか、通算ベンゾ処方量が多いと、リスクが減る結果になっています。
この論文のエビデンスの質は高くありませんので、この結果をそのままうのみにすることはできませんし、今後否定される可能性もありますし、ベンゾ長期使用の有害性を考慮すると、到底実用的な結果ではありません。きっとなんらかの要因により、このような結果になっているのかと思いますが、それについては論文の考察でも触れられておらず、私にはわかりません。コロナウイルスが落ち着いてからの勉強会で専攻医のみなさんと議論できればと思います。
1)N Engl J Med. 2020 Apr 10. doi: 10.1056
2)Jick H et al. Lancet. 2000 Nov 11;356(9242):1627-31.
3)嶋本 喬 日循協誌 1992 第26巻第3号 198-199.
4)Heart Protection Study Collaborative Group. Lancet. 2002 Jul 6;360(9326):7-22.
5)Shepherd J et al. Lancet. 2002 Nov 23;360(9346):1623-30
6)Chang CF et al. Medicine (Baltimore). 2019 Aug;98(34):e16931
7)Dhakal S et al. Int J Mol Sci. 2019 Jul 19;20(14). pii: E3531.
8)Osler M et al. Am J Psychiatry. 2020 Apr 7:appiajp201919030315
9)Lucchetta RC et al., Pharmacotherapy 2018; 38:1010–1020
10)Penninkilampi R et al. CNS Drugs. 2018 Jun;32(6):485-497.
11)Fakienne A. Bietry et al. CNS Drugs (2017) 31:245–251