・抗うつ薬の有効性、特に軽症圏に関する理解は、Gibbonsら(Arch Gen Psychiatry. 2012 Jun;69(6):572-9.)の報告のfig.1にみられるように、プラセボ効果がかなり大きく、環境的、精神療法的介入が重要なものだと理解していました。

・しかし今回のStoneらのBMJ論文(BMJ. 2022 Aug 2;378:e067606. doi: 10.1136/bmj-2021-067606.)によりその考えを一部改めるべきことがわかりました。

・抗うつ薬の効果は全ての人に一様ではなく、大きな効果を発揮し得る一群が存在する、あるいはプラセボであればほとんど変化がない、もしくは悪化する一群について、そのような状況を変化させうる効果を発揮しうる可能性がある、ということがいえそうです。

抗うつ薬の有効性

背景


・アメリカ人の約13%が抗うつ薬を使用しており、先進国における抗うつ薬の使用は2000年から2015年にかけて倍以上になっている

・うつ病や自殺には多くの要因が影響するが、抗うつ薬の使用が広がれば、これらの罹患率が改善されると期待されていた。それにもかかわらず、一般的に、うつ病や自殺率は特に若い年齢層で増加しており、抗うつ薬の効果の大きさと有効性についての決定因子を理解することの重要性が高まっている。

・メタ解析では、薬物群とプラセボ群との間の平均差は小さいことが示されており、薬物療法の有効性に関しての議論が続いている

・薬物療法の効果については治療反応性に関与しうる要因(例えばベースラインの重症度など)について一様に一定の効果をもたらすのか(分布の形状が変化せずに平均の小さな差として現れるのか)、もしくは特定の部分集団により大きな恩恵をもたらすのかよくわかっていない

・今回、1979年から2016年までの間にFDAに提出されたうつ病に対する抗うつ薬単剤療法についてのプラセボ対照RCTのindividual patient dataを用いて、患者レベルの反応の分布について、混合モデルで解析し、治療反応性が全体的な小さな変化によるものなのか、それとも治療反応を示すサブグループの反応によるものなのかを解析した。

・また出版年代によって抗うつ薬の反応性やベースラインの重症度がどのように変化したかも解析した

対象と方法

・232 RCTs、n=73388

・すべての評価尺度をHAMD17得点に換算

・混合効果モデルにより各参加者のベースラインからの変化量のプラセボとの差を推定

・年齢、性別、ベースラインの重症度などと治療群との交互作用についても評価

・finite mixture modelingにより薬物療法による改善が、プラセボに対して広く均一な改善度の増加によるものか、それとも局所的に改善度の異なる組み合わせによるものかを評価した

・モデルの当てはまりの良さを、正規分布、右側に歪んだ対数正規分布、左側に歪んだ対数正規分布で比較し、AICおよびBICを最小化するもので選択した

・ベースラインの重症度は、18歳未満の参加者、特に12歳以下の参加者でかなり低くなっていた。成人の試験で16歳、17歳の患者が含まれた場合、ベースラインの平均重症度は20.3点であったが、小児の試験では平均重症度は17.7点であった。最低年齢が12歳または13歳の小児試験では、ベースラインの平均重症度は18.8点であった。12歳未満の参加者が含まれる試験では、12歳以上の参加者のベースラインの平均重症度は17.3点であった。

・変量効果モデルで評価したベースラインから変化量の平均は、全体として実薬群で9.8点(95%CI 9.5~10.0)、プラセボ群で8.0点(7.8~8.3)の改善。実薬群とプラセボ群の差は1.75点(1.63~1.86)であった。

・性別を唯一の共変量としてモデルに含めた場合、プラセボに対する性別による反応の差はほとんど認められなかった

・ベースラインの重症度を唯一の共変量とした場合、投薬群およびプラセボによる改善は、ベースラインの重症度が高いほど増加した。プラセボに対する投薬群の優位性は、ベースラインの重症度が1点上がるごとに0.09点(95%CI 0.06~0.12)ずつ増加した。ベースラインの重症度が16点(第5百分位点)のときの投薬群とプラセボの推定差は1.1点であり、ベースラインの重症度が29.6点(第95百分位点)では2.5点まで増加することが示された。

・年齢を唯一の共変量とした場合、成人では年齢とプラセボに対する反応性の間に線形関係が認められ、ベースラインからの改善は年齢が10歳上昇するごとに0.30(95%CI 0.22〜0.38)点減少することが示された。成人の場合、プラセボに対する反応も年齢とともに減少した。。

・年齢、性別、およびそれらの交互作用を含めると、男女ともプラセボに対する反応は同程度で、年齢とともに減少したが、実薬群では年齢とともに男女間の差は10年当たり0.13(95%CI 0〜0.25)点増加した。女性では、30歳においてベースラインからの最大の改善幅は10.1点と推定され、62歳において実薬群とプラセボの最大の差は2.2点と推定された。男性では、22~23歳の間でベースラインに対して最も改善したのは9.8点、薬剤とプラセボの差が最も大きかったのは57歳の時で1.7点と推定された。

・年齢、ベースラインの重症度、およびそれらの交互作用を含めると、これらの因子は、実薬群とプラセボ群の両方、および実薬群とプラセボの差について、ベースラインからの変化の強い予測因子であった。薬物、プラセボともに、ベースラインからの改善度はベースラインの重症度とともに増加し、年齢とともに減少した

・児童思春期(18歳未満)と成人を直接比較すると,調整前の実薬群とプラセボ群の差は,成人の方が1.12点大きかった(95%CI 0.66~1.57). ベースラインの重症度を調整すると、実薬群とプラセボ群の差は成人で0.64点(95%CI 0.17~1.12)大きくなった。

・試験実施の年代による変化については、2013年からは、ほとんどの試験が小児で行われたため(参加者の79%が18歳未満)平均年齢が急降下していた。ベースライン時の変量効果による平均重症度は、1979年から1995年の間に1.54点(95%CI0.47~2.61)減少し、2013年以降にさらに減少したのは、ほとんどの臨床試験が小児で実施されたためであった。治療終了時の重症度は,実薬群とプラセボでわずかに減少しているように見えたが,統計学的に有意でなかった。年齢,性別,ベースラインの重症度を調整しても,治療反応性の試験実施の年代による変化は有意ではなかった

・実薬群では、47243人中41790人(88.5%)が何らかの改善を示し(プラセボ群では24150人中20376人(84.4%))、中央値は9.8点(プラセボ群は7.2点)。

・有限混合モデルによる解析の結果、実薬群とプラセボ群の反応の最適なモデルは、実薬群とプラセボ群を3つの重複する正規分布の組み合わせで表現するモデルあることがわかった。つまり各群は、最大の治療反応を示す群(Large response群)、中等度の反応を示す群(Non-specific response群)、反応が最小ないし悪化群(minimal response群)の3群に分類された。

・実薬群ではLarge response群が有意にプラセボ群より多く(実薬群24.5% vs プラセボ群9.6%)、Large response群におけるベースラインからの変化量は平均16点(SD4.22点)、Non-specific群では実薬群の63%、プラセボ群の69%が属し、ベースラインからの平均変化量は8.94点(SD6.96点)、minimal response群では実薬群の12%、プラセボ群の21%が属し、ベースラインからの平均変化量は1.68点(SD 2.99点)

・年齢、性別、ベースラインの重症度で調整した有効薬物間の効果量の差については 最も大きな効果を示した薬剤はアミトリプチリン、クロミプラミン、ベンラファキシンであった。

議論

・HAMD17の改善度における抗うつ薬の標準化平均差(効果量)は0.2313~0.34とした通常のメタ解析と一致し、成人では1.82点で、標準化平均差は0.24であった。小児では、実薬群のプラセボ群に対する平均差は0.71点で、標準化平均差は0.13であった。標準化平均差が比較的小さいのは、年代の経過とともにプラセボ反応率が増加するためとする報告もあるが、本研究ではこの仮説は支持されなかった

・参加者は3つのタイプの反応集団のいずれかに属することがわかった。実薬とプラセボを割り当てられた参加者の約2/3は,non-specificな中等度の反応を示した。しかし、薬物を投与された被験者の方が大きな反応を示す割合が多く(24.5% vs プラセボ 9.6%)、最小の反応(12.2% vs 21.5%)を示す割合が少なかった。したがって、プラセボに対する抗うつ薬の優位性は、Large responseとなる可能性の増加またはMinimal responseとなる可能性の減少として、少数の患者(25%程度の患者)に影響すると理解するのが最も適切である

・Large response群の90%以上はNICE基準では閾値以下まで改善した

・抗うつ薬の投与は症状軽減において(プラセボ反応を超える)わずかで一様な利益をもたらすというよりも、抗うつ薬により短期的に大きな症状軽減をもたらす一群の存在の可能性、あるいは他の方法では起こらなかったであろう短期的な症状重症化の継続を防ぐ可能性がわずかに高まることを示唆している。

・ベースラインの重症度と抗うつ薬の効果との関係に関するこれまでの解析では、効果はゼロから中程度(傾きは約0.3)であり、これらの効果は患者経験する症状変化を反映したものではなく、評価尺度の問題に起因している可能性があることがわかった( Lancet Psychiatry 2019;6:745-52 )。

・ベースラインの重症度の影響は統計的に有意であったが、その影響は小さい(傾きは約0.1)ことがわかった。 この知見は、部分的には抑うつ度の低い参加者における改善の天井効果によるものかもしれないが、症状の重症度が高い参加者において、薬物反応性の表現型が特異的になる可能性が高くなることに起因しているのかもしれない。

・NICEのガイドラインに沿って、患者の希望と一致する場合には、基礎に気分変調症(持続性抑うつ障害)がない場合には、軽度から中程度の急性うつ病に対してよりリスクの低い治療から始めることが望ましいと思われる。

Limitation


・STAR*D(Sequenced Treatment Alternatives to Relieve Depression)試験は、うつ病患者の約78%が臨床試験から除外されていることを明らかにした。自殺企図や合併症症例は除外されるため、一般集団を反映していない可能性がある

・HAMD17は臨床試験における抑うつ症状の変化を評価する方法として批判されている。しかし、MADRSやChildren’s Depression Rating ScaleはHAMD17と強い相関があり、HAMD17と他の尺度を用いた研究では、ほぼ同じ大きさの推定値が得られていることがわかった

コメント


Large resoponse群あるいはMinimal response群をどのように同定していくのかが今後の課題になりそうですね。先日の記事とも関連しますが、fMRIなどを用いた治療反応性予測が今後進展することが期待されます