エビデンスには質があり、時に著名な雑誌に掲載された論文についても結果がmisleadingである可能性があることに注意が必要です。

臨床家は論文の質の良し悪しを慎重に見極める必要があります。


最近ではNew England Journal of Medicine誌にCOVID-19に対するremdesivirのcompassionate use(患者自身の申し出を起点とした未承認薬の投与。薬剤が生命リスクの高い疾患を対象としたものであり、代替的治療法がないものの場合、未承認薬であっても条件付で投与が承認されるもの。日本でいうところの患者申出療養制度ないし拡大治験。両者はちょっと違いがあり、申し出のあった薬剤が治験中であれば、患者申出療養制度ではなく拡大治験に組み込まれる。この論文に日本での患者さん(in Japanとあるので国内投与でしょう)が9名入っていて、日本での患者申出療養制度での投与承認はまだ6件しかなく、その中にCOVID-19は入っていないので、拡大治験でしょうか?海外で行われているExpanded accessに参加する方法もありますが、それだと海外にいかないといけないので、国内実施であれば、拡大治験だったのでしょうか?どういういきさつでcompassionate useという表現が使用されているのかは興味があるところです)についての症例報告がありました1)が、これはオープン試験で対照もなくblindingもされていないので、エビデンスの質としては低めということになります。

現在進行中のプラセボ対照二重盲検試験の結果次第では、結論はどうなるかわからないというところです。


さらに観察研究により得られる帰結の脆弱性について、精神科が関連する領域での実例を挙げてみたいと思います。


2000年のLancet誌にスタチン使用と認知症リスクの関連を調べたnested case-control study(以下に述べる今回問題にしている論文と同じスタイルです)の報告がなされました2)

nested case-control studyは前向き研究でありながら、前向きの観察期間終了後にcase-control studyを行うというもので、コホート研究とcase-control studyの良いところ取りのような研究デザインになります。

nested case-control studyについてはネットで閲覧可能な嶋本先生による文献3)にわかりやすい解説があります。


このLancet報告2)では、スタチン使用により、認知症(タイプは区別しない)の罹患リスクが7割くらいも有意に減るというインパクトのある結果でした。

この結果もよくみるとスタチン使用歴2年未満の結果が全体の罹患リスクの結果に大きな影響を与えているように見え、2年以上使用の結果はそれほどリスクを下げているようにみえないことから慎重な解釈が必要なことはわかるのですが、それでも有名雑誌に掲載された結果の影響は大きく、その後しばらくはスタチンで認知症を防ぐという風潮になったのは想像に難くありません。


しかし、そのような幻想は2年後に同じくlancet誌に公表された2つの介入試験の結果4)5)で打ち砕かれます。


HPS 2002およびPROSPER試験とよばれるプラセボ対照無作為割付比較試験です。

特徴はどちらも非常に大規模であること(HPS 2002はシンバスタチン群とプラセボ群いずれも10000名以上、PROSPER試験はプラバスタチン群、プラセボ群いずれも約3000名)さらに、どちらも長期間であること(HPS 2002は5年、PROSPER試験は約3.2年)です。

ここまで大規模な介入試験の結果のエビデンスの質はとても高くなります。


HPS 2002試験のエントリー患者は40-80歳で冠動脈疾患,非冠動脈性閉塞疾患,糖尿病などで治療中の患者で、主要評価項目はすべての原因による死亡、冠動脈性心疾患による死亡などで、結果はシンバスタチンは全死亡、冠動脈性心疾患による死亡を10%程度有意に低下させるというものでした。

認知症発症率も評価されており、0.3%ずつで有意差がありませんでした(自殺企図率も0.1%ずつで有意差なし、その他の精神疾患の発症率もスタチン0.7%対プラセボ0.6%で有意差なし)。

スタチンは動脈疾患のリスクを有する患者について、約5年間の使用で認知症の発生リスクを低減させることはなかったとの結論になります。


PROSPER試験では、70-82歳で動脈疾患の既往(冠動脈、脳血管性、末梢性)ないし喫煙や高血圧、糖尿病などを有しハイリスクの患者が対象となりました。主要評価項目は冠動脈疾患死ないし非致死性心筋梗塞ないし致死性ないし非致死性脳梗塞の発生率であり、プラバスタチンはこれらすべての発生率を約15%有意に減少させるとの結果でした。

一方で認知機能の低下についても評価されており、MMSE、語想起課題、stroop testなどで測定した認知機能の悪化度は有意差なしとの結果でした。

スタチンは約3.2年間の使用で認知機能の低下を有意に防ぐ効果はなかったということになります。


以上2つの質の高い長期大規模臨床試験の結果により、現在ではスタチンが認知症を防ぐ効果は(少なくとも5年程度の使用では)ないとの結論になっています。


だからといって、観察研究の意味がないわけではありません。

介入研究が困難なほど長期間にわたる暴露の結果がどうかについては観察研究に頼らざるをえません。

スタチンと認知症リスクについても、最近でも観察研究の結果が報告されて続けており6)、それはもはや介入研究では手が届かない10年単位の観察期間を設けた長期試験であったりします。

そこでは、エビデンスの質は低いものの、高用量のスタチンでは認知症発症リスクが低かったなどの報告もみられています。

より長期の経過をみていくことの意義は、アルツハイマー型認知症のアミロイドβ仮説において、アルツハイマー型認知症発症の15-20年前からAβ pathologyが徐々に脳内で進行しているとの仮説があるためです

この仮説を検証するには、MCIレベルの患者への介入では時すでに遅く(最近の抗Aβ抗体による第3相試験がことごとく失敗しているように)、もっと早期からの介入が必要ではないかとの推測になります。

スタチンは基礎実験でAβを減少させるとの報告7)があり、そうであれば、HPS 2002ないしPROSPER試験の15年予後などはとても興味があるところです。

HSP 2002については最後の患者のエントリーから23年くらいたっているため、もし予後がわかれば、何か興味深いデータが得られるかもしれません。


このように観察研究と介入試験では結果が異なることがよくあります。

この差の原因の1つはIncident biasとして説明されています。

そもそも観察研究においては、スタチンを内服した群とそうでない群とで、性質が異なる(健康に対する意識が高いなど)だろうというものです。

おそらくはこのような取り除けないbiasの影響により観察研究の結果が影響を受けてしまったのではないかと考えられています。


以上エビデンスの質が重要であるとの一例をみてみました。


さて、前置きが長くなりましたが、今回の本題です。

観察研究では、結果についてどう考えればいいのか、解釈に困る論文がでることもしばしばあります。

今回の論文はコホート研究の結果ですので、エビデンスの質は高いわけではなく、数年後にはひっくり返っている結果かもしれませんが、いったいどうしてこうなったのか。考えてもわかりません。

どう解釈すればいいのか、いいアイデアがあったら教えていただきたいです。


困った論文はこちら”Associations of Benzodiazepines, Z-Drugs, and Other Anxiolytics With Subsequent Dementia in Patients With Affective Disorders: A Nationwide Cohort and Nested Case-Control Study.”8)です


気分障害患者において、ベンゾジアゼピン、Z-drugsないしその他の抗不安薬使用とその後の認知症発症リスクについてのnested case-control studyになります。内容はざっと以下のようになります

 

背景


ベンゾジアゼピン系薬剤は、その抗不安作用、催眠作用のため多くの国で処方されているが、長期使用に伴う有害事象が注目を集めている。


長期使用による認知症リスクについては、2018年にメタ解析が出版され、5本のコホート研究と10本の症例対照研究が解析対象となり、全体としてあらゆるベンゾジアゼピン系薬剤の使用による認知症発症のオッズ比は未使用と比較して1.38と有意差をもって上昇するとの結論9)であり、さらに初発症状バイアス(疾患の発症初期にベンゾが処方されやすくなるバイアス)やうつや不安併存などの交絡因子を考慮してもなおわずかに有意であるとの結論であった10)

しかし、recall biasなどが問題となる症例対照研究がメタ解析の対象として多く含まれており、用量と発症リスクの関連を調べたいくつかの報告の結果は一定しておらず、用量と発症の関係、長時間作用型と短時間作用型とのリスクの違い、暴露期間によるリスクの違いなどはよくわかっていない。

コホート研究での結果は、結論が一定していない。


これまでの報告では、ベンゾジアゼピンを処方するに至った適応症に関連する交絡因子の調整が不適切であった。気分障害は認知症リスクと関連していると言われているが、しばしばベンゾジアゼピン系薬剤が併用される。

また多くのコホート研究による報告のほとんどが高齢者集団を対象としており、終末期におけるベンゾジアゼピンの使用もしばしば行われているが、終末期状態であることについての解釈は行われていない。


今回、併存症による交絡を最小化するために、気分障害患者を対象に、ベンゾジアゼピンとZ-drugsを使用した場合に将来の認知症リスクがどうなるかについてコホート研究を行った。

さらにベンゾジアゼピンのタイプ(長時間か短時間か)、Z-drugsかどうかで認知症リスクが違うかどうかについても検証した。

対象と方法


デンマークで、1996年1月から2015年12月までの間で、気分障害(F3)で最初に受診した患者 N=245541


the Danish Psychiatric Central Research Registerもしくはthe Danish National Patient Registryもしくはthe Danish National Prescription Registryなどの患者登録データベースを使用しICDコードで気分障害、認知症患者を同定。処方データベースで処方内容、量、期間を同定した。


前向きコホート研究、nested case-control studyを行った。


共変量として、うつ病のタイプ(bipolar、軽度反復性、中等度反復性、重度反復性、持続性抑うつ障害など)、診断時期、アルコール乱用歴、物質使用障害歴、糖尿病、心血管疾患、抗精神病薬処方の有無、抗うつ薬処方の有無、教育歴(低、中、高、不明)、性別、年齢、婚姻状態を抽出

 

結果


気分障害患者の75.9%(N=171287)がベンゾジアゼピンないしZ-drugsを使用


うち63.1%(N=148620)はエントリー前に1度以上ベンゾないしZ-drugsの処方歴あり(prevalent user)


55.7%の患者はベンゾジアゼピンとZ-drugの両者を処方


フォローアップ期間の中央値は6.1年


9776名が認知症と診断


調整後のnested case-control studyでは、ベンゾジアゼピンないしZ-drugs処方により認知症リスクの有意な上昇なし。

長時間作用型、短時間作用型いずれも有意差なし


一方コホート研究においては、ベンゾジアゼピン処方はエントリー後2年間において、認知症リスクを低減させた(調整後ハザード比 0.82)、Z-drugs使用も有意に認知症リスクを低減(調整後ハザード比 0.82)。

エントリー後2-20.1年までの結果は認知症リスクについて有意差なし(ベンゾジアゼピン処方による調整後ハザード比 0.97)、Z-drugs使用の調整後ハザード比 0.96


コホートでの解析ではベンゾの通算用量や期間と認知症リスクとの有意な関連はなかった。

一方でnested case-control研究での解析結果では、最も通算用量の少ないベンゾジアゼピンを処方された群は、全く処方されたことのない群と比較して、わずかな認知症リスクの上昇がみられた(オッズ比 1.08)。

一方で最も通算用量の多い処方を受けた群は有意に認知症発症リスクが低い(オッズ比 0.83)結果となった。このパターンはすべてのタイプ(ベンゾ、Z-drugs、短期作用型、長期作用型)の薬剤でみられた。

 

議論


前向き研究として過去最大規模の観察研究の結果


Nested case-control studyの結果では通算低用量のベンゾ使用歴でわずかに認知症リスクの増加、一方通算高用量のベンゾ処方はむしろ認知症リスクを下げる結果となった


コホート研究の解析結果で2年間の認知症リスクが低い結果については、気分障害と診断された患者について、最初2年間は臨床家が認知症と診断しにくいことと関連している可能性がある。


認知症発症率について、うつ病の重症度やアルコール乱用などの交絡因子について調整したstudyはこれまでになく、その点で新しい知見となる


意外なことにベンゾの通算処方量が最高に属する群は認知症リスクの低下と関連するとの結果となった。これは過去にスイスでの症例対照研究で報告された傾向11)と類似している。今後の検証課題となる

 

コメント


最も通算用量が多い、というのがどのくらいか明示されていなくて、具体的にどのくらいかがよくわからなかったです。

supplementary figure S1ではtotal defined daily dose(DDD)で1500くらいが最大になっているので、たとえばジアゼパムのDDDは10mg、ロラゼパムは2.5mgなどとWHOが決めているので、これの1500倍の総処方量が最高通算処方量クラスということになるのでしょうか。結構な量ですね。


今回の割と規模の大きなコホート研究では、ベンゾジアゼピンやZ-drugsが認知症リスクの増加と関連するという明らかな証拠は得られませんでした。


それどころか、通算ベンゾ処方量が多いと、リスクが減る結果になっています。


この論文のエビデンスの質は高くありませんので、この結果をそのままうのみにすることはできませんし、今後否定される可能性もありますし、ベンゾ長期使用の有害性を考慮すると、到底実用的な結果ではありません。

 

きっとなんらかの要因により、このような結果になっているのかと思いますが、それについては論文の考察でも触れられておらず、私にはわかりません。コロナウイルスが落ち着いてからの勉強会で専攻医のみなさんと議論できればと思います。

 

1)N Engl J Med. 2020 Apr 10. doi: 10.1056
2)Jick H et al. Lancet. 2000 Nov 11;356(9242):1627-31.
3)嶋本 喬 日循協誌 1992 第26巻第3号 198-199.
4)Heart Protection Study Collaborative Group. Lancet. 2002 Jul 6;360(9326):7-22.
5)Shepherd J et al. Lancet. 2002 Nov 23;360(9346):1623-30
6)Chang CF et al. Medicine (Baltimore). 2019 Aug;98(34):e16931
7)Dhakal S et al. Int J Mol Sci. 2019 Jul 19;20(14). pii: E3531.
8)Osler M et al. Am J Psychiatry. 2020 Apr 7:appiajp201919030315
9)Lucchetta RC et al., Pharmacotherapy 2018; 38:1010–1020
10)Penninkilampi R et al. CNS Drugs. 2018 Jun;32(6):485-497.
11)Fakienne A. Bietry et al. CNS Drugs (2017) 31:245–251