分析的観察研究

RCTの功績と将来

RCTの功績と将来

RCTは臨床研究における最高の下策である

 

と、誰が言ったかはともかくとして、まず認識しておくべきは、RCTという研究手法の功績です。

 

EBMというものはRCTの存在なくして語ることはできません。

 

その研究手法は多くのWebサイトや教科書で解説されており、ここで詳しく述べる必要はありませんが、RCTの何がスゴイのかということを端的に示した”神RCT”といえばCardiac Arrhythmia Suppression Trial(CAST)studyではないかと私は思います。上記リンクからオープンアクセスで自由に読めるようです。ぜひ要旨だけでもご覧いただければと思います。

 

CAST stuyとは!?

 

この臨床試験は不整脈を有する患者に抗不整脈薬を投与すると心血管イベントによる死亡を減少させるかどうかを検証したRCTです。

 

抗不整脈薬のencainide, flecainideの投与患者と、それぞれ1:1でプラセボコントロールがセッティングされました。

 

結果は驚くべきことに、抗不整脈薬を投与した群が43例:16例(p=0.0004)で死亡が多く、不整脈関連の死亡に限っても17例:5例(p=0.001)と明らかに投与群が不良だったのです。しかも、この試験は抗不整脈薬の有効な患者を選択的に登録していたにも関わらず、です。

 

このRCTを行うにあたっては、倫理的な問題がかなり議論されたようです。

 

不整脈を抑制すれば心臓死は減るに決まっている、それなのに、placebo群に割り付けされた患者は不利益をこうむることになる。それは人体実験に近いだろうというわけです。

 

しかし最終的にRCTは敢行され、これまでの常識を覆す結果となりました。不整脈薬の乱用に警鐘をならし、埋め込み型ペースメーカーという少し侵襲的な治療の普及も進みました。

 

このことから得た教訓は、

 

多くの臨床家が常識だと信じて疑わないことでも、臨床試験をしっかり行って確認していくことがいかに重要か

 

「エキスパートオピニオン」に追従する姿勢がいかに危険か

 

ということでした。

 

似たような例として有名なものではACCORD試験(糖尿病の強化療法が心血管系イベントを低減させることを示すために設計されたが、死亡率は増加したため早期中止となった臨床試験)やWHI試験(閉経後女性に対するホルモン補充療法(HRT:hormone replacement therapy)の有益性を検証する臨床試験が、冠動脈疾患や乳がんの発生の増加により中止された)などがあります。

 

当初の想定と逆の結果が出る、または有効と思われていた治療がまったく無効であった(EC-ICバイパス術など)という例は枚挙に暇が無く、それまで悪く言えば医師と製薬会社の裁量に任されていたグレーゾーンが、臨床試験(おもにRCT)の登場によって社会から厳しく評価され、真に科学的に有効性のある薬剤や治療法が生き残るという時代が到来したのです。

 

このあたりは、乳癌や大腸癌、胃癌治療において臨床試験を導入した時代の黎明期における雰囲気をお知りになりたい方はN・SAS試験という書籍を読まれることをお勧めします。当時国立がんセンターの渡邊亨先生を中心とした先人たちの苦難のストーリーであり、臨床試験をわが国に導入し、結果を出していく過程に胸が熱くなります。そんなに時間を取れれずに読める本でして、私は、数年前がん研有明病院の山口俊晴院長に勧められて一気に読破してしまいました。中でも現在がん研の顧問を務められている中島聰總(としふさ)先生の胃癌の新時代を切り開かれたお仕事に大変感銘を受けました。

 

今の時代の常識ではなかなか想像しにくいかもしれませんが、当時、一部の良識のある医師たちが厳密な臨床試験(主にRCT)に基づくエビデンス創出によって医療を正しい方向に導くのだという崇高な理想を共有し、既得権益と対決してきたということは間違いが無いことだと思います。臨床試験無くして、公正な治療はあり得ない、そういうパラダイムシフトが強烈にこの時代の医師の脳裏に刻みこまれたことだと推測いたします。

 

この部分を語ると、まだまだ長い話が続きますが、このサイトはRCTの解説が目的ではないので、あくまで歴史的な流れというものを軽く抑えた上で、これからの話をしたいと思います。

RCTは50:50でのみ実施が可能

RCTの施行条件とは

 

RCTという方法論が医学の進歩に貢献した功績についてはだれもが認めるところです。
しかし、いろいろな配慮があるとはいえ現実には理想的な動物実験の環境に近づけるための実験的手段であり、いつでもどこでも簡単にできるものではありません。

 

当然ですが・・・ 従来治療Aに対して、新規治療Bの有効性が、確実に高いと思われる場合にはBを施行してあげたほうが患者さんのためになります。

 

逆に新規治療Bの有効性があまりない(非劣性試験のような)場合には、有害事象が少ないとか、その他のメリット(治験に参加すると治療費が安くなる、保険診療外の手厚いサポートが受けられるなど)が無いと。面倒な治験や臨床試験に参加したいと思う患者さんは少ないでしょう。

 

分析的観察研究, propensity score matching, gastrectomy, laparoscopic surgery

 

この金銭的なサポートが有るか無いかは非常に重要なことで、外科系診療にありがちな「術式評価」や「周術期管理」に関するRCTの多くは患者さんは無償のボランティアとして参加しています。

 

無償のボランティアですので、研究倫理というのは非常に大切なものになります。

 

新規治療の有効性の期待値が 高すぎてもダメ、 低すぎてもダメ、「Fifty-fifty(50:50)が想定されるときのみ」、RCTは実施可能となるのです。

 

新規治療の効果が本当にあるのかないのか、全くわからない!というときのみ、成立する臨床研究だということです。

 

当たり前のように思うかもしれませんが、しかしながらこの原則を守り抜くことは思いのほか難しいものです。とくに外科領域においては、

 

 

第一に、効果の予測は主観的要素が大きい(既存研究を参考にしにくい)

 

第二に、時間とともに効果の予測が変化する(手技や器械は進歩する)

 

 

ということです。外科治療、手術手技においては外科医の技量や経験が重視されますので、参加する研究者全員が50:50の価値観を共有できるとは限りません。研究に参加しながらも心の中では、「本当はAの方がいい」または「私の経験では絶対Bが良い」と思っていることもあると思います。また、研究計画の段階では50:50だと思っていたけれど、良い道具が開発されたり、類似の研究結果が発表されたりして、だんだんと社会的状況も変化してきてしまうこともあり得ます。

 

例えば日本で行われた早期胃癌に対する腹腔鏡手術VS開腹手術を比較したRCTがあり、2009年ころから2013年ころまでに症例集積が行われました。同じ研究を今から実施可能でしょうか?現時点ではRCTのエビデンスを待たずに多くの施設が一般診療として腹腔鏡下胃切除術を行っていますし、その腫瘍学的非劣性も多くの医師が(エビデンスが無いにも関わらず)認めているように思います。多くの外科医が腹腔鏡操作に慣れ親しんできており、今や50:50にはならないということです。

 

RCTに参加することを患者に強要することは出来ませんが、断りにくい、という状況を作り出すことはできます。

 

とある研究会では、その方法を伝授するようなことをしている人もいましたが、本来患者さんは、自分の病気を治してくれる一番良い方法を望んでいます。それが自分では分からないから、(口コミやネット情報などを通じて)病院や主治医を選んで受診しているわけです。主治医が心の中では50:50ではなく、30:70くらいで一方の治療法が良いと思っているのに、それを正直に伝えずRCTに組み入れるよう勧める、断りにくい状況に持っていくということがあったとしたらどうでしょうか?

 

せっかく、製薬・器械会社の影響から逃れて科学的エビデンスに基づく治療をしようという崇高な理想からスタートした臨床試験が、いつのまにか、臨床試験組織を存続させるための臨床試験になってしまうのではないか?そんな懸念をもつのは私だけではないと思います。

 

分析的観察研究, propensity score matching, gastrectomy, laparoscopic surgery

 

CASTstudyを思い返してみても、やはりRCTによってエビデンスを積み重ねていくことが大切だという立場を堅持し、よりRCTの方法論を高めていく、理解を患者に求めていく、迅速に実施できる体制づくりを整備する、などの方向性は重要なことでしょう。

 

外科手術の評価とRCT

外科領域のRCT

 

しかし、そうはいっても外科領域のRCTはなかなか思い通りにならないことが多いです。消化器癌の領域では、手術手技の効果を、5年全生存率の優越性で検証してpositiveな結果が出たことはほとんどないと思います。最近では、外科介入ではなかなか長期予後の優越性で差が出にくいことから、「非劣性試験」を行う傾向があると言われていますが、それはそれでサンプルサイズの点で予定通りの解析が出来ないということもありました。

 

つまり、外科領域のRCTは倫理的な制約が大きい割に、内的妥当性もあまり高くならないのではないかと思います。

 

 

デザインの良い観察研究は、RCTと結果が大差ないという報告がいくつかあります。

 

 

例えば下記のようなものです(このほかにもあります)。

 

 

外科領域では2014年にAnnals of SurgeryにLonjonらが発表していますが、傾向スコアを利用した観察研究と、非ランダム化のコホート研究と、RCTの3つで、介入の効果について有意な差を認めなかったとしています。

 

最近、JAMAにも同様のレビューが掲載されていました。

 

分析的観察研究, propensity score matching, gastrectomy, laparoscopic surgery

(JAMA. 2014 Jul;312(2):129-30. doi: 10.1001/jama.2014.4364.よりFigure引用)

 

これによると、死亡をアウトカムにした研究では、傾向スコアを用いた観察研究はややリスクを過小評価する傾向にありそうですが、多くの研究では観察研究とRCTのアウトカムに有意な差が無く、RCTにかかる時間やコストを考慮すると、観察研究で事足りるテーマはそれで良いし、RCTが実施困難なテーマはむしろ積極的に観察研究の質を高めて発表していくことが重要だと思います。

 

今後、臨床研究に携わる外科医は、「何をRCTし、何をRCTしないべきか?」その判断を磨いていくことも大切です。観察研究で出来ることは観察研究で実施する、そのために分析の質を高めていくことも重要です。

 

そしてそれが、分析的観察疫学という領域なのです。


ホーム RSS購読 サイトマップ
TOP アウトカム研究 ブログ お問い合わせ