Surgical Outcome Research and Innovatiove Collaboration

上部消化管手術を評価する尺度

胃癌や食道癌の手術を評価する心理尺度には、いくつかの種類があります。

 

ここでは私と共同研究者の方々で開発した

 

「ES4」 (症状尺度)

 

および

 

「EGQ-D」 (食生活尺度)

 

 

の二つを中心にその測定概念と使用方法、使用例をご紹介いたします。

ES4 Esophagus and Stomach Surgery Symptom Scale

食道・胃の手術後の症状を評価する尺度

 

ES4は 

 

Esophagus and Stomach Surgery Symptom Scale” 

 

「ESSSS」 を省略して ES4 としています。

 

その名の通り、「食道・胃の手術後の症状を評価する尺度」です。

 

尺度使用上の注意のページで申し上げたとおり、測定する概念を明確にしています。

 

同じようなアンケートがいっぱいあるんじゃないの?と思った方がいると思います。しかし、

 

ありません。

 

食道癌や胃癌の術後症状にターゲットを絞った測定尺度というのは私の知る限りES4以外には存在しません(2015年12月現在)。もしそのような尺度が有るとしたら、ぜひご一報ください。

 

この尺度が測定するものは、「症状」であり、それ以外のことはわかりません。

 

一口に症状といっても、消化器の手術後には、非常に多彩な症状が出現します。

 

消化器外科医の皆様は既に重々ご承知の通りだと思いますが、一般的には、食べ物が逆流してくる、下痢になりやすい、便秘になりやすい、食事がつかえる、食べ過ぎると吐く、気持ち悪くなる、冷や汗がでる、だるくなる、などなどが知られています。

 

このような多彩な症状をどのようにまとめるか、多くの尺度はこの点で非常に苦労しています。この複数の複雑に絡み合った症状群をいくつかのグループにまとめる作業をしてあげると、構成概念がより明確になり、測定結果が理解しやすくなるわけです。

そこで登場するのが「因子分析」という計量心理学的手段です。これは実は多変量解析の一種であり、普通の統計ソフトでも(モジュールが必要かもしれませんが)解析できます。

 

因子妥当性とは

 

ちょっと話がそれますが・・・

 

たとえば、高校生の能力を評価する時にはどうするでしょうか?

 

定期試験では、英語、現代文、古文、数学、物理、化学、歴史、・・・と試験問題(これも尺度の一種です)を使って評価します。そのほかに体育、音楽、美術などは実技の評価もあるでしょう。

 

これらの点数には一定の傾向が出現することが想像されますね。たとえば、数学の点数が高い生徒は、物理や化学も点数が高いとか、古文の点が高い者は、歴史や現代文の点も高めであるとか。体育は他の点数と全く独立しているとか。
(あくまで、すべて想像です!実際には違うと思いますが・・・)。

 

ES4 EGQ 症状尺度 妥当性 信頼性

 

この図だけで理解しようとすると、横の矢印が多くなって混乱しますよね。

 

そこで、各科目の能力の上には、何らかの上位概念が存在し、その概念によって各科目の点が影響されるという仮説を立てます。

 

ES4 EGQ 症状尺度 妥当性 信頼性

 

そうすると、点数が互いに関連しあう仕組みが、なんとなくわかりやすく整理できますよね。

 

たとえば、

 

Factor 1を「理系頭脳」
Factor 2を「文系頭脳」
Factor 3を「運動センス」

 

などと命名してみるのはいかがでしょうか?

 

(この上位概念の名称はあくまでも架空の話なので、研究者が自分で決めるのです。)

 

多くの人が納得できる、すっきりとまとまる名称にすると、概念が明確化されてきます。この命名にはかなり言語のセンスが必要です!因子分析によってどんなに綺麗に因子構造が分かれたとしても、命名を謝ると、何を見ているのか分からなくなります(後述)。

 

このように各項目の得点の関連を利用して上位概念を推定する統計手法を因子分析と呼び、このような尺度を作る際には、その尺度がどのような因子で構成されているのかを評価することで、その測定概念が明確化されているかを評価するのです。

 

これを因子妥当性と呼びます。

 

妥当性検証にはそれ以外にもたくさんの検証すべきことがらがあるのですが、また別項目に譲ります。尺度開発の大きな山場は、この因子分析だと思います。そもそも、妥当性検証研究にはたくさんの被験者を要しますが、一般的には調査する質問項目の8倍〜10倍のサンプルサイズが必要といわれています。その根拠は明確がされている教科書は見たことが無いのですが、おそらくこの因子分析のモデルが安定するためではないかと思います。因子分析は先ほど述べた通り多変量解析の一種であり、変数の数に応じて、相当のサンプルサイズが必要になるからです。

 

それはさておき、私もこの因子分析を通じて、「概念を明確にする」という作業にかなり苦しみました。そのことばかり考えて1年くらいかかったというのも決して大げさではありません。

 

既存尺度では、症状のグループとして、たとえば「逆流」「下痢」「ダンピング」などとまとめてありました。私も当初そのような概念を想定してこの研究に臨みました。

 

実はその方向性で論文を完成させ、投稿寸前までいったのですが、やはり概念の収まりが悪く、すっきりしない!と悩んだ末、共同研究者からもやり直しを提案され、そこから半年ほどかけて、尺度の構成概念を考え直すことにしました。

 

問題点を整理すると

ES4 EGQ 症状尺度 妥当性 信頼性

 

という当初の因子推定は、因子名「逆流」という名称そのものに無理があることに気が付きました。

 

つまり、逆流というのは症状ではなく、病態を表している言葉だからです。

逆流しているかどうかは、造影検査や内視鏡検査をしなければ分からないことです。「逆流しているような気がする」というのは症状ですが、逆流しているかどうかはそれと同義語ではないはずです。

 

実際、胸焼け症状があっても、あきらかな逆流が見られない患者さんもいます。胸焼け、というのが逆流を表しているかどうかはアンケートをとっても分からないのです。逆流をしているかどうかを知りたければ、もっと具体的な検査をすべきなのです。

 

「アンケートでは逆流の得点が80点と高く出ています。でも検査をしてみると逆流はしていませんね・・・」

 

これでは、意味が分からないし、医師も患者も混乱しませんか??

 

たとえば、胃全摘後に食道空腸吻合が狭窄して食べたものを吐き出した場合には、外科医は狭窄症状ということが多いと思います。これは逆流でしょうか?言葉の上では逆流といっても間違いではないですし、患者さんもそのように表現するかもしれません。それなら、もう少し下のY脚のレベルでねじれて閉塞し、そこから食べ物や腸液が上がってきたらこれは逆流でしょうか??

 

このようなことは、やはり生理学的な検査によって決定すべきことであり、アンケートによってこれは逆流症状であるとか、狭窄症状であるとか、決めてはいけないような気がします。診断をつけることと、症状を表記することが概念として混在してしまうからです。

 

さらに難しいのはダンピング症状です。

 

ダンピング症候群というのはどの教科書にも載っているほどの有名な名前ですが、教科書に記載されているのは、その機序による早期と晩期の違いだけであり、症候群の定義や診断基準、評価法は一切確立した記載がありません。非常に珍しい症候群だと思います(そもそも症候群という言葉が不適切な気がします)。

 

最近、Baritric Surgeryが欧米で盛んに行われ、そのアウトカムとしてダンピング症状の評価基準がいろいろ提案されるようになりましたが、いまだ確立したものはありません。それよりも歴史の古い胃癌領域では未だに1970年代のSigstadらの文献を引用してダンピングを評価しているのです。

 

Sigstad H氏の文献によれば、ダンピングを診断するためには、まず1分以内に175ccの50%糖液(レモン味)を内服させ症状を誘発させる、その症状のScore(shockは5点、脱力は3点、頭痛は1点など・・・)の合計点が7点以上でダンピング症状有り(ダンパー)と診断すると書かれています。そのような検査法が現在も許容されるはずがなく、なんとなく作成した質問紙で評価しているのが現状です。

 

因子分析の結果を眺めながら、ふと逆流やダンピングという「言葉」そのものが医学的症状を明確に示していないということに気が付き、そういう目で外科医の言葉づかいや教科書の記載、既存尺度の中味を見直してみると、実際には「ダンピング症候群」に対するイメージは幅が大きいことが分かってきました。 同様に、逆流という言葉もイメージと実際診断や検査結果との乖離が大きいことから、ES4ではこれら言葉を使わないこととしました。(ダンピングに関してはそれのみをくわしく調査した研究を実施しましたのでまた別項目に譲りたいと思います。)

 

最終的に決定した概念は下図のとおりです。

 

ES4 EGQ 症状尺度 妥当性 信頼性

 

逆流や便秘といった、症状と病態が混乱するような概念名称をさけ、誰がどう見ても明らかである「解剖学的部位」によって、症状をグループ分けしました。

 

 

CTS (Cervico-Thoracic Symptom) 
           ・・・頚胸部の症状

 

AHS (Abdominal Hypersensitivity Symptom)
           ・・・腹部過敏症状

 

ADS (Abdominal Distention Symptom)
           ・・・腹部膨満症状

 

DIS (Diet Induced Systemic Symptom)
           ・・・(食事に起因する)全身症状

 

 

腹部は解剖学的には一つにすべきなのですが、因子分析の結果がどうしても一因子にならず、よく見てみると、下痢系の質問項目と便秘系の質問項目の得点が相対する内容となっており計量心理学的に同一概念とは設定しがたい結果となったため、このように過敏症状と膨満症状の2つに分けました。

 

 

結果として4つの下位尺度を含む、症状尺度 ES4が完成し、ゴロも良くなったということです(笑)。

 

この概念はあくまで、われわれの研究チームが決定した架空の概念です(概念というのは実体のないものですので架空なのは当たり前ですが)。

 

この概念が、臨床研究をする者にとって測定したい概念と異なるのであれば、この尺度はアウトカムとして使用しないほうが良いですし、何でもいいからこれを使ってくれと押し売りするつもりもありません。臨床研究の目的に応じて、適切な尺度を使うべきです。尺度を開発した研究者は、ついつい自分の尺度を世の中の普遍的概念だと過度にアピールする傾向にありますが、使用するものが概念を明確に出来ていないうちに、訳も分からず押し売りしてしまうと、研究の本質を損なう危険性があります。尺度があるから使う、のではなく、自分が調べたいことは何かを明確にし、そのうえでそれに最もふさわしい尺度をお探しになることをお勧めします。

 

さらに言えば良い尺度は自然と生き残り、概念がはっきりしない尺度は自然に消えていきます。

 

まとめ


 

ES4は上部消化管手術後の「症状」を評価する唯一の尺度である。

 

開発には消化器外科医のみならず、心理学者や尺度開発の専門家、多くの患者さんや実際に胃全摘を受けた経験をもつ医師に直接面談をし、多面的な評価を経て概念を構成した。

 

多くの消化器外科医、患者さんがすっきり、しっくりくる、概念として自信を持って公開していますので、お時間の許す限り、ぜひ中味をじっくり見て、ご評価・ご批判をいただければと思っています。

 

 

 


トップページ 分析的観察研究 ブログ お問い合わせ