鍼灸

どこまで解った鍼灸の科学 EBMってなあに? その2

3、EBMの誤解について

(1)RCT(ランダム化比較対照実験)で行わなければエビデンスにならない- という誤解?
 表1は、エビデンスの質について、米国保健政策研究局(AHCPR)が1993年に発表したものである1)。

 Ⅰa 複数のRCTのメタアナリシスによる
 Ⅰb 少なくとも一つのRCTによる
 Ⅱ 少なくとも一つの良くデザインされた非RCTによる
 Ⅱb 少なくとも一つの他のタイプの良くデザインされた準実験的研究による
 Ⅲ 比較研究や相関研究、症例対象研究など良くデザインされた非実験的記
   述的研究による
 Ⅳ 専門家委員会の報告や意見、あるいは権威者の臨床経験
   表1 米国保健政策研究局によるエビデンスのタイプ分類(1993)

これを見ると、やっぱりRCTでなければ駄目なんだという感想を持つとともに、RCT以外でもそれなりのエビデンスなんだという感想も持つ。
 前号に書いたように、「EBMは研究を統計的に厳密にするだけの運動」と捉えていたから、当然のようにRCTでなければエビデンスにならないと考えていた。また、RCTも極く当然のことであるが、試験群と対照群に偏りがないようにするために多人数のデータを取って比較する必要がある。
 一昔前は、推測統計学(推計学)といった「精密小標本」を対象としたRCTが医学界を席巻していた。この論理は、大標本(数が多い)であると少しの差でも統計的に有意となってしまい、小標本ではかなり差がないと有意にならないためになるべく小標本で比較した方が差がはっきりしてよろしいということがあったようだ。ところがこの推計学を提唱したR.A.フィッシャーは主にエンドウ豆を対象としていたのである。
 精密という意味は、試験群と対照群に限りなく差を無くすということで、エンドウ豆ならば、重さや形だけをみて無作為に二群に分けても群間に大きな差が生じるとは思えないが、人間はそうはいかない。

 人間は、個々に非常に違うことを今更述べても既にご承知のごとくであるが、医学的な変量を取ってみても、年齢、身長、体重、体脂肪率、BMI、血圧(拡張期・収縮期・安静時・基礎等)、赤血球数・白血球数(他種類ある)等、コレステロール、HDL等や各種血清学的諸検査値等相当数の項目があるし、その他当然のことながら、性別、職業(作業)、経済力、発症期間、家族歴、遺伝傾向、同居家族の状態、既往歴、既治療歴、スポーツ歴、スポーツ障害歴、現在のスポーツや運動の種類と頻度と程度、各種日常生活動作における苦痛度、飲酒・喫煙・食味傾向などの嗜好、便通状態、睡眠状態、食欲等の一般症状及びQOL、CMI、Y-Gなどの各種心理テスト等のデータもある。鍼灸の分野では、望診・脉診・腹診などの四診情報、圧痛部位、ROM、各種理学検査所見、各種神経学的所見、自律神経検査所見などの情報があるだろうし、その他性欲、性生活、宗教観、人生観、病気に対する考え方、東洋医学に対する考え方、西洋医学に対する意識、通院時間、家庭環境、住居環境なども治療に当たって考慮すべき項目であるし、治療結果に影響を与える可能性がある項目でもある。

 このように、一人の治療対象としての人間には考慮すべき項目が非常に多数ある。ある病院では一人あたり2千項目以上のデータベースを作成しているという。

 実際に一人100項目くらいで100人分の仮想のデータ(個々のデータが正規分布になるように)を作ってみて、無作為に割り付けてみるとおもしろい。必ずといっていいほど、どれかの項目が有意に差のある偏りになっている。この項目が多ければ多いほど、人数が少なければ少ないほど、項目に有意な偏りがでる確率は幾何級数的に増加する。

 このように、治療に影響を与えるだろう因子は非常に多岐に亘るであろうと考えられることから、最低でも数百から数千人を対象としたRCTメガトライアルを行う必要があるといわれ、EBMで最高のエビデンスとしては、そのRCTメガトライアルが幾つか行われ、そのメタアナリシス*1ということである。(表1)
 そして、そのRCTも、層別といって治療効果に重大な影響があると思われる項目は事前に二群に差がないように割り付けたり、あえてある特定の人たちだけを対象としたりして偏りがなくなるように工夫されているのが普通である。

 このようにRCTでは、同じ病態の人を多数集めること、偏りがないように工夫すること、そして医学研究のためとはいえ、対照群になったがしかし良い治療を求め一刻も早く治りたい人たちに、プラセーボや試験群と比べて良くないと思われる治療を施すことの倫理的な問題など非常に多くの問題がある。

 また、問題によってはRCTでは解決できないものも多々ある。例えば、「腰痛症患者における治療法選択の際、患者がどんな点を最も重要と考えるか?」というものであれば、インタビュー法やグループ面接法などの質的研究*2が適切な研究法になる。なぜならば、患者がどんな点を最も重要と考えているのかは、現在のところ全く分かってないことであるし、RCTのような量的な研究(数量を対象として比較検討する)を行うにも測定する量や対照群が不明だからである。

 例えば、ある患者は痛くても良いから早く治る治療を選択するかもしれないし、ある患者は早く治らなくても良いから、痛くない治療を選択するかもしれない。また、ある患者は絶対に治ると保証された治療以外は拒否するかもしれないし、ある患者は何でも良いから費用がかからない治療法を選択するかもしれない。そしてそれらを選択した患者の背景・心理状態・社会的要因を調査検討して、治療者に有益な情報とするためにはRCTは必要ないし、意味がない。

 また、例えば腰痛症を対象とし、50mm鍼3番を用いて通電群と置鍼群を比較した研究で通電群の法が有効性が高いというRCTがあったとしよう。ここでいえる結論は通電療法が置鍼より優れた治療法であるということではなく腰痛に対して50mm鍼3番を用いた場合で置鍼よりも通電をする方が良いといえるのであって、通電療法が最良の治療法であるといえるわけではない。

 ここで腰痛以外の場合はどうかとか、50mm鍼でなくもっと浅く刺した鍼の場合はどうかなどの様々な問題が生じる。もっといえば、この実験で対象となった腰痛患者はどんな腰痛患者であったのか。病態は年齢や性別は、そして人種は等という問題も生じる。この点については後述するが、とりあえず腰痛以外にまで普遍化することは問題がありそうだけれど、鍼の太さを3番でなく2番や4番でも同じ結果がでるだろうと推測することは許されそうである。
 このようにRCTで得られた結果は、その実験と全く同じ対象や方法でなければ応用できないということではないけれど、やはり限界があるということである。

 よって、RCTによりエビデンスを得ることはそう簡単でなく様々な問題があるということ、全てのエビデンスはRCTで得られるわけではないこと、そしてなによりも重要なことは、RCTで得られたエビデンスはあくまでも試験群と対照群との比較で得られた情報が主であるということで何でもRCTでなければエビデンスとはいえないということではない。

(2)EBMで得られた結果をそのまま、目の前にいる患者に適応できるわけがな い-という誤解?
 結論からいうと、その通りなのである。RCTなどで得られた結論をそのまま目の前にいる患者に適応することは全く問題である。当然のことであるが、RCTの対象となった患者と目の前にいる患者は違うからである。また、RCTで得られた結論はあくまでも統計上の結論であって、図1にあるようにより有効性の高いと結論されたA治療を行っても結果として目の前の患者がC点になればよいが、D点になるかもしれないという問題も残る。この図では、平均値の差が大きくて、オーバーラップしている部分が少ないが、実際はもっと平均値の差が小さく、オーバーラップしている部分が多いものである。そこでは、より有効であるとされた治療を行った人でも、有効でない治療を行った人の平均値よりも下回るという事態さえ起きるのが通常である。

 しかし、そういってしまったら臨床研究は無駄ばかりで必要ないということになってしまう。だから、「その通りであるけれどもそれは誤解ですよ。」ということになる。

 聖路加国際病院院長の日野原重明氏は、雑誌EBM創刊号に「EBMは数値化医療を目指し人間性を奪うものではないか-という誤解2)」というテーマで書かれ、その中でウイリアム・オスラーの「医学はサイエンスに基礎づけられたアートである」という言葉を引用し、「全てを数値化することはできないが、数値化できる科学の基盤に立って、医師が世界に一人しかいないその個人への対応を、どうスマートに行えば、患者からの情報を得られるかを見定め、患者に心暖かくアプローチし、患者の生き甲斐や死生観を洞察した上で、患者のマネージメントを全人的立場から行っていくことは、これは科学を超えたアートということができよう。」と述べている。

 EBMの3要素という概念がある。図2はその3要素を簡単に示したものである。研究結果から得られたエビデンスをそのまま目の前の患者に用いるのではなく、研究での対象患者と目の前の患者の医学的な違いや人種の違い、社会環境の違い等を考慮し、かつ患者の医療に対する考え方や意向、価値観、地域の特徴(例えば患者の住む地域は、薬に対して嫌悪感を持っている等)、保険などの経済的問題などを考慮してエビデンスを用いることがEBMということである。
 このことをもう少し具体的に表したのが図3である。いずれにしてもエビデンスは医師の裁量の中の一部という考え方である。そして、エビデンス以外は全て数値化されているわけでなく、医師の技量、医師の主観と経験及び臨床に対する意識に左右されている。すなわちアートである。

 もう一度、EBMの定義を記すと、「個人の患者のマネージメントにおいて、現在の臨床医学研究から得られる最前のエビデンスを良心的にそして思慮深く使っていくことである。」ということで、その意味が良くおわかりになると思う。
 ここで一つ例題を出してみる。

例題1:神経根症状がない急性腰痛の患者に対して、安静を指示する方が良いの か、それとも普通通りにさせておく方が良いのか。

この問題は、医療行為(介入ともいう)の問題でなく、養生の指示の問題である。実はこのような問題に対してもEBMが行われており、そのガイドラインができている。通常鍼灸学校などで教わってきたのは、安静を指示せよというものであったし、3週間安静にしていればどんな急性腰痛も治るので特に治療は必要ないという整形外科医もいた。ただ、実際には仕事や学校の問題で3週間も安静にしていられないし、早く治したいのが人情である。そこに治療の必要性があるように考えていた。しかし、以前より疑問があった。それは「安静にしていては筋力が落ちてしまいかえって良くないのではないか?」という疑問である。
 イギリスのRCGP(Royal College of General Practioners)が中心となって1994年に、急性腰痛の生活指導・アドバイスに関するガイドライン*3を発表している。これによると、「2日から7日間の安静はプラセボや通常の活動にしている群と比較してむしろ回復を遅延させる。できるだけ普通通りにしてもらうよう患者へアドバイスした方が良いとする8つのRCTがある3)」ということである。

さて、では少しでも動けば激痛が起きる患者に、普通通りにせよと指示しても良いのかどうか、これも問題である。カリエをはじめとして、「痛みはそれ自体がストレスとなり、病状を悪化させて悪循環に陥る」という認識が医学界にあり、痛むようなことはやってはいけないというように教わってきた。

 この部分が、アートである。ケースバイケースで医師(鍼灸師)自身の裁量で考えろということである。また、患者によっては「3日後に旅行に行くのでそれまでにどんな治療でも良いから治して欲しい」、という人もいれば、「治るのはゆっくりでも良いから痛くなくしてください」人もいるだろうから、患者の立場も考慮して考え、そして患者と話し合えということである。

 ただし、もう一つのガイドラインがある。前述のAHCPRの急性腰痛に関するEBガイドライン(EBMのEB)で、そこでは「二日以内の安静を指示する」という記述があり、RCGPと同様に1994年に発表された3)。どちらが後に発表されたかを知ることは重要(後の発表は前の発表を踏まえているので)であるが、ここではそれほど問題ではない。

 まずこの2つのガイドラインを比較すると半分矛盾している。矛盾のない部分は「1日目の安静と3日以降の普通通りの活動の指導」であり、矛盾しているのは「2日目の対応」である。ガイドラインというのは証拠(エビデンス)というレベルでなく、証拠を集めた上での判決みたいなものであるから、矛盾があっては困るわけだが、所詮医療の現場では図2・3のように参考資料にすぎないのであるから、多少の矛盾はあってもしょうがない。

 そして最も重要なことであるが、この二つのガイドラインともに、安静と通常通りの活動の2点しか研究の対象としてないことに気がつくことである。通常の臨床の現場では、もっと様々な指導をしているはずである。例えば「トイレや食事などの最低限の日常生活はかまいませんが、仕事はしないでなるべく安静にしてください」という指導もあろうし、逆に「普通通りデスクワークをして結構ですが、なるべく同じ姿勢はしないで、時々立ち上がって歩くとか軽い体操等をしてください」という指導もあろう。その指導は患者により病態により様々なはずである。それらが全て研究対象とはなってない(エビデンスがない)ことを知ることが重要である。そんなんではEBMやガイドラインは価値がない、ということではないだろう。この二つのガイドラインを知ることによって、それらを知らなかった読者の急性腰痛に対する指導に今後それなりの変化がでると思う。そこが価値である。

 それは、「EBMは全ての臨床上の疑問にただ一つの正解を出してくれる魔法の杖みたいなものである-という誤解」への回答でもある。

 そして、多分EBMを理解する上で最も重要なことは、「今までの医学が学問として、定説として、または医学的常識として記述してきたことは、生理学、病理学、解剖学、病態生理学などの基礎医学を根拠として記述してきたことであって、実際の病人を対象として、医療の実践を通じて明らかにしてきたことではない」ということを知ることである。

 それらは、in vitro*4の実験と動物実験で得られた知見を元にして、人間でも(in vivo *4)同じ結果が出るはずであるという「そうなるはず学」であったのである。よく言われる理論的根拠は、動物実験やin vitroの実験での「そうなるはず学」的な根拠を示せということであったのである。

 そうすると、「EBMは今までの医学を否定する」という批判も当然生じる。そして、EBMでよくいわれることであるが、「人種の差なんて、種の差(動物と人間)に比較すれば無いに等しい」という言葉がある。この言葉は、例えば「フランス人を対象としたRCTのエビデンスを日本人にそのまま当てはめることは問題である」という疑問に答えるものであるが、逆に言えば、種の差は人種の差などは無視できるほど大きいということになる。それが事実ならば、動物実験を主にしてきた今までの医学(もちろん実際には臨床実験も行われるのであるが)は何だったのであろうかという疑問がますます膨らむ。

 前述の日野原氏は「今までの科学的根拠といわれるものと、EBMでいう根拠(エビデンス)とは異なるものである。その区別を明確にすることが実はEBMを理解することであり、またこれを実践することがEBMなのである。4)」と述べ、さらに「EBMは単なる考え方でなく、これは行動(実践)なのである。4)」と述べている。

<今日のキ-ワード>
*1 メタアナリシス(meta analysis:メタアナライシスともいう)
 通常の総説は権威者が、自分の知識や経験と幾つかの文献を基にして特定の結論にまとめ上げるものだが、その場合に他の人が同様なことを行うと違った結論になる可能性が高い。
 メタアナリシスは、既存の複数の研究を対象として、系統的に、より客観的にそして量的に調査研究する研究方法で、誰が行っても同じ結論がでるようにできる疫学的研究方法。

*2 質的研究
EBMでは、客観性が重要な要素となるために何らかの数量を対象とした量的な研究が多い。例えば、患者が医師の対応に問題や不満を感じるのはどんな場合かを調査する際に、病院の外来や入院患者にアンケートを採るのも一つの方法であろう。そのアンケート結果を多変量解析の手法を用いて分析していけば、この研究は量的研究に属する。
 しかし、それだけでは浅薄なことしか分からないことが多々ある。患者一人一人に詳細なインタビューを行うことや、実際の診察場面を研究者が観察していく方法もあるだろう。そして、それらを通じて問題の本質に気づくことも多々あろう。よって、最初から質問項目が決まっているわけではない。このような研究は、当然量的に表現することはできないか出来にくい。
 一般的に質的研究は、社会科学の分野で多用されてきて多大な貢献をしてきた。しかし、医学の分野ではほとんど行われていない。ただ、最も多用されてきた質的研究に症例研究(case study)がある。しかし、質的研究では単にやった・治った・効いたを調査研究するのではなく、そのケースからケースを超えた一般的な意味を帰納的に導き出そうということを目的とするのである。SMONも一つの症例研究から発見されたのは有名な話である。
 しかし、まだ日本の医学研究ではこの質的研究はまだなじんでない実態がある。医学は、社会科学でなく自然科学であるというような認識の方がまだ多いということの証左かもしれない。
 おもしろい例がでていましたので紹介します。(プライマリ・ケア誌 p43~44 Vol.23 No.1 mar 2000)
2つの料理屋の特徴を比べて、どちらかに入るかを決めなければならない時 店に入る前後の客の体重や血糖値の変化を何千例も集めて量的研究で明らかにするよりも、それぞれの料理屋の客へのインタビュー内容を数十例分析してうまく比較できるようにした質的研究の方が勝ると思いませんか。
桑間雄一郎(日本医師会総合政策研究機構主任研究員)

*3 ガイドライン(EBMに基づいたガイドラインは、EBガイドラインともいう)
  図3にあるように様々なエビデンスと社会的な制約を考慮して作成される指針や勧告のことをいう。ガイドラインでは、単にエビデンスの質が高いからと いってそのままガイドラインになるわけでなく、コストや有病率など臨床上の多くの要素を考慮して作成される。例えば、エビデンスの質が最も高く、診断上優れているとされた検査でも、有病率が低かったり、コストが非常に高くついたり、検査に害が生じたり、治療や予後に結びつかなかったりしては、スクリーニングとしては推奨されにくい。逆にエビデンスの質が低くても、その検査により治療や予後が大きく変わるものであれば(その結果コスト削減にもなる)ガイドラインとして推奨されよう。

*4 in vitro と in vivo
vitro とはガラスのことで、in vitroとは試験管での実験という意味で、化学的実験等を基礎とする実験のことをいう。また、実験室での研究ともいわれる。
 vivoとは生体のことで、in vivo とは生きているものを対象とした研究ということである。動物実験も一応in vivo の研究であるが、薬物が生体内に入って変化していく過程等は全て分かっているわけでなく、あくまでも結果から推定してするに過ぎない。人間の場合には、生きている人間を切り刻んで調べるということは当然できないことなので、基本的には全て結果からの推定である。
 すなわち、理論的根拠の大多数は、in vitroの研究成果のことであり、その根拠に基づいて、動物実験を行い、予測値に近い結果が出れば、in vivo でも理論と同様なことが行われていると解釈されているに過ぎない。ただし、動物実験では、生体解剖をしてそれぞれの臓器や目的とする部位に理論と同様なことが起きているかどうかを確認する方法は採り得る。しかしそれでも細部は推測となる。

<引用文献>
1)福井次男 「EBMの誤解を解く Editorial」
 EBMジャーナル創刊号 p6 中山書店 jan 2000
2)日野原重明「EBMは数値化医療を目指し人間性を奪うものではないか-という誤解」EBMジャーナル創刊号 p60 中山書店 jan 2000
3)吉村 学「医師中心のEBMから患者中心のEBMへ」
 プライマリ・ケア誌 日本プライマリ・ケア学会 p21 Vol.23 No.1 mar 2000
4)日野原重明「なぜEBMが必要か」  
 プライマリ・ケア誌 日本プライマリ・ケア学会 p13~14 Vol.23 No.1 2000

関連記事

コメント

この記事へのコメントはありません。