【まとめと要約】「心理職のためのエビデンス・ベイスト・プラクティス入門」要点とレビュー 心理臨床分野に限らずエビデンス(科学根拠)についての意識や態度を高めてくれる本


今回は論文や文献を選ぶ力を養うのに最適な「心理職のためのエビデンス・ベイスト・プラクティス入門」の要点のまとめとレビューです。

個人的に科学論文をベースにした健康ブログで日本一だと思っている「パレオな男」の著者、鈴木さんも活用しているとのこと(→参考)。

以下、ちょっと専門的な内容になります。メタ分析やエビデンスって何?という方や、臨床心理学(カウンセリング分野)に興味がある人は読むことをお勧めします。(臨床心理学を専門にしている人なら必読書レベル。)

本書で以下のことが分かります
・科学論文の読み方、探し方。
・正しい根拠(エビデンス)の見分け方と質の精査、根拠に基づいた判断が出来る。
・建設的な科学的批判や態度が取れるようになる。→情報を鵜呑みにしなくなる。

エビデンスベイスドと日本の臨床心理学研究の問題点

エビデンスベイスドとは統計学や科学的手続きを経た根拠で効果を判定していくことを重視する態度のことです。個人の経験や主観、体験によらないで、統計学や分析を駆使して多くの人に当てはまる真理を追究していこうという姿勢です。

日本は心理学が文系に入っているように、心理学もどこかアートの側面が強く強調されています。しかし、心理学の主流であるアメリカでは心理学はサイエンス、日本で言う理系の分野に当たります。

私は日本の大学の心理学科を修了しているので、凄く納得する内容でした。学生時代に感じていた漠然としたモヤモヤがこの本を読んでスッキリとした感じ。統計学は必修だけど、臨床心理学となると事例研究ばかりで、科学的に納得出来るものが無いんですよね。すごく曖昧でフワフワとした感じ。師弟関係とかメンターとか、流派とか、武術の「道」を究めるような感じがあって、とても科学とは言えないな、と感じていました。だからアメリカに留学したときに何で心理学がサイエンス(理系)なのだろう?と思っていましたが、本書を読めば心理学もちゃんとしたサイエンスだったんだ、と分かります。

日本の心理臨床の多くは理論を海外から輸入&翻訳することに終始し、効果があるかどうかエビデンスに基づく検証は行われていませんでした。それぞれの臨床家にそれぞれの流派の団体があって、師弟関係に基づくアート(技術)の側面が強く、効果量の測定や信頼性の測定など、サイエンスの視点で建設的に批判検証することはほとんど行われていないのが現状です。

最も信頼が置ける実験デザイン「ランダム化比較試験(RCT)」

では最も質が高いエビデンスとは何なのでしょうか?それは「ランダム化比較試験(RCT)(Wiki)」です。複数の患者をランダムに2群に分け、一方の群に投薬を与え、もう一方には砂糖の塊を与え(プラセボ群)、プラセボを投与した群よりも有意に効果が出るのであれば、それは効果に根拠(エビデンス)があるということになります。以下重要なポイントを整理します。

■PICOがしっかりと設定されているか。

PICOとは
P(participant):参加者「だれを対象として」
I(Intervension):介入「どのような介入を」(独立変数)
C(Comparison):比較「何と比較したら」
O(Outcome):結果「何がどうなるか」(従属変数)

PICOがしっかりと設定されていることが論文や実験デザインの質を左右します。論文を読み解く際にキーとなるポイントです。

■サンプルサイズの検討、α(アルファー)水準、検出力、効果量
以下統計の知識が必要になります。サンプルサイズは重要です。サンプルサイズが多すぎても、少なすぎてもいけません。α(アルファー)値の基準は、両側水準でα=0.01だと厳しく判定していることになり、一般的にはα=0.05水準で判定を行います。検出力とは実際に有意さが示されたとき、それを正しく検出できる統計的な力のことです。0.8か0.9に設定すれば問題ありません。それぞれ統計的に80%と90%で正しく検出できるという意味です。

■効果量の測定と2種類のエラー
・効果量の測定は最も難しい分野です。元の効果量が小さいほどたくさんのサンプル数を用意しないと効果が埋もれてしまう場合があります。(第II種の過信βエラー)
・逆に不必要にサンプル数を大きくすると実際には効果が無いのに効果量ありと判定してしまいます。(第I種の過信(αエラー))

(この辺りのより詳細な説明は専門書や統計ソフト専門書を参照してください!)

■アウトカムの設定
アウトカムとは結果のこと。一体何を持って結果や効果が出たと言えるのかの定義のことで、例えばメンタルヘルスの分野では患者が自殺しないことが重要な結果の一つですが、場合によって患者の向精神薬の断薬や社会復帰など、複数のアウトカムの設定をすることがあります。基本は複数のアウトカムの測定基準を用いて、どれか一つを主要なアウトカムの指標として扱います。

■統制群という訳語について
統計を学ぶと出てくる「統制群」という言葉。統制群とは何も介入を設けない、比較のためのグループのことです。英語ではcontrol groupですが、本書では直訳的な統制群はおかしい訳語であるとしています。その理由は何も統制していないから、というもの。(比較群でもいいのでは?)

■ランダム化の手順
ランダム化とは、バイアス(主観)を排除して内的妥当性を高める手続きといえます。誕生日や登録番号順で無いことが重要です。サイコロの数字やコンピュータで作った乱数表を割り当てたりします。ランダム化の手続きのどこかに規則性を作らないことが大事です。

ブロックランダム化:ランダム化の手続きの一つです。群をブロック単位にランダムに割り当てます。群の数の二倍以上の整数倍のブロックが必要です(2群なら4ブロックに分けます)。
層化:層化とは男性と女性など結果に大きな影響を与えるような変数をあらかじめ分けておく手続きのことです。軽度〜重度の症状別であれば、それぞれあらかじめ質問紙などで調べ分けておく手続き。
クラスターランダム化:病院や学校など施設ごとに群を分けることです。

■他重要な指標と概念
ホーソン効果:治療そのものでは無く、新しい治療を受けているのだ、という意識が結果に影響を与えることです。(自分たちは観察されているという認識が結果に影響を及ぼす。)
汚染:被験者が実験者の意図するといころを勝手にくみ取って、その思考が結果に影響を与えることです。
ベースライン測定:介入前の患者の状態を測定すること。
盲検化(ブラインド化、マスキング):被験者がどの群に振り分けられたか分からないようにする手続きです。RCTでは徹底されます。アウトカム測定の際に、どちらを介入群か知ることで差別する事の無いように、匿名にすることです。
平均への回帰:自然現象としてよく見られる、測定の誤差により、少しずつ平均値に近づいていくように数値が変動していく現象のこと。

上記の他にも統計で言う信頼区間の表示が行われているかチェックします。

ランダム化の手続き自体を被験者や研究者に隠すことでより研究の信頼性が高まります。また、効果量の測定法や算出法なども本書に詳しくまとめられていますが、数式などが出てくるので本まとめ記事では省きます。印象的だったのが、日本では統計の有意差は出すけれど、効果量は出さない研究が多いということ。海外では効果量を出すことが当然とされています。

統計で言うp値では効果のあるなしは分かっても、効果量の大きさは分かりません。メタ分析では効果量を考慮に入れて計算するので、効果量が出ていない論文はメタ分析論文の対象にはならなくなります。

エビデンスの質一覧

エビデンスの質は以下の通りです。1に近いほど質が高いエビデンスです。主観やバイアスが排除されればされるほどエビデンスとしての信頼性・質は高くなります

エビデンスの質一覧
1,RCTの系統的レビュー(メタ分析、メタアナリシス)
2,個々のRCT
3,準実験
4,観察研究(コホート研究、ケース・コントロール研究)
5,事例集積研究
6,専門家の意見(研究データの批判的意見を欠いたもの)

テレビや新書とかネットサーフィンでもよく見かけるのが6の専門家の意見です。私たち専門外の人はこの手の専門家の意見を鵜呑みにしてしまいますが、それではいけないということが示唆されます。人は自分のやっている事を否定したくない生き物です。自分に都合の良い情報だけを集める確証バイアスや、その人の主観や価値観というフィルターが入っていることは間違いなく、偏見や思い込み、バイアスにまみれた意見といえます。

本書が特に強調しているのは事例をいくら集めたところで研究データにはならないということです。データとは、バイアスや主観が入らないようにデザインされた実験から得られるもの。事例とデータを同一のものとして混同する人が多く、両者は根本的に違うことはいくら強調してもしたりないといいます。

観察研究は実験者が介入すること無く観察して得られる知見です。例えばタバコの害に関するエビデンスのほとんどは観察研究から得られたものです。理由としては意図的に被験者に害をもたらす実験デザインは倫理的に不可能なため、経過や環境の観察研究しか許されないからです。

ランダム化した被験者群を持たない、観察実験とも違い実験者が被験者に介入するような実験デザインの臨床研究を準実験といいます。やはり実験者のバイアス・主観を排除できないためRCTには劣ります。

欧米ではRCTが広く用いられていますが、日本の現場ではまだまだ用いられていないのが問題です

たった一つのRCTだけではなく、複数のRCT研究論文を精査し、考察した系統的レビュー論文が最も信頼性が高い科学的エビデンスです。(RCTの系統的レビュー論文はRPGでいう最強の武器。ドラクエで言うと「メタルキングのけん、もしくは真実を映すラーの鏡」。)

エビデンスの質は、研究法(研究デザイン)で決まります。効果とは差のこと。その差をしっかりと測定するために、思い込みによらない科学者的な態度で実験することが肝要です。

エビデンスと心理臨床研究

エビデンスベースの研究は日本では反対されることもあるのだとか。科学的態度は、人間の自然な志向や直感に反した事実を提示することがあって、人間は間違っていることを示すことがあります。そのことを受け入れないと科学的な態度やエビデンスを支持することは難しいといいます。エビデンスの検証が出来ないと、教条主義や家元主義に陥りやすいのです。

例えば日本における心理療法はアートの側面がとても強いです。河合隼雄が日本に持ち込んだ「箱庭療法(Wiki)」は特に顕著だとのこと。「箱庭療法」はRCT研究が無く、エビデンスに基づいた研究がみられません。「箱庭療法」は驚く事に世界の論文数と日本の論文数が同じで、事例研究しかなく引用も著者自身の過去の論文だったりと非常に内に閉じていて、学術論文と読んでいいのか分からない物も多いのだとか。偉大な先人であっても、彼の直感が全て正しいとするのには無理があり、科学的な検証や建設的な批判的態度を持たず、すべてが正しいとあがめるのでは学問では無く宗教と同じだといいます。箱庭療法の場合はエビデンスが無いのにかかわらず、広く臨床に適応されているのが問題だとのこと。

私も河合隼雄さんの本は大学時代にたくさん読んでいましたが、思想家としては良いけれど、科学的な臨床家とは言えないかな、と思います。フロイトやユングに対しても同じような事はいえますね。その分、クリエイティブな分野ではその思想が大いに活用できるのですが。

曖昧な心理療法の効果についてしっかりとした科学的態度で検証できることは大切。効果が曖昧な臨床心理学の分野だからこそ、治療結果をしっかりと検討するために、エビデンスに基づいて効果があるのかどうかが問われます。心理臨床は15%がプラセボ効果であると言われており、それぞれのカウンセラーごとに患者に対処する流派も違うので、本来ならば患者ごとにプラセボ効果を凌駕するほどのエビデンスを持った治療法を探してあげる必要があります。思い込みや期待によらない真の効果を発揮できる治療法を見い出して適用していくために、臨床家はエビデンスベースの意識を高く持つ必要があります。

例えば東日本大震災でデブリーフィングとして被災者の子供に絵を描かせるという介入。実際はこうした介入は逆効果である事が海外のメタアナリシスから出ているけれど、とりあえずの流れでデブリーフィングで介入してしまった臨床心理士も多いのだそう。被災者の子供が悪夢に囚われたり、トラウマが悪化するなど逆効果の結果が出たといいます。

エビデンスをどこで探すか

以下、エビデンスを使うために論文の探し方などのまとめです。

医療の分野では最も信頼性の高いメタ分析論文を誰もがネット上で読めるようにしたコクラン共同計画(Wiki)がメタ分析論文を身近な物にしました。社会科学の分野ではキャンベル共同計画(日本語公式:サイトデザインがアレですが…)などでもメタ分析の論文が見れます。

まず最初に今自分の関心のあるテーマは、「本当に効果があるのか?」という態度を持つ事が重要です。教科書は古くなるので、常に最新の情報はインターネットから得るようにします。

1,コクラン共同計画で自分の知りたい分野の系統的レビューを読む。(コクランレビュー)
https://www.cochrane.org/
https://japan.cochrane.org/ja
個人でも有料なのがネックですが、要約や一年以内に公表された論文は無料とのことです。厚生労働省委託事業のMindsガイドラインセンターなどで日本語翻訳の要約などが読めます。まずはコクランで系統的レビューを探して読むことから初めて見ましょう。

2.Evidense-Based Medicine Reviews(EBMR)
http://ovidsp.ovid.com/autologin.cgi
参考:http://www.lib.kumamoto-u.ac.jp/support/tools/542

コクランやヘルスケア分野の複数の二次的データーベースと、MEDLINEのような一時論文のデータベースを統合したものとなります。一度の検索で複数のデーターベースが検索でき、専門家の注釈もつくが、高額です。個人では無く機関向けです

質の高い論文を検索したければ、
・ACP Journal Club
・Cochrane database for Systematic Reviews,
・Database of Abstracts of Reviews of Effects
などに限定して検索をします。(最も信頼性があるレビュー論文に絞って探す)

3.PsycINFO
https://www.apa.org/pubs/databases/psycinfo/index.aspx
参考:日本語ガイド(PDF)
アメリカ心理学会が運営する心理学系論文のデータベースです。要約は無料で、全文は有料の形式が多いです。玉石混淆。

4.MEDLINE
https://www.ncbi.nlm.nih.gov/pubmed/
参考:日本語検索サイト

アメリカ国立医学図書館が設立した医療データーベースです。ヘルスケアの分野で世界で最も利用されています。PubMedでインターネット公開をしており、全文は有料が多いです。こちらも玉石混淆です。
検索にコツがあり、MeSH(Medical Subject Headings)メッシュタームという米国立医学図書館が指定した単語で検索しないといけません。
https://ja.wikipedia.org/wiki/MeSH

上記の他に、電子ジャーナルなどもありますが、有料であったり、やはり個人よりも大学など研究機関向けです。

検索と活用の仕方:まずはアブスト(要約)を読むだけで充分

まずはアブスト(要約)を読むだけでも充分です。得られた論文を批判的に吟味するのは高難易度です。(その場合はGRADEという基準で精査する。)

コクランレビューが最も手軽で信頼性も置けます。掲載までに厳密な手続きを踏んでいるため、批判的吟味も必要ないからです。コクランレビューにはPICOがちゃんとまとめられた抄録も多いです。最初はコクランレビューの抄録を読むところから始めるだけでも充分とのこと。

総評

学術的価値 ★★★★★★★★★★+
満足度   ★★★★★★★★★★

この本を読むことで巷に溢れるテレビやネットの過大広告の商品(主に健康食品)に無駄金を使うことはなくなると思います。誇張した宣伝に騙されなくなり、しっかりと根拠を精査する意識が芽生えます。人生の中で一度は読んでおきたい本ですね。

大学院に通って研究を模索している人ならば、どう実験デザインをするかの大きな気づきやヒントを与えてくれる必読書。一般の人にとってはネットで論文検索をする時にどの論文が質の高い根拠を提示しているのかを判別する視点を与えてくれる教養書です。

自分の経験や誰かの臨床体験を根拠にするpractice-basedの態度ではなく、科学的な検証に基づいたevidence-basedの態度を養うこと。わらにもすがる思いでエビデンスのない治療法=プラシーボ効果しか無い治療法にすがる人を減らしていく意味でも、こうしたエビデンスベイストプラクティスの態度はますます必要とされていくでしょう。

「心理職のためのエビデンス・ベイスト・プラクティス入門」
原田 隆之(著)
金剛出版 2015/12/23