Wikipedia:信頼できる情報源 (医学)

ウィキペディアの記事は、医学的助言を提供しませんが、それでもなお健康情報の資料は重要かつ広く用いられています[1]。そのため、あらゆる記事における生物医学の情報は、信頼性の高い、第三者によって、出版された二次資料に基づき、現行の医学的な知識を正確に反映することが重要です。

生物医学的な内容にとって理想的な情報源は、評判の良い医学雑誌における文献レビュー英語版システマティック・レビュー、また評判のいい出版社から公表された関連分野の専門家によって書かれた学術的で専門的な書籍、また国内あるいは国際的に認知された専門機関による診療ガイドラインや見解声明(ポジション・ステートメント)が挙げられます。一次資料は医学の内容では通常は用いないようにすべきです。多くのそうした情報源は、総説論文によって吟味されていないとか、臨床試験によって実証されていない可能性のある予備的情報といった、信頼できない情報を説明しています。

この文書は、全般的な情報源の方針であるWikipedia:検証可能性を補い、代替医療を含めたいかなる種類の記事においても、医学や健康関連の内容のための適切な情報源に注意を促すものです。他の種類の内容のための情報源—医学関連の記事の中での非医学的な情報を含め—について、この文書ではなく、信頼できる情報源のような全般的なガイドラインが取り扱っています。

この文書はウィキペディア英語版ではガイドラインとして扱われています。日本語版では、2012年4月にガイドライン化された信頼できる情報源#自然科学、数学と医学にて、専門的な合意を重視することや、出典や研究の質を評価すること、大言壮語ではなく正確に記述するという基本的な部分は示されてきました。この文書は、他の方針も絡めたその詳しい医学的な解釈に加え、最新の情報を提供するための助言が追加されています。

定義[編集]

  • 一次資料は、医学の分野では、著者が研究に直接参加したり、その個人的な経験を文書化したものです。彼らは患者を検査したり、ラットに注射したり、試験管に対象物を詰めたり、あるいは少なくともそれを実行した人たちを監督しています。医学雑誌にて出版されている論文は、すべてとは言いませんがその多くは、研究と発見による事実についての一次資料です。
  • 二次資料は、医学の分野では、医学的な主題についての現時点での理解の概要を提示したり、推奨される方法の勧告を行ったり、複数の研究結果を結合したメタアナリシスのような、たいてい1つ以上の一次資料や二次資料をまとめたものです。例として、医学雑誌に掲載された文献レビュー英語版システマティック・レビュー、専門的な学術書や専門書、また主要な保健機関による診療ガイドラインや見解声明(ポジション・ステートメント)が挙げられます。
  • 三次資料は、通常は二次資料の領域でまとめています。大学課程の教科書、一般向けの科学書、百科事典は三次資料の例です。

ウィキペディアのすべての記事は、信頼性の高い、出版された二次資料に基づくべきです。一次資料は 健康関連の項目には用いるべきではありません。なぜなら、一次の生物医学の文献は他の研究者によって反論を受ける可能性があるため、予備的で信頼できないからです。従ってウィキペディアのコミュニティはある問題への手引きを提供するために、専門家による査読を通した助言や、医学や科学の主要な団体による声明に従います。一次資料に基づく稀な編集では、重みづけを最小にして、情報源による結論のみを明快に記述すべきで、そうすれば専門知識を持たない編集者でも確認できます。そうした資料が用いられた稀な場面では、一次資料を、その研究者による結論が明快でないことを裏付けるために用いるべきではありません(Wikipedia:独自研究は載せないを参照)。

基本的な考え方[編集]

二次資料を大切に[編集]

個々の一次資料は、信頼性の高い二次資料の結論を暴くとか、反論や対抗のように参照したり併記すべきではありません。特定の観点を推進するような発表済みの情報の合成は、独自研究なので避けるべきです。ウィキペディアの記事は、公開研究英語版のための場ではないからです。医学においては、議論があったり不確実な領域は、様々な観点を説明した信頼できる二次資料にて説明すべきです。少数派の意見に有利な一次資料は、二次資料にて示されるその分野の専門家の意見を弱めるバランスで描写するような方法で、統合したり、あるいは文脈を欠いて示すべきではありません。もし一次資料や二次資料の両方が同じ話題に言及しているのなら、二次資料を参照すべきです。一次資料は、二次資料を補助するように示されるかもしれません。

科学的な研究成果は一次資料が公表され、科学界がその新しい結果を分析するのはこれからという時点で、よく大衆紙にもてはやされがちです。そのような情報源では、(新規傾向(英語)に照らして)完全に除外すべきでしょう。なぜなら、ある研究の重みづけを決定するには、信頼性の高い二次資料が必要とされるからです(それに基づくプレスリリースや新聞記事ではありません)。 その研究の結論に言及する価値があるなら(例えば、大規模なランダム化比較試験による驚くべき結果の公開)、それは単一の研究から説明されるべきです。例:

「2010年に公表されたアメリカ国立衛生研究所(NIH)が出資した大規模な研究は、セレンとビタミンEのサプリメントが前立腺がんの危険性を高めることを見い出した。以前には予防すると考えられていた。」(出典 PMID 20924966

その分野でレビューが公開されるのための十分な時間が経過した後では、一次研究よりも、そのレビューを優先して参照すべきでしょう。二次資料を用いれば、認められた事実としてより信頼性が高いことが提示できます。例:

「ビタミンEとセレンをサプリメントによって補助することは、前立腺がんの危険性を高めます。」(出典 PMID 23552052

ある程度の期間が過ぎても、その題材についてのレビューがないなら、その内容と一次資料を削除すべきでしょう。

生物医学の分野での一次資料を避ける理由—とりわけ試験管内 (in vitro) 実験—は、しばしば再現できないため[2][3][4]、百科事典のように、信頼性の高い健康に関する内容を作り出すには不適当です。2011年にバイエル社の創薬科学者たちは、優れた研究でも20から25パーセントだけが再現可能であったことを報告しています[5]。アムジェン社の科学者たちは、続く2012年の論文では、科学的な論文の中で最も高水準とした、53の強い影響力のある論文においても、わずか6つ(11パーセント)しか再現可能ではなかったことが示されています[6]。2013年4月には、「ネイチャー」誌は、上記の論文や他の論文でも再現性の問題があることに対して、その水準を高める対策をとっていたことを公表しています[7]。査読された雑誌に掲載され、ある主張がなされたという事実は、真実とはまた異なる場合があります。十分に設計されたランダム化試験でも、(低確率で)誤った結果を出すことがありえます。実験と研究は、不完全な結果を生んだり、故意の不正行為に見舞われることがあります(MDMAのドーパミン作動性神経毒性についての撤回された論文ヘンドリック・シェーンを参照)。

科学的コンセンサスをまとめる[編集]

専門家向けの科学雑誌 (scientific journal) は、医学的研究を含む実験に関する一次資料や、二次資料の両方を探すのに最適です。すべての厳密な科学雑誌は査読されています。査読を欠いている雑誌にて公開されているとか、異なる分野で報告された資料に気を付けてください(en:Martin Rimmを参照)。評判の悪い雑誌あるいは評判の悪い分野における公開された資料にも気を付けてください(ソーカル事件を参照)。

ウィキペディアの方針である中立的な観点独自研究は載せないは、浸透している医学的コンセンサス科学的コンセンサスを求めています。それらは、最近の信頼性のある総説論文、主要な専門的な医学や科学の組織(例えば、欧州心臓病学会とかアメリカ感染症学会)や、広く認められている行政機関とそれに準じる保健機関(例えば、アメリカ予防事業特別委員会:USPSTF、アメリカ医療研究品質局:AHRQ、英国国立医療技術評価機構:NICE、また世界保健機関:WHO)が出した声明や診療ガイドライン、また教科書、あるいは一部のモノグラフの形式の資料に見つけることができます。とはいえ、重要な少数派の観点もウィキペディアでは歓迎されており、その分野の専門家によって受け入れられている文脈でもって示す必要があるでしょう。加えて「ちっぽけな」少数派の見解までもは取り上げる必要はありません。

最後に、信頼性の高い情報源において公にされている議論について、読者に認識してもらうようにします。出典の参照が十分な記事は、具体的な雑誌や特定の研究者によって提唱された具体的な理論を、説明した上で挙げるでしょう。

証拠の質を評価する[編集]

証拠(科学的根拠またはエビデンス)の強さは、上に行くほど強くなる。(ニューヨーク州立大学[8]

証拠(エビデンス)の質について知ることは、編集の助けとなります。それは、多数派と少数派の見解を見分けること、その重みづけを決定すること、また根拠に基づく医療 (EBM) として認められる情報を特定することについてとなります。なぜなら信頼できる医学雑誌のすべての論文を同等の信頼性として扱うことはできないからです。研究はレベルの番号に分類することができ[9]、通常、編集者は高品質な証拠に頼るべきです。システマティック・レビューは、症例報告のような低品質な証拠や、事例証拠や慣習的な知識のような証拠ではないものよりも優先されます。国内または国際的に認知された専門機関による診療ガイドラインと見解声明(ポジション・ステートメント)は、多くの場合その報告の一環として証拠の評価を含んでいます。

最良の証拠は、主にランダム化比較試験 (RCT) のメタアナリシスによってもたらされます[10]。概して質が良い文献の、ある機関によるシステマティック・レビューでも、非ランダム化試験を含む場合には、信頼性が低くなるでしょう[11]。ナラティブ・レビューは証拠の質の文脈を確立するのを助けます。おおよその順では、次に質の低い証拠は、個々のRCTとなります。続いて、品質の順位が下がるように挙げていきます。他の比較試験;準実験的な研究;コホート研究とか症例対照研究のような、非実験的、前向き (prospective) 、観察研究英語版;横断研究(統計調査)や、生態学的研究英語版のような他の相関研究;後ろ向き (retrospective) の分析;そして、こうした科学的な証拠に基づかない専門家の意見や臨床的な経験則です[12]。症例報告は、一般紙であれ査読された医学雑誌であれ、逸話が由来であり、ほとんどの場合に信頼できる医学の情報源の最低限の必要条件を満たしません。

未来の予測や初期段階の研究は、広く受け入れられることを示すような方法で参照すべきではありません。例えば、初期段階の治験の結果は、病気に関する記事の「治療」節に含めるのは適切ではありません。なぜなら未来の治療法は、現在の治療の実践とほとんど関連がないからです。しかし、一部ではその結果は疑問のある治療法や、それに関わる研究者や企業について、注力している記事では適切となりうるでしょう。特に、二次資料を参照する場合には、そのような情報はある病気についての記事の中の、研究の方向性について詳しく書かれた節では、適切となるかもしれません。誤解を防ぐために、その文章は研究の水準を明確に同定して出典とすべきです(例:ヒトにおける初の安全性試験)。

医学的な証拠の質を評価するための、いくつかの正式な体系があります[13][14]。「証拠の質を評価する」とは、編集者が、研究の「種類」についての質を決定すべきだということを意味します。編集者は、学問的な査読を実行しません。したがって、基準、出典、資金源、また結論を含む研究に対する個人的な反論によって、高品質な「種類」の研究を却下しないでください。

過剰に強調された単独の研究、特に試験管内 (in vitro) あるいは動物実験を避ける[編集]

試験管内 (in vitro) および動物モデルは、、生物医学研究の中心的な役割を果たし、また機序的な経路を決定したり、仮説を生み出すのに貢献しています。しかし、試験管内 (in vitro) および動物モデルによる知見は、ヒトにおける臨床的な効果に、連続性をもって変換されるものではありません。試験管内 (in vitro) および動物モデルによるデータをウィキペディアの出典とする際には、そのデータが臨床の前段階であるということを読み手に明確にすべきです。そして文章を、ヒトに当てはまる知見かのように主張したり、ほのめかすことを避けるべきです。仮説を裏付けている水準を読み手に明らかにすべきです。

小規模、単独の研究は弱い証拠となり、データのチェリー・ピッキングとなってしまいます。そうではなくて、ウィキペディアにて研究の結果を参照したり言及するには、一次資料自体ではなくて、高品質な二次資料を用いて文脈をもたせて説明すべきです。

現在の証拠を使う[編集]

信頼性という最重要な目標を維持しながら、記事を最新に保つための経験則があります。以下の説明は、多くの一次資料といくつかのレビューが伴うような、活発に研究されている分野では適切ですが、進展がなかったり、わずかなレビューしか公開されていないような分野では、緩和する必要があるかもしれません。

  • ここ5年間ほどで公開された、より新しく、より良い、レビューを探します。調べるレビューの範囲は、古いものや最近の一次研究を踏まえての、新しいレビューが書かれ出版されるまでの、少なくとも1つの完全なレビューの周期を捕捉できるのに十分に広範にすべきです。
  • この範囲内で評価するのが難しいこともあるでしょう。最も最近のレビューは、より最近の研究の結果を含みますが、最も最近出版されたからという理由では、そのレビューに大きな重みづけを自動的に与えないようにします。それをすれば新規傾向(英語)となってしまいます。
  • 同じ題材における古い一次資料についての、最近のレビューを選びます。もし最近のレビューが、古い一次資料に言及していないならば、その古い資料は疑問視されます。逆に、ある古い一次資料に影響力があり、反復され、複数のレビューの中で頻繁に参照されているなら、レビューが定めた文脈において、本文にて言及されます。例えば、遺伝学の記事では、ダーウィンの1859年の著作である『種の起源』が、最近のレビューによって裏付けられる議論の一部として言及されるかもしれません。

これらの経験則には、以下のような例外があります。

  • 「歴史」節では、しばしば理由を明確にするために古い研究を参照するでしょう。
  • コクラン・ライブラリのレビューは、その最初の公開日が範囲外であっても、一般に高品質で、定期的に見直されています。
  • 低品質の最新の資料が、より高品質な古い資料よりも、必ずしも優先されるということはありません。

関連項目[編集]

非営利団体のWikiProject Med (Meta-Wiki) が組織されており、ウィキメディア財団の傘下となっている。言語を超えた医学のコンテンツの開発促進を目的としている。

テンプレート[編集]

脚注[編集]

  1. ^ Laurent, MR; Vickers, TJ (2009). “Seeking health information online: does Wikipedia matter?”. J Am Med Inform Assoc 16 (4): 471–9. doi:10.1197/jamia.M3059. PMC 2705249. PMID 19390105. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2705249/. 
  2. ^ Loscalzo, J. (2012). “Irreproducible Experimental Results: Causes, (Mis)interpretations, and Consequences”. Circulation 125 (10): 1211–1214. doi:10.1161/CIRCULATIONAHA.112.098244. ISSN 0009-7322. PMC 3319669. PMID 22412087. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3319669/. 
  3. ^ Naik, Gutnam (2011年12月2日). “Scientists' Elusive Goal: Reproducing Study Results”. Wall Street Journal. https://www.wsj.com/articles/SB10001424052970203764804577059841672541590 
  4. ^ ネイチャー』によるChallenges in Reproducibility initiative (英語)
  5. ^ Prinz F et al. Believe it or not: how much can we rely on published data on potential drug targets? Nature Reviews Drug Discovery 10, 712 (September 2011) | doi:10.1038/nrd3439-c1
  6. ^ C. Glenn Begley & Lee M. Ellis Drug development: Raise standards for preclinical cancer research Nature 483, 531–533 (29 March 2012) doi:10.1038/483531a
  7. ^ Editors of Nature. April 24 2013 Announcement: Reducing our irreproducibility
  8. ^ SUNY Downstate EBM Tutorial”. library.downstate.edu. 2004年3月23日時点のオリジナルよりアーカイブ。2015年9月3日閲覧。
  9. ^ “A practical guide to assigning levels of evidence”. J Bone Joint Surg Am 89 (5): 1128–30. (May 2007). doi:10.2106/JBJS.F.01380. PMID 17473152. https://pubmed.ncbi.nlm.nih.gov/17473152/. 
  10. ^ Straus SE, Richardson WS, Glasziou P, Haynes RB (2005). Evidence-based Medicine: How to Practice and Teach EBM (3rd ed.). Edinburgh: Churchill Livingstone. pp. 102–105. ISBN 0-443-07444-5 
  11. ^ Straus SE, Richardson WS, Glasziou P, Haynes RB (2005). Evidence-based Medicine: How to Practice and Teach EBM (3rd ed.). Edinburgh: Churchill Livingstone. p. 99. ISBN 0-443-07444-5 
  12. ^ 専門家の意見や臨床的な経験則とは、例えば、ガイドライン中において専門家の意見を最も弱い根拠として採用したり、科学的根拠に基づくガイドラインが作成される前の「コンセンサス・ガイドライン」が作成されたりします。単にある専門家の著書から意見を採用するだけではなく、それを専門家が評価する過程が生じています。
  13. ^ Greenhalgh T (1997). “How to read a paper: Papers that summarise other papers (systematic reviews and meta-analyses)” (PDF). BMJ 315 (7109): 672–5. PMC 2127461. PMID 9310574. https://web.archive.org/web/20160309035052/http://www.vhpharmsci.com/decisionmaking/Therapeutic_Decision_Making/Intermediate_files/How%20to%20read%20a%20paper-Papers%20that%20summarise%20other%20papers-systematic%20reviews%20and%20meta-analyses-BMJ.pdf. 
  14. ^ Young JM, Solomon MJ (2009). “How to critically appraise an article”. Nat Clin Pract Gastroenterol Hepatol 6 (2): 82–91. doi:10.1038/ncpgasthep1331. PMID 19153565. https://www.nature.com/articles/ncpgasthep1331.