「メタゲノミクス」の版間の差分

削除された内容追加された内容

インライン

2020年3月21日 (土) 06:02時点における版

メタゲノミクス（英:Metagenomics）は、環境サンプルから直接回収されたゲノム DNAを扱う研究分野である。広義には環境ゲノミクスやエコゲノミクス、群集ゲノミクスとも呼ばれる^[1]。メタゲノム解析(Metagenomic analysis)、あるいは単純にメタゲノム(Metagenome)とも呼称される。従来の微生物のゲノム解析では単一菌種の分離・培養過程を経てゲノムDNAを調製していたが、メタゲノム解析はその過程を経ずに、微生物の集団から直接そのゲノムDNAを調製し、そのヘテロなゲノムDNAをそのままシーケンスする。そのため、メタゲノム解析により従来の方法では困難であった難培養菌のゲノム情報が入手可能となった。地球上に棲息する細菌の99％以上は単独では培養できない菌種であると推察されており^[2]、メタゲノム解析は環境中に埋没する膨大な数の未知の細菌、未知の遺伝子を解明する手法として期待されている。DNAシークエンシングのコストが年々安価になっていることから、メタゲノミクスは微生物学において、より大規模で詳細な研究が行われることも見込まれる。メタゲノム解析は一般に、サンプル中に含まれる微生物コミュニティの菌叢網羅的な配列情報をショットガンシーケンスにより取得し解析することを指す^[3]が、日本においてはしばしばPCRを経た増幅シーケンス（16S rRNAタグシーケンスなど）もメタゲノム解析に含むことがある。

今日では、ヒトの腸内細菌叢、海中の微生物群、海底の鯨骨細菌群、農場土壌の細菌群、鉱山廃水中のバイオフィルム、メタン酸化古細菌群など、様々な環境を対象としたメタゲノム解析が論文として報告されている。

語源

メタゲノムという用語は、「ゲノム」に高次元を表す「メタ」という言葉を付け加えて命名された^[4]。これは単一生物のゲノムを研究するように、環境中から遺伝子配列を纏めて収集し、解析をすることが可能であろうという考えが元にある。この用語はJo Handelsman, Jon Clardy, Robert M. Goodman, Sean F Bradyらにより1998年に初めて論文内で使用された^[4]。Kevin ChenとLior Pachterは2005年にメタゲノミクスを「個々の菌を研究室内で単離したり培養したりする必要がない現代ゲノム技術の応用分野」と定義している^[5]。

ゲノムシーケンシング

かつては環境サンプルから数千塩基対よりも長いDNA配列の回収することは困難であったが、分子クローニング用のベクターとしてBAC(bacterial artificial chromosomes)が開発されたことにより、ライブラリーの構築が可能になった。現在では次世代シーケンサーの登場により、BACライブラリを経ることなくより大量の配列情報を取得することが可能である。 (詳細はDNAシーケンシングを参照)

ショットガンシーケンシングの登場

バイオインフォマティクスの進歩、DNA増幅(PCR)の改良、および計算能力の急増により、環境サンプルから得られたDNA配列の分析能力は飛躍的に向上し、ショットガンシーケンスをメタゲノムサンプルに応用することが可能になった（全メタゲノムショットガンシーケンス(Whole Metagenome Shotgun Sequence)、または頭文字を取ってWMGSと呼ばれることがある）。培養微生物とヒトゲノムを始めとする大半のゲノムシーケンスにおいては、DNAをランダムに短く切断し、それらの配列を大量にシーケンスし、アセンブリを経てコンセンサス配列を再構築する、というステップを経る。このようなプロセスを経ることで、メタゲノム解析におけるショットガンシーケンシングにより、環境サンプルに存在する遺伝子配列を網羅的に得ることが可能である。歴史的には、このシーケンスを容易にするために、BAC等を利用したクローンライブラリが使用されてきた。ショットガンメタゲノムはコニュニティ内で、どのような系統群の生物が存在し、どのような代謝プロセスが可能か、等についての情報を提供する。理想的には、その環境中における細胞量によって回収されるDNA量も決まるため、環境サンプル内で最も多く存在する生物種は最も大量にシーケンスされ、配列情報も多く得ることができる。一方で、存在量の少ない生物種（そのサンプルにおける希少種）では十分に配列情報が得られない可能性があり、その生物種のゲノムを完全に決定するためには高いカバレッジが必要になり、合わせて非常に多くのサンプルが必要となる。反面、ショットガンシーケンスは（理想的には）完全にランダムにDNA断片のシーケンスを行うため、従来の培養技術では見過ごされていた生物種であっても、大なり小なりゲノム情報を得ることができる。

次世代シーケンシング技術の活用

次世代シーケンサー（ハイスループットシーケンシング技術）の登場と進歩により、クローニングのステップは不要になり、この手順を省略してシーケンスデータの収量を増やすことが、今日では可能である。次世代シーケンスを使用して実施された最初のメタゲノム研究では、454パイロシーケンシングが利用された^[7]。その後、Ion Torrent Personal Genome Machineや、Illumina MiSeq、HiSeq、Applied Biosystems SOLiDシステム等が登場し、メタゲノム解析に利用されるようになった^[8]。これらのDNAシーケンシング技術は、サンガーシーケンスよりも短い配列を得られる。例えばサンガー法では750bp程度のリードを得られるのに対し、Ion Torrent PGM Systemや454パイロシーケンシングでは約400bp、Illumina MiSeqでは400-700bp、SOLiDは25-75bp程度である(2008年のカタログスペック値)^[9]。一方で、次世代シーケンシングでは圧倒的に多量のDNA配列を読むことができる。例えば454パイロシーケンスでは200〜500Mb、Illuminaプラットフォームでは20〜50Gbもの配列情報を排出し、この値は年々ますます増加している（2009年のカタログスペック値）^[10]。

新しい技術の活用

2010年にPacBio RS2が発売されたことを皮切りに、次世代シーケンサーよりも更に長いロングリードを読むことができる、いわゆる第3世代シーケンサーがPacBioやNanopore社から登場している。このような第3世代シーケンシングをメタゲノム解析に応用することで、さらに効率できなゲノムアセンブリが可能になると考えられる^[11]。また、ショットガンシーケンスと染色体コンフォメーションキャプチャ法（Hi-C）を組み合わせることで、同じ細胞内で近接するDNA断片の情報を得ることができ、この情報を活用して微生物ゲノムのアセンブリを効率化する研究も報告されている^[12]。

バイオインフォマティクス解析

データ解析

歴史と背景

従来のDNAシーケンスは、単一の細菌株を培養することが最初に必要であった。しかし初期のメタゲノミクスの研究により、多くの環境には培養が不可能でシーケンスが困難な微生物が多く存在することが明らかにされた。これらの初期の研究では16S rRNA遺伝子配列を調べることに焦点が当てられた。この遺伝子配列は比較的短く、原核生物種内において保存性が高い一方で、異なる種間で変化が見られるため、ゲノム全体をシーケンスするよりも簡便に環境中の微生物群集を系統的に調べることが出来る。多くの環境サンプルに対して16S rRNA遺伝子配列のDNAシーケンスが実施され、その結果、培養されている既知の生物種には当てはまらない配列が多数見つかった。このことはすなわち、環境中には極めて多様な未培養系統群の微生物が存在していることを示している。このようにして16S rRNA遺伝子配列を培養を経ず環境中から直接得た研究により、培養を元にした方法で見つけられる試料中の真性細菌・古細菌は全体の1%に満たないことが論文で報告された^[13]。

PCRを使用してリボソームRNA配列の多様性を調査するという初期の分子生物学的な研究は、ノーマンR.ペースと同僚によって行われた^[14]。これらの先駆的な研究から得られた知見から発展して、環境試料から直接DNAをクローニングするアイデアが1985年に発表された^[15]。そして、実際に大西洋の海水という環境サンプルからDNAを抽出してびクローニングした最初の報告が、Paceらによって1991年に発表された^[16]。これらがPCR偽陽性ではないことが相当な努力により示され、未探索の系統群によって形作られる複雑な微生物コミュニティの存在が示唆された。この方法論は、高度に保存された非タンパク質コード遺伝子の探索に限定されていたが、培養方法で知られていたよりもはるかに複雑な多様性が存在するという、初期の微生物形態ベースの観察結果をサポートしていた。すぐその後、Healyは実験室に置いていた乾燥した草の上で増殖していた環境微生物の複合培養物から構築した「野生ライブラリ」(zoolibraries)とでも呼ぶべきものから、機能遺伝子をメタゲノム的に単離したと1995年に報告した^[17]。その後Edward DeLongらは、海洋サンプルからライブラリー構築と16S rRNAシーケンスを実施し、環境中の原核生物を系統的に解析する研究の基礎を築いた^[18]。

2002年、 Mya BreitbartとForest Rohwerらは、ショットガンシーケンスを使用して、200リットルの海水に5000種類以上のウイルスが含まれていることを示した^[19]。その後の研究により、ヒトの糞便には1000種以上のウイルス種が存在し、また海洋堆積物1キログラムあたりには多くのバクテリオファージを含む百万種ものウイルスが存在する可能性があることが示された。これらの研究で見つかったウイルスは大半が新種であった。 2004年には、Gene TysonとJill Banfieldらは、酸性の鉱山排水システムから抽出された細菌叢DNAの配列を決定した^[20]。この研究では、培養が試みられつつも成功していなかった少数の細菌および古細菌系統の、完全またはほぼ完全なゲノムが得られている。

2003年からは、ヒトゲノムプロジェクトに並行して進められた民間資金ベースのプロジェクトをリーダーとして率いていたCraig Venterが、グローバル・オーシャン・サンプリング・エクスペディション（GOS）を主導し、世界中を周回する旅を通じてメタゲノムサンプルを蒐集した。得られたサンプルはすべて、新規なゲノム（すなわち新規生物）が特定されることを期待して、ショットガンシーケンスが実施された。これに先駆けて実施されたパイロットプロジェクトでは、サルガッソー海で採取したサンプルの解析を行い、約2000種もの異なるDNAを発見し、内148種は新規な細菌種に由来すると考えられた^[21]。ベンターは地球を一周し、米国西海岸を集中的にサンプリングし、さらに2年間をかけてバルト海、地中海、黒海でサンプリングを行った。この間に収集されたメタゲノムデータの分析により海洋表層の細菌層は、富栄養/貧栄養の環境条件に適応した分類群と、比較的少ないがより豊富で広く分布する主にプランクトンで構成される分類群という、2つのグループによって構成されていることが判明した^[22]。

2005年、ペンシルベニア州立大学のStephan C. Schusterらは、ハイスループットシーケンスで生成された環境サンプルの最初のシーケンスを公開した^[23]。これは454 Life Sciences開発した超並列パイロシーケンスによるものであった。この分野の別の初期の論文は、2006年にサンディエゴ州立大学のRobert EdwardsとForest Rohwerらよって発表された^[24]。

外部リンク

日本ゲノム微生物学会

脚注

[脚注の使い方]

^ 木暮(2011). "海洋における環境ゲノミクス". 地球環境 Vol. 16 No. 1 71-79.
^ 工藤俊章『難培養微生物の利用技術』シーエムシー出版、2010年、はじめに
^ Peach, Ken (2007-10-02). “Welcome to PMC Physics A”. PMC Physics A 1 (1). doi:10.1186/1754-0410-1-1. ISSN 1754-0410.
^ ^a ^b Handelsman, J.; Rondon, M. R.; Brady, S. F.; Clardy, J.; Goodman, R. M. (1998-10). “Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products”. Chemistry & Biology 5 (10): R245–249. doi:10.1016/s1074-5521(98)90108-9. ISSN 1074-5521. PMID 9818143.
^ Chen, K.; Pachter, L. (2005). "Bioinformatics for Whole-Genome Shotgun Sequencing of Microbial Communities". PLoS Computational Biology 1 (2): e24. doi:10.1371/journal.pcbi.0010024
^ Thomas, T.; Gilbert, J.; Meyer, F. (2012). “Metagenomics - a guide from sampling to data analysis”. Microbial Informatics and Experimentation 2 (1): 3. doi:10.1186/2042-5783-2-3. PMC 3351745. PMID 22587947.
^ Poinar, Hendrik N.; Schwarz, Carsten; Qi, Ji; Shapiro, Beth; MacPhee, Ross D. E.; Buigues, Bernard; Tikhonov, Alexei; Huson, Daniel H. et al. (2006-01-20). “Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA” (英語). Science 311 (5759): 392–394. doi:10.1126/science.1123360. ISSN 0036-8075.
^ Rodrigue, Sébastien; Materna, Arne C.; Timberlake, Sonia C.; Blackburn, Matthew C.; Malmstrom, Rex R.; Alm, Eric J.; Chisholm, Sallie W. (2010-07-28). Gilbert, Jack Anthony. ed. “Unlocking Short Read Sequencing for Metagenomics” (英語). PLoS ONE 5 (7): e11840. doi:10.1371/journal.pone.0011840. ISSN 1932-6203. PMC PMC2911387. PMID 20676378.
^ Schuster, Stephan C (2008-01). “Next-generation sequencing transforms today's biology” (英語). Nature Methods 5 (1): 16–18. doi:10.1038/nmeth1156. ISSN 1548-7091.
^ “Metagenomics versus Moore's law” (英語). Nature Methods 6 (9): 623–623. (2009-09). doi:10.1038/nmeth0909-623. ISSN 1548-7091.
^ Hiraoka, Satoshi; Yang, Ching-chia; Iwasaki, Wataru (2016). “Metagenomics and Bioinformatics in Microbial Ecology: Current Status and Beyond” (英語). Microbes and environments 31 (3): 204–212. doi:10.1264/jsme2.ME16024. ISSN 1342-6311. PMC PMC5017796. PMID 27383682.
^ Watson, Mick; Roehe, Rainer; Walker, Alan W.; Dewhurst, Richard J.; Snelling, Timothy J.; Ivan Liachko; Langford, Kyle W.; Press, Maximilian O. et al. (28 February 2018). “Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen” (英語). Nature Communications 9 (1): 870. Bibcode: 2018NatCo...9..870S. doi:10.1038/s41467-018-03317-6. ISSN 2041-1723. PMC 5830445. PMID 29491419.
^ Hugenholz, P; Goebel BM; Pace NR (1 September 1998). "Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity". J. Bacteriol 180(18): 4765–74. PMC 107498.PMID 9733676
^ Lane, D. J.; Pace, B.; Olsen, G. J.; Stahl, D. A.; Sogin, M. L.; Pace, N. R. (1985-10). “Rapid determination of 16S ribosomal RNA sequences for phylogenetic analyses”. Proceedings of the National Academy of Sciences of the United States of America 82 (20): 6955–6959. doi:10.1073/pnas.82.20.6955. ISSN 0027-8424. PMC PMC391288. PMID 2413450.
^ Pace, Norman R.; Stahl, David A.; Lane, David J.; Olsen, Gary J. (1986). Marshall, K. C.. ed (英語). Advances in Microbial Ecology. Boston, MA: Springer US. pp. 1–55. doi:10.1007/978-1-4757-0611-6_1. ISBN 978-1-4757-0611-6
^ Schmidt, T M; DeLong, E F; Pace, N R (1991). “Analysis of a marine picoplankton community by 16S rRNA gene cloning and sequencing.” (英語). Journal of Bacteriology 173 (14): 4371–4378. doi:10.1128/JB.173.14.4371-4378.1991. ISSN 0021-9193. PMC PMC208098. PMID 2066334.
^ Healy, F. G.; Ray, R. M.; Aldrich, H. C.; Wilkie, A. C.; Ingram, L. O.; Shanmugam, K. T. (1995-09). “Direct isolation of functional genes encoding cellulases from the microbial consortia in a thermophilic, anaerobic digester maintained on lignocellulose” (英語). Applied Microbiology and Biotechnology 43 (4): 667–674. doi:10.1007/BF00164771. ISSN 0175-7598.
^ Stein, J L; Marsh, T L; Wu, K Y; Shizuya, H; DeLong, E F (1996). “Characterization of uncultivated prokaryotes: isolation and analysis of a 40-kilobase-pair genome fragment from a planktonic marine archaeon.” (英語). Journal of bacteriology 178 (3): 591–599. doi:10.1128/JB.178.3.591-599.1996. ISSN 0021-9193. PMC PMC177699. PMID 8550487. https://jb.asm.org/content/178/3/591.
^ Breitbart, M.; Salamon, P.; Andresen, B.; Mahaffy, J. M.; Segall, A. M.; Mead, D.; Azam, F.; Rohwer, F. (2002-10-29). “Genomic analysis of uncultured marine viral communities” (英語). Proceedings of the National Academy of Sciences 99 (22): 14250–14255. doi:10.1073/pnas.202488399. ISSN 0027-8424. PMC PMC137870. PMID 12384570.
^ Tyson, Gene W.; Chapman, Jarrod; Hugenholtz, Philip; Allen, Eric E.; Ram, Rachna J.; Richardson, Paul M.; Solovyev, Victor V.; Rubin, Edward M. et al. (2004-03). “Community structure and metabolism through reconstruction of microbial genomes from the environment” (英語). Nature 428 (6978): 37–43. doi:10.1038/nature02340. ISSN 0028-0836.
^ Venter, J. C. (2004-04-02). “Environmental Genome Shotgun Sequencing of the Sargasso Sea” (英語). Science 304 (5667): 66–74. doi:10.1126/science.1093857. ISSN 0036-8075.
^ Yooseph, Shibu; Nealson, Kenneth H.; Rusch, Douglas B.; McCrow, John P.; Dupont, Christopher L.; Kim, Maria; Johnson, Justin; Montgomery, Robert et al. (2010-11). “Genomic and functional adaptation in surface ocean planktonic prokaryotes” (英語). Nature 468 (7320): 60–66. doi:10.1038/nature09530. ISSN 0028-0836.
^ Poinar, Hendrik N.; Schwarz, Carsten; Qi, Ji; Shapiro, Beth; MacPhee, Ross D. E.; Buigues, Bernard; Tikhonov, Alexei; Huson, Daniel H. et al. (2006-01-20). “Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA” (英語). Science 311 (5759): 392–394. doi:10.1126/science.1123360. ISSN 0036-8075.
^ Edwards, Robert A; Rodriguez-Brito, Beltran; Wegley, Linda; Haynes, Matthew; Breitbart, Mya; Peterson, Dean M; Saar, Martin O; Alexander, Scott et al. (2006-12). “Using pyrosequencing to shed light on deep mine microbial ecology” (英語). BMC Genomics 7 (1): 57. doi:10.1186/1471-2164-7-57. ISSN 1471-2164. PMC PMC1483832. PMID 16549033.

この項目は、自然科学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（Portal:自然科学）。

[1] 木暮(2011). "海洋における環境ゲノミクス". 地球環境 Vol. 16 No. 1 71-79.

[2] 工藤俊章『難培養微生物の利用技術』シーエムシー出版、2010年、はじめに

[3] Peach, Ken (2007-10-02). “Welcome to PMC Physics A”. PMC Physics A 1 (1). doi:10.1186/1754-0410-1-1. ISSN 1754-0410.

[:0-4] Handelsman, J.; Rondon, M. R.; Brady, S. F.; Clardy, J.; Goodman, R. M. (1998-10). “Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products”. Chemistry & Biology 5 (10): R245–249. doi:10.1016/s1074-5521(98)90108-9. ISSN 1074-5521. PMID 9818143.

[5] Chen, K.; Pachter, L. (2005). "Bioinformatics for Whole-Genome Shotgun Sequencing of Microbial Communities". PLoS Computational Biology 1 (2): e24. doi:10.1371/journal.pcbi.0010024

[6] Thomas, T.; Gilbert, J.; Meyer, F. (2012). “Metagenomics - a guide from sampling to data analysis”. Microbial Informatics and Experimentation 2 (1): 3. doi:10.1186/2042-5783-2-3. PMC 3351745. PMID 22587947.

[7] Poinar, Hendrik N.; Schwarz, Carsten; Qi, Ji; Shapiro, Beth; MacPhee, Ross D. E.; Buigues, Bernard; Tikhonov, Alexei; Huson, Daniel H. et al. (2006-01-20). “Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA” (英語). Science 311 (5759): 392–394. doi:10.1126/science.1123360. ISSN 0036-8075.

[8] Rodrigue, Sébastien; Materna, Arne C.; Timberlake, Sonia C.; Blackburn, Matthew C.; Malmstrom, Rex R.; Alm, Eric J.; Chisholm, Sallie W. (2010-07-28). Gilbert, Jack Anthony. ed. “Unlocking Short Read Sequencing for Metagenomics” (英語). PLoS ONE 5 (7): e11840. doi:10.1371/journal.pone.0011840. ISSN 1932-6203. PMC PMC2911387. PMID 20676378.

[9] Schuster, Stephan C (2008-01). “Next-generation sequencing transforms today's biology” (英語). Nature Methods 5 (1): 16–18. doi:10.1038/nmeth1156. ISSN 1548-7091.

[10] “Metagenomics versus Moore's law” (英語). Nature Methods 6 (9): 623–623. (2009-09). doi:10.1038/nmeth0909-623. ISSN 1548-7091.

[11] Hiraoka, Satoshi; Yang, Ching-chia; Iwasaki, Wataru (2016). “Metagenomics and Bioinformatics in Microbial Ecology: Current Status and Beyond” (英語). Microbes and environments 31 (3): 204–212. doi:10.1264/jsme2.ME16024. ISSN 1342-6311. PMC PMC5017796. PMID 27383682.

[12] Watson, Mick; Roehe, Rainer; Walker, Alan W.; Dewhurst, Richard J.; Snelling, Timothy J.; Ivan Liachko; Langford, Kyle W.; Press, Maximilian O. et al. (28 February 2018). “Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen” (英語). Nature Communications 9 (1): 870. Bibcode: 2018NatCo...9..870S. doi:10.1038/s41467-018-03317-6. ISSN 2041-1723. PMC 5830445. PMID 29491419.

[13] Hugenholz, P; Goebel BM; Pace NR (1 September 1998). "Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity". J. Bacteriol 180(18): 4765–74. PMC 107498.PMID 9733676

[14] Lane, D. J.; Pace, B.; Olsen, G. J.; Stahl, D. A.; Sogin, M. L.; Pace, N. R. (1985-10). “Rapid determination of 16S ribosomal RNA sequences for phylogenetic analyses”. Proceedings of the National Academy of Sciences of the United States of America 82 (20): 6955–6959. doi:10.1073/pnas.82.20.6955. ISSN 0027-8424. PMC PMC391288. PMID 2413450.

[15] Pace, Norman R.; Stahl, David A.; Lane, David J.; Olsen, Gary J. (1986). Marshall, K. C.. ed (英語). Advances in Microbial Ecology. Boston, MA: Springer US. pp. 1–55. doi:10.1007/978-1-4757-0611-6_1. ISBN 978-1-4757-0611-6

[16] Schmidt, T M; DeLong, E F; Pace, N R (1991). “Analysis of a marine picoplankton community by 16S rRNA gene cloning and sequencing.” (英語). Journal of Bacteriology 173 (14): 4371–4378. doi:10.1128/JB.173.14.4371-4378.1991. ISSN 0021-9193. PMC PMC208098. PMID 2066334.

[17] Healy, F. G.; Ray, R. M.; Aldrich, H. C.; Wilkie, A. C.; Ingram, L. O.; Shanmugam, K. T. (1995-09). “Direct isolation of functional genes encoding cellulases from the microbial consortia in a thermophilic, anaerobic digester maintained on lignocellulose” (英語). Applied Microbiology and Biotechnology 43 (4): 667–674. doi:10.1007/BF00164771. ISSN 0175-7598.

[18] Stein, J L; Marsh, T L; Wu, K Y; Shizuya, H; DeLong, E F (1996). “Characterization of uncultivated prokaryotes: isolation and analysis of a 40-kilobase-pair genome fragment from a planktonic marine archaeon.” (英語). Journal of bacteriology 178 (3): 591–599. doi:10.1128/JB.178.3.591-599.1996. ISSN 0021-9193. PMC PMC177699. PMID 8550487. https://jb.asm.org/content/178/3/591.

[19] Breitbart, M.; Salamon, P.; Andresen, B.; Mahaffy, J. M.; Segall, A. M.; Mead, D.; Azam, F.; Rohwer, F. (2002-10-29). “Genomic analysis of uncultured marine viral communities” (英語). Proceedings of the National Academy of Sciences 99 (22): 14250–14255. doi:10.1073/pnas.202488399. ISSN 0027-8424. PMC PMC137870. PMID 12384570.

[20] Tyson, Gene W.; Chapman, Jarrod; Hugenholtz, Philip; Allen, Eric E.; Ram, Rachna J.; Richardson, Paul M.; Solovyev, Victor V.; Rubin, Edward M. et al. (2004-03). “Community structure and metabolism through reconstruction of microbial genomes from the environment” (英語). Nature 428 (6978): 37–43. doi:10.1038/nature02340. ISSN 0028-0836.

[21] Venter, J. C. (2004-04-02). “Environmental Genome Shotgun Sequencing of the Sargasso Sea” (英語). Science 304 (5667): 66–74. doi:10.1126/science.1093857. ISSN 0036-8075.

[22] Yooseph, Shibu; Nealson, Kenneth H.; Rusch, Douglas B.; McCrow, John P.; Dupont, Christopher L.; Kim, Maria; Johnson, Justin; Montgomery, Robert et al. (2010-11). “Genomic and functional adaptation in surface ocean planktonic prokaryotes” (英語). Nature 468 (7320): 60–66. doi:10.1038/nature09530. ISSN 0028-0836.

[23] Poinar, Hendrik N.; Schwarz, Carsten; Qi, Ji; Shapiro, Beth; MacPhee, Ross D. E.; Buigues, Bernard; Tikhonov, Alexei; Huson, Daniel H. et al. (2006-01-20). “Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA” (英語). Science 311 (5759): 392–394. doi:10.1126/science.1123360. ISSN 0036-8075.

[24] Edwards, Robert A; Rodriguez-Brito, Beltran; Wegley, Linda; Haynes, Matthew; Breitbart, Mya; Peterson, Dean M; Saar, Martin O; Alexander, Scott et al. (2006-12). “Using pyrosequencing to shed light on deep mine microbial ecology” (英語). BMC Genomics 7 (1): 57. doi:10.1186/1471-2164-7-57. ISSN 1471-2164. PMC PMC1483832. PMID 16549033.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

@@ 5行目: / 5行目: @@
 == 語源 ==
-メタゲノムという用語は、「ゲノム」に高次元を表す「[[メタ]]」という言葉を付け加えて命名された<ref name=":0">{{Cite journal|last=Handelsman|first=J.|last2=Rondon|first2=M. R.|last3=Brady|first3=S. F.|last4=Clardy|first4=J.|last5=Goodman|first5=R. M.|date=1998-10|title=Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products|url=https://www.ncbi.nlm.nih.gov/pubmed/9818143|journal=Chemistry & Biology|volume=5|issue=10|pages=R245–249|doi=10.1016/s1074-5521(98)90108-9|issn=1074-5521|pmid=9818143}}</ref>。これは単一生物のゲノムを研究するように、環境中から[[遺伝子配列]]を纏めて収集し、解析をすることが可能であろうという考えが元にある。この用語はJo Handelsman, Jon Clardy, Robert M. Goodman, Sean F Bradyらにより1998年に初めて論文内で使用された<ref name=":0" />。Kevin ChenとLior Pachterは2005年にメタゲノミクスを「個々の菌を研究室内で単離培養するための現代ゲノム技術の応用分野」と定義している<ref>Chen, K.; Pachter, L. (2005). "Bioinformatics for Whole-Genome Shotgun Sequencing of Microbial Communities". ''PLoS Computational Biology'' '''1''' (2): e24. {{doi|10.1371/journal.pcbi.0010024}}</ref>。
+メタゲノムという用語は、「ゲノム」に高次元を表す「[[メタ]]」という言葉を付け加えて命名された<ref name=":0">{{Cite journal|last=Handelsman|first=J.|last2=Rondon|first2=M. R.|last3=Brady|first3=S. F.|last4=Clardy|first4=J.|last5=Goodman|first5=R. M.|date=1998-10|title=Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products|url=https://www.ncbi.nlm.nih.gov/pubmed/9818143|journal=Chemistry & Biology|volume=5|issue=10|pages=R245–249|doi=10.1016/s1074-5521(98)90108-9|issn=1074-5521|pmid=9818143}}</ref>。これは単一生物のゲノムを研究するように、環境中から[[遺伝子配列]]を纏めて収集し、解析をすることが可能であろうという考えが元にある。この用語はJo Handelsman, Jon Clardy, Robert M. Goodman, Sean F Bradyらにより1998年に初めて論文内で使用された<ref name=":0" />。Kevin ChenとLior Pachterは2005年にメタゲノミクスを「個々の菌を研究室内で単離したり培養したりする必要がない現代ゲノム技術の応用分野」と定義している<ref>Chen, K.; Pachter, L. (2005). "Bioinformatics for Whole-Genome Shotgun Sequencing of Microbial Communities". ''PLoS Computational Biology'' '''1''' (2): e24. {{doi|10.1371/journal.pcbi.0010024}}</ref>。
+== ゲノムシーケンシング ==
-== 歴史 ==
+[[ファイル:Environmental_shotgun_sequencing.png|リンク=https://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Environmental_shotgun_sequencing.png|サムネイル|346x346ピクセル|BACライブラリによる環境ショットガンシーケンス。（A）生息地からのサンプリング。（B）通常、サイズによる粒子のフィルタリングを行う。（C）細胞溶解およびDNA抽出（D）クローニングとライブラリ構築。 E）クローンのシーケンス。（F）コンティグとスキャフォールドへの配列アセンブリ。]]
-[[ファイル:Flow_diagram_of_a_typical_metagenome_projects.tiff|リンク=https://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Flow_diagram_of_a_typical_metagenome_projects.tiff|サムネイル|328x328ピクセル|典型的なメタゲノムプロジェクトのフロー図<ref>{{Cite journal|last=Thomas|first=T.|last2=Gilbert|first2=J.|last3=Meyer|first3=F.|year=2012|title=Metagenomics - a guide from sampling to data analysis|journal=Microbial Informatics and Experimentation|volume=2|issue=1|pages=3|DOI=10.1186/2042-5783-2-3|PMID=22587947|PMC=3351745}}</ref>]]
+かつては環境[[試料|サンプル]]から数千[[塩基対]]よりも長いDNA配列の回収することは困難であったが、[[分子クローニング]]用の[[ベクター (遺伝子工学)|ベクター]]としてBAC([[:en:Bacterial_artificial_chromosome|bacterial artificial chromosomes]])が開発されたことにより、[[図書館（生物学）|ライブラリー]]の構築が可能になった。現在では次世代シーケンサーの登場により、BACライブラリを経ることなくより大量の配列情報を取得することが可能である。 (詳細は[[DNAシークエンシング|DNAシーケンシング]]を参照)[[ファイル:Flow_diagram_of_a_typical_metagenome_projects.tiff|リンク=https://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Flow_diagram_of_a_typical_metagenome_projects.tiff|サムネイル|328x328ピクセル|典型的なメタゲノムプロジェクトのフロー図<ref>{{Cite journal|last=Thomas|first=T.|last2=Gilbert|first2=J.|last3=Meyer|first3=F.|year=2012|title=Metagenomics - a guide from sampling to data analysis|journal=Microbial Informatics and Experimentation|volume=2|issue=1|pages=3|DOI=10.1186/2042-5783-2-3|PMID=22587947|PMC=3351745}}</ref>]]
+=== ショットガンシーケンシングの登場 ===
+[[バイオインフォマティクス]]の進歩、DNA増幅([[PCR]])の改良、および計算能力の急増により、環境サンプルから得られたDNA配列の分析能力は飛躍的に向上し、[[ショットガン・シークエンシング法|ショットガンシーケンス]]をメタゲノムサンプルに応用することが可能になった（全メタゲノムショットガンシーケンス(Whole Metagenome Shotgun Sequence)、または頭文字を取ってWMGSと呼ばれることがある）。培養微生物と[[ヒトゲノム計画|ヒトゲノム]]を始めとする大半のゲノムシーケンスにおいては、DNAをランダムに短く切断し、それらの配列を大量にシーケンスし、アセンブリを経てコンセンサス配列を再構築する、というステップを経る。このようなプロセスを経ることで、メタゲノム解析におけるショットガンシーケンシングにより、環境サンプルに存在する遺伝子配列を網羅的に得ることが可能である。歴史的には、このシーケンスを容易にするために、BAC等を利用したクローンライブラリが使用されてきた。ショットガンメタゲノムはコニュニティ内で、どのような系統群の生物が存在し、どのような[[代謝]]プロセスが可能か、等についての情報を提供する。理想的には、その環境中における細胞量によって回収されるDNA量も決まるため、環境サンプル内で最も多く存在する生物種は最も大量にシーケンスされ、配列情報も多く得ることができる。一方で、存在量の少ない生物種（そのサンプルにおける希少種）では十分に配列情報が得られない可能性があり、その生物種のゲノムを完全に決定するためには高いカバレッジが必要になり、合わせて非常に多くのサンプルが必要となる。反面、ショットガンシーケンスは（理想的には）完全にランダムにDNA断片のシーケンスを行うため、従来の[[培養]]技術では見過ごされていた生物種であっても、大なり小なりゲノム情報を得ることができる。
+=== 次世代シーケンシング技術の活用 ===
+次世代シーケンサー（ハイスループットシーケンシング技術）の登場と進歩により、クローニングのステップは不要になり、この手順を省略してシーケンスデータの収量を増やすことが、今日では可能である。次世代シーケンスを使用して実施された最初のメタゲノム研究では、454パイロシーケンシングが利用された<ref>{{Cite journal|last=Poinar|first=Hendrik N.|last2=Schwarz|first2=Carsten|last3=Qi|first3=Ji|last4=Shapiro|first4=Beth|last5=MacPhee|first5=Ross D. E.|last6=Buigues|first6=Bernard|last7=Tikhonov|first7=Alexei|last8=Huson|first8=Daniel H.|last9=Tomsho|first9=Lynn P.|date=2006-01-20|title=Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA|url=https://www.sciencemag.org/lookup/doi/10.1126/science.1123360|journal=Science|volume=311|issue=5759|pages=392–394|language=en|doi=10.1126/science.1123360|issn=0036-8075}}</ref>。その後、Ion Torrent Personal Genome Machineや、Illumina MiSeq、HiSeq、Applied Biosystems SOLiDシステム等が登場し、メタゲノム解析に利用されるようになった<ref>{{Cite journal|last=Rodrigue|first=Sébastien|last2=Materna|first2=Arne C.|last3=Timberlake|first3=Sonia C.|last4=Blackburn|first4=Matthew C.|last5=Malmstrom|first5=Rex R.|last6=Alm|first6=Eric J.|last7=Chisholm|first7=Sallie W.|editor-last=Gilbert|editor-first=Jack Anthony|date=2010-07-28|title=Unlocking Short Read Sequencing for Metagenomics|url=https://dx.plos.org/10.1371/journal.pone.0011840|journal=PLoS ONE|volume=5|issue=7|pages=e11840|language=en|doi=10.1371/journal.pone.0011840|issn=1932-6203|pmid=20676378|pmc=PMC2911387}}</ref>。 これらのDNAシーケンシング技術は、サンガーシーケンスよりも短い配列を得られる。例えばサンガー法では750bp程度のリードを得られるのに対し、Ion Torrent PGM Systemや454パイロシーケンシングでは約400bp、Illumina MiSeqでは400-700bp、SOLiDは25-75bp程度である(2008年のカタログスペック値)<ref>{{Cite journal|last=Schuster|first=Stephan C|date=2008-01|title=Next-generation sequencing transforms today's biology|url=http://www.nature.com/articles/nmeth1156|journal=Nature Methods|volume=5|issue=1|pages=16–18|language=en|doi=10.1038/nmeth1156|issn=1548-7091}}</ref>。一方で、次世代シーケンシングでは圧倒的に多量のDNA配列を読むことができる。例えば454パイロシーケンスでは200〜500Mb、Illuminaプラットフォームでは20〜50Gbもの配列情報を排出し、この値は年々ますます増加している（2009年のカタログスペック値）<ref>{{Cite journal|date=2009-09|title=Metagenomics versus Moore's law|url=http://www.nature.com/articles/nmeth0909-623|journal=Nature Methods|volume=6|issue=9|pages=623–623|language=en|doi=10.1038/nmeth0909-623|issn=1548-7091}}</ref>。
+=== 新しい技術の活用 ===
+年にPacBio RS2が発売されたことを皮切りに、次世代シーケンサーよりも更に長いロングリードを読むことができる、いわゆる第3世代シーケンサーがPacBioやNanopore社から登場している。このような第3世代シーケンシングをメタゲノム解析に応用することで、さらに効率できなゲノムアセンブリが可能になると考えられる<ref>{{Cite journal|last=Hiraoka|first=Satoshi|last2=Yang|first2=Ching-chia|last3=Iwasaki|first3=Wataru|date=2016|title=Metagenomics and Bioinformatics in Microbial Ecology: Current Status and Beyond|url=https://www.jstage.jst.go.jp/article/jsme2/31/3/31_ME16024/_article|journal=Microbes and environments|volume=31|issue=3|pages=204–212|language=en|doi=10.1264/jsme2.ME16024|issn=1342-6311|pmid=27383682|pmc=PMC5017796}}</ref>。また、ショットガンシーケンスと染色体コンフォメーションキャプチャ法（Hi-C）を組み合わせることで、同じ細胞内で近接するDNA断片の情報を得ることができ、この情報を活用して微生物ゲノムのアセンブリを効率化する研究も報告されている<ref>{{Cite journal|last=Watson|first=Mick|last2=Roehe|first2=Rainer|last3=Walker|first3=Alan W.|last4=Dewhurst|first4=Richard J.|last5=Snelling|first5=Timothy J.|last6=Ivan Liachko|last7=Langford|first7=Kyle W.|last8=Press|first8=Maximilian O.|last9=Wiser|first9=Andrew H.|date=28 February 2018|title=Assembly of 913 microbial genomes from metagenomic sequencing of the cow rumen|journal=Nature Communications|volume=9|issue=1|pages=870|language=en|bibcode=2018NatCo...9..870S|DOI=10.1038/s41467-018-03317-6|ISSN=2041-1723|PMID=29491419|PMC=5830445}}</ref>。
+== バイオインフォマティクス解析 ==
+== データ解析 ==
+== 歴史と背景 ==
 従来のDNAシーケンスは、単一の細菌株を培養することが最初に必要であった。しかし初期のメタゲノミクスの研究により、多くの環境には培養が不可能でシーケンスが困難な微生物が多く存在することが明らかにされた。これらの初期の研究では[[16S rRNA系統解析|16S rRNA遺伝子配列]]を調べることに焦点が当てられた。この遺伝子配列は比較的短く、原核生物種内において保存性が高い一方で、異なる種間で変化が見られるため、ゲノム全体をシーケンスするよりも簡便に環境中の微生物群集を系統的に調べることが出来る。多くの環境サンプルに対して16S rRNA遺伝子配列のDNAシーケンスが実施され、その結果、培養されている既知の生物種には当てはまらない配列が多数見つかった。このことはすなわち、環境中には極めて多様な未培養系統群の微生物が存在していることを示している。このようにして16S rRNA遺伝子配列を培養を経ず環境中から直接得た研究により、培養を元にした方法で見つけられる試料中の[[真性細菌]]・[[古細菌]]は全体の1%に満たないことが論文で報告された<ref>Hugenholz, P; Goebel BM; Pace NR (1 September 1998). "Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity". ''J. Bacteriol'' '''180'''(18): 4765–74. PMC 107498.PMID 9733676</ref>。