リード (生物学)

出典: フリー百科事典『ウィキペディア(Wikipedia)』

DNAシーケンシングにおいて、リード(read)とは、ある単一のDNA断片の全体または一部に対応する塩基対(または塩基対の確率)の推定配列である。典型的なシーケンシング実験では、ゲノムは数百万の分子に断片化されてから、サイズ選択およびアダプターとのライゲーションが行われる。この断片の集合はシーケンシングライブラリと呼ばれ、これを配列決定することでリードの集合が生成される [1]

リード長[編集]

生成されるリードの長さはシーケンシング技術によって異なる。長さ20〜40塩基対のリードは、超短鎖(ultra-short)と呼ばれる [2]。一般的なシーケンサーは、100〜500塩基対の範囲の長さのリードを生成する [3]。ただし、 Pacific Biosciencesの装置は約1500塩基対の長さのリードを生成する(2012年現在) [4]。リード長は生物学研究の結果に影響を与える可能性のある要因である [5]。たとえば、リード長が長いほど、 デノボ(de novo)ゲノムアセンブリの解像度や構造変異の検出が改善する。ヒトゲノムを定型的にデノボアセンブリするためには、10万塩基対を超えるリード長が必要になると推定されている [6]。シーケンシングデータを分析するためのバイオインフォマティクスのパイプラインは、通常、リード長を考慮している [7]

参考文献[編集]

  1. ^ Sequencing library: what is it?”. Breda Genetics (2016年8月12日). 2017年7月23日閲覧。
  2. ^ Chaisson, Mark J. (2009). “De novo fragment assembly with short mate-paired reads: Does the read length matter?”. Genome Research 19 (2): 336–346. doi:10.1101/gr.079053.108. PMC 2652199. PMID 19056694. http://genome.cshlp.org/content/19/2/336.full 2017年7月23日閲覧。. 
  3. ^ Junemann, Sebastian (2013). “Updating benchtop sequencing performance comparison”. Nature Biotechnology 31 (4): 294–296. doi:10.1038/nbt.2522. PMID 23563421. 
  4. ^ Quail, Michael A. (2012). “A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers”. BMC Genomics 13 (1): 341. doi:10.1186/1471-2164-13-341. PMC 3431227. PMID 22827831. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3431227/. 
  5. ^ Chhangawala, Sagar; Rudy, Gabe; Mason, Christopher E.; Rosenfeld, Jeffrey A. (23 June 2015). “The impact of read length on quantification of differentially expressed genes and splice junction detection”. Genome Biology 16 (1): 131. doi:10.1186/s13059-015-0697-y. PMC 4531809. PMID 26100517. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4531809/. 
  6. ^ Chaisson, Mark J.P. (2015). “Genetic variation and the de novo assembly of human genomes”. Nature Reviews Genetics 16 (11): 627–640. doi:10.1038/nrg3933. PMC 4745987. PMID 26442640. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4745987/. 
  7. ^ Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J. et al. (26 January 2016). “A survey of best practices for RNA-seq data analysis”. Genome Biology 17 (1): 13. doi:10.1186/s13059-016-0881-8. PMC 4728800. PMID 26813401. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4728800/.