泛基因組
泛基因組是為描述一個物種基因組而提出的概念,指同一細菌物種中所有菌株中所有基因的集合,而不單純以某個菌株為一個物種的全基因組。會需要使用泛基因組的原因是水平基因轉移造成不同菌株之間所擁有的基因相差甚大。
詞源
[編輯]泛基因組的英文是Pan-genome, Pan- 來自希臘語詞彙 παν,意思是「全部的」[3]。在1987年[4],細菌物種的概念是大於70%的DNA相關聯,並具有相同的表型性。但是隨着對大量細菌基因組測序的完成,這種概念區分方法變得模糊、不確定——測定同一物種的不同菌株,常會有新的基因出現。這個概念常被用於總體基因體學、演化生物學,應用的物種也有被延伸到植物或古菌。
泛基因組的組成部分
[編輯]泛基因組包含核心基因和附加基因。核心基因是所有個體都擁有的基因,附加基因則為非核心基因的基因[5][6]。在附加基因組中,若僅有一個個體具有該基因,則可稱之為獨特基因(英語:unique gene)。為了允許註解及基因序列組裝的錯誤,對核心基因組較為寬鬆的定義可稱之為軟核心基因(soft core gene),其定義為於 95%以上的個體具有此基因。[7]
核心
[編輯]是泛基因組的一部分,由測試集中的每個基因組共享。 一些作者將核心泛基因組劃分為硬核,那些至少有一個基因組(100%的基因組)共享該家族拷貝的同源基因家族和軟核或擴展核心[8], 那些分佈在上面的家族 一定的閾值(90%)。 在一項涉及蠟樣芽孢桿菌和金黃色葡萄球菌泛基因組的研究中,其中一些是從國際空間站分離出來的,用於分割泛基因組的閾值如下:「雲」、「殼」和「核心」對應於基因 分別存在於 <10%、10%到95%、 和 >95% 的基因組中的家族[9]。
核心基因組的大小和與泛基因組的比例取決於幾個因素,但它尤其取決於所考慮基因組的系統發育相似性。 例如,兩個相同基因組的核心也將是完整的泛基因組。 一個屬的核心總是比一個物種的核心基因組小。 屬於核心基因組的基因通常與譜系的管家功能和初級代謝有關,然而,核心基因也可以包含一些將該物種與該屬的其他物種區分開來的基因,即可能與生態位的致病性相關適應[10]。
殼
[編輯]是泛基因組中大多數基因組共享的泛基因組的一部分[11]。 沒有普遍接受的定義殼基因組的閾值,一些作者認為如果一個基因家族被泛基因組中超過 50% 的基因組共享,則該基因家族是殼泛基因組的一部分[12]。 一個家族可以通過幾種進化動力學成為殼的一部分,例如通過譜系中的基因丟失,它以前是核心基因組的一部分,例如放線菌屬中色氨酸操縱子中的酶[13], 或通過基因獲得和固定一個基因家族,該家族以前是可有可無的基因組的一部分,例如幾種棒狀桿菌屬物種中的 trpF 基因[14]。
雲
[編輯]雲基因組由泛基因組中基因組的最小子集共享的那些基因家族組成[15], 它包括單例或僅存在於一個基因組中的基因。 它也被稱為周邊基因組。 此類基因家族通常與生態適應有關[來源請求]。
分類
[編輯]各物種分有兩類泛基因組,分別為開放型泛基因組和閉合型泛基因組。閉合型泛基因組的物種隨着被定序的個體數量增加,泛基因組的大小增加有限,使得完整的泛基因組大小是在數學上可以預測的。相反地,開放型基因組的物種隨着定序的個體增加,其泛基因組的大小並未收斂。影響物種是為何種泛基因組,受到族群大小、水平基因轉移等影響。[6] [16]
歷史
[編輯]最早的泛基因組概念是由Tettelin等人在研究六株B型鏈球菌的菌株時提出的 [2],最主要的概念就是找出所有菌株共有的核心基因(約佔每隻菌株基因體的80%),以及非必須的附加基因(有可能只存在於一小部分的菌株中,或甚至只出現在單一菌株的基因體中),並透過核心基因與附加基因的組合來描述B型鏈球菌。外推法模型預測這隻細菌的基因庫會持續增長,且即使在加入數百隻細菌後,新的基因將會不斷加入,顯示這隻細菌的總基因庫相當龐大。[2]
範例
[編輯]原核生物泛基因組
[編輯]44株肺炎鏈球菌菌株的泛基因體分析與B型鏈球菌有着不同的特徵形態—雖然每這44株細菌的基因體都會貢獻新的基因給肺炎鏈球菌的基因庫,但是基因增長速度會隨着細菌數量的增加而明顯變慢。事實上,外推法預測在50隻細菌加入後,新基因的數量將會降到零。顯而易見的是這個特徵並非所有細菌共有的。對肺炎鏈球菌來說,新基因最主要的來源是和緩鏈球菌的水平基因轉移。肺炎鏈球菌的泛基因大小將會與菌株數量成對數級增加,而與新加入基因體的核苷酸多形位點數量形成線性關係,顯示年紀越大的菌株將會越有可能得到新基因。[17]
最後一個例子是原綠球藻的核心基因體與完整的泛基因體大小比對。[18] 在這個例子中,核心基因體明顯地比泛基因體小很多,而不同生態型的原綠球藻會有着不同的基因組合。另一篇2015年的研究也在從人類身上不同部位分離普雷沃氏菌屬,並重建泛基因體後,發現這隻細菌有着龐大基因庫,且屬於開放式泛基因組類型。[19]
古菌也有一些泛基因組研究。 鹽桿菌綱泛基因組(Halobacteria pangenome) 在泛基因組子集中顯示以下基因家族:核心 (300)、可變組件(軟核心:998、雲:36531、殼:11784)[20]。
真核生物泛基因組
[編輯]真菌、動物和植物等真核生物也顯示出泛基因組的證據。 在已研究泛基因組的四種真菌中,80%至90%的基因模型被發現為核心基因。 其餘輔助基因主要涉及發病機制和抗菌素耐藥性[21]。
軟件工具
[編輯]隨着越來越多人關注泛基因體學,有更多的軟件可以用來建立與分析泛基因體、繪圖、註解。[22] [22]
2014 年底最高引用數的的軟件為 [22]Panseq[23] 以及 pan-genome analysis pipeline(PGAP)[24]。其他的選擇包含 BPGA - A Pan-Genome Analysis Pipepline for prokaryotic genomes、GET_HOMOLOGUES、Roary 與 CD-HIT[25] GET_HOMOLOGUES (頁面存檔備份,存於互聯網檔案館) [26] or Roary (頁面存檔備份,存於互聯網檔案館).[27] 。針對各家軟件的比較,可以參照 2015 年的一篇文章。[22]
針對植物泛基因體的軟件有 GET-HOMOLOGUES-EST[28] 。有關植物泛基因體可以參照 2015 的一篇文章[29]。
參閱
[編輯]參考資料
[編輯]- ^ Eren AM, Kiefl E, Shaiber A, Veseli I, Miller SE, Schechter MS, et al. Community-led, integrated, reproducible multi-omics with anvi'o. Nature Microbiology. January 2021, 6 (1): 3–6. PMC 8116326 . PMID 33349678. doi:10.1038/s41564-020-00834-3.
- ^ 2.0 2.1 2.2 Tettelin, Hervé; Masignani, Vega; Cieslewicz, Michael J.; Donati, Claudio; Medini, Duccio; Ward, Naomi L.; Angiuoli, Samuel V.; Crabtree, Jonathan; Jones, Amanda L.; Durkin, A. Scott; DeBoy, Robert T. Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial "pan-genome". Proceedings of the National Academy of Sciences. 2005-09-27, 102 (39): 13950–13955. Bibcode:2005PNAS..10213950T. ISSN 0027-8424. PMC 1216834 . PMID 16172379. doi:10.1073/pnas.0506758102 (英語). 引用錯誤:帶有name屬性「Tettelin2005」的
<ref>
標籤用不同內容定義了多次 - ^ 存档副本. [2012-10-15]. (原始內容存檔於2021-01-21).
- ^ http://ijsb.sgmjournals.org/content/37/4/463.short[永久失效連結]
- ^ Medini, Duccio; Donati, Claudio; Tettelin, Hervé; Masignani, Vega; Rappuoli, Rino. The microbial pan-genome. Current Opinion in Genetics & Development. 2005, 15 (6): 589–594. PMID 16185861. doi:10.1016/j.gde.2005.09.006.
- ^ 6.0 6.1 Vernikos, George; Medini, Duccio; Riley, David R; Tettelin, Hervé. Ten years of pan-genome analyses. Current Opinion in Microbiology. 2015, 23: 148–154 [2019-02-16]. doi:10.1016/j.mib.2014.11.016. (原始內容存檔於2019-09-13).
- ^ Kaas RS, Friis C, Ussery DW, Aarestrup FM. Estimating variation within the genes and inferring the phylogeny of 186 sequenced diverse Escherichia coli genomes. BMC Genomics. October 2012, 13: 577. PMC 3575317 . PMID 23114024. doi:10.1186/1471-2164-13-577.
- ^ Halachev MR, Loman NJ, Pallen MJ. Calculating orthologs in bacteria and Archaea: a divide and conquer approach. PLOS ONE. 2011, 6 (12): e28388. Bibcode:2011PLoSO...628388H. PMC 3236195 . PMID 22174796. doi:10.1371/journal.pone.0028388 .
- ^ Blaustein RA, McFarland AG, Ben Maamar S, Lopez A, Castro-Wallace S, Hartmann EM. Pangenomic Approach To Understanding Microbial Adaptations within a Model Built Environment, the International Space Station, Relative to Human Hosts and Soil. mSystems. 2019, 4 (1): e00281–18. PMC 6325168 . PMID 30637341. doi:10.1128/mSystems.00281-18.
- ^ Mosquera-Rendón J, Rada-Bravo AM, Cárdenas-Brito S, Corredor M, Restrepo-Pineda E, Benítez-Páez A. Pangenome-wide and molecular evolution analyses of the Pseudomonas aeruginosa species. BMC Genomics. January 2016, 17 (45): 45. PMC 4710005 . PMID 26754847. doi:10.1186/s12864-016-2364-4.
- ^ Snipen L, Ussery DW. Standard operating procedure for computing pangenome trees. Standards in Genomic Sciences. January 2010, 2 (1): 135–41. PMC 3035256 . PMID 21304685. doi:10.4056/sigs.38923.
- ^ Sélem-Mojica N, Aguilar C, Gutiérrez-García K, Martínez-Guerrero CE, Barona-Gómez F. EvoMining reveals the origin and fate of natural product biosynthetic enzymes. Microbial Genomics. December 2019, 5 (12): e000260. PMC 6939163 . PMID 30946645. doi:10.1099/mgen.0.000260.
- ^ Juárez-Vázquez AL, Edirisinghe JN, Verduzco-Castro EA, Michalska K, Wu C, Noda-García L, et al. Evolution of substrate specificity in a retained enzyme driven by gene loss. eLife. March 2017, 6 (6): e22679. PMC 5404923 . PMID 28362260. doi:10.7554/eLife.22679.
- ^ Noda-García L, Camacho-Zarco AR, Medina-Ruíz S, Gaytán P, Carrillo-Tripp M, Fülöp V, Barona-Gómez F. Evolution of substrate specificity in a recipient's enzyme following horizontal gene transfer. Molecular Biology and Evolution. September 2013, 30 (9): 2024–34. PMID 23800623. doi:10.1093/molbev/mst115.
- ^ Vernikos GS. A Review of Pangenome Tools and Recent Studies. The Pangenome. 2020: 89–112. ISBN 978-3-030-38280-3. PMID 32633917. S2CID 219011507. doi:10.1007/978-3-030-38281-0_4.
- ^ McInerney, James O.; McNally, Alan; O'Connell, Mary J. Why prokaryotes have pangenomes. Nature Microbiology. 2017-03-28, 2 (4) [2019-02-16]. ISSN 2058-5276. doi:10.1038/nmicrobiol.2017.40. (原始內容存檔於2021-07-07) (英語).
- ^ 17.0 17.1 Donati, C; Hiller, N. L.; Tettelin, H; Muzzi, A; Croucher, N. J.; Angiuoli, S. V.; Oggioni, M; Dunning Hotopp, J. C.; Hu, F. Z.; Riley, D. R.; Covacci, A; Mitchell, T. J.; Bentley, S. D.; Kilian, M; Ehrlich, G. D.; Rappuoli, R; Moxon, E. R.; Masignani, V. Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species. Genome Biology. 2010, 11 (10): R107. PMC 3218663 . PMID 21034474. doi:10.1186/gb-2010-11-10-r107.
- ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, Chen F, Lapidus A, Ferriera S, Johnson J, Steglich C, Church GM, Richardson P, Chisholm SW. Patterns and Implications of Gene Gain and Loss in the Evolution of Prochlorococcus. PLoS Genetics. 2007, 3 (12): e231. ISSN 1553-7390. PMC 2151091 . PMID 18159947. doi:10.1371/journal.pgen.0030231.
- ^ Gupta VK, Chaudhari NM, Dutta C. Divergences in gene repertoire among the reference Prevotella genomes derived from distinct body sites of human. BMC Genomics. 2015, 16 (153). PMC 4359502 . PMID 25887946. doi:10.1186/s12864-015-1350-6.
- ^ Gaba S, Kumari A, Medema M, Kaushik R. Pan-genome analysis and ancestral state reconstruction of class halobacteria: probability of a new super-order. Scientific Reports. December 2020, 10 (1): 21205. Bibcode:2020NatSR..1021205G. PMC 7713125 . PMID 33273480. doi:10.1038/s41598-020-77723-6.
- ^ McCarthy CG, Fitzpatrick DA. Pan-genome analyses of model fungal species. Microbial Genomics. February 2019, 5 (2). PMC 6421352 . PMID 30714895. doi:10.1099/mgen.0.000243.
- ^ 22.0 22.1 22.2 22.3 Xiao, Jingfa; Zhang, Zhewen; Wu, Jiayan; Yu, Jun. A brief review of software tools for pangenomics. Genomics, Proteomics & Bioinformatics. 23 February 2015, 13 (1): 73–76 [2017-01-28]. doi:10.1016/j.gpb.2015.01.007. (原始內容存檔於2020-06-02).
- ^ Laing, Chad; Buchanan, Cody; Taboada, Eduardo; Zhang, Yongxiang; Kropinski, Andrew; Villegas, Andrea; Thomas, James; Gannon, Victor. Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions. BMC Bioinformatics. 15 September 2010, 11 (1): 461 [2017-01-28]. doi:10.1186/1471-2105-11-461. (原始內容存檔於2019-09-13).
- ^ Zhao, Yongbing; Wu, Jiayan; Yang, Junhui; Sun, Shixiang; Xiao, Jingfa; Yu, Jun. PGAP: pan-genomes analysis pipeline. Bioinformatics. 29 November 2011, 28 (3): 416–418 [2017-01-28]. PMC 3268234 . doi:10.1093/bioinformatics/btr655. (原始內容存檔於2019-09-13).
- ^ Chaudhari NM, Gupta VK, Dutta C. BPGA- an ultra-fast pan-genome analysis pipeline. Scientific Reports. 2016, 6 (24373). PMC 4829868 . PMID 27071527. doi:10.1038/srep24373.
- ^ Contreras-Moreira B, Vinuesa P. GET_HOMOLOGUES, a versatile software package for scalable and robust microbial pangenome analysis (PDF). Appl Environ Microbiol. October 2013, 79 (24): 7696–701 [2019-02-16]. PMC 3837814 . PMID 24096415. doi:10.1128/AEM.02411-13. (原始內容存檔 (PDF)於2017-08-18).
- ^ Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT, Fookes M, Falush D, Keane JA, Parkhill J. Roary: rapid large-scale prokaryote pan genome analysis. Bioinformatics. July 2015, 31 (22): 3691–3693. PMC 4817141 . PMID 26198102. doi:10.1093/bioinformatics/btv421.
- ^ Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, Casas AM, Vinuesa P. Analysis of Plant Pan-Genomes and Transcriptomes with GET_HOMOLOGUES-EST, a Clustering Solution for Sequences of the Same Species. Front. Plant Sci. February 2017, 8: 184. PMC 5306281 . PMID 28261241. doi:10.3389/fpls.2017.00184.
- ^ Golicz AA, Batley J, Edwards D. Towards plant pangenomics. Plant Biotechnol J. November 2015, 14 (4): 1099–1105. PMID 26593040. doi:10.1111/pbi.12499.