基因組

維基百科,自由的百科全書
跳到: 導覽搜尋
由46條染色體組成一個人類男性的二倍體基因組的圖像。 (在線粒體染色體不顯示。)

生物學中,一個生物體的基因組是指包含在該生物的DNA(部分病毒是RNA)中的全部遺傳信息,又稱基因體(genome)。基因組包括基因非編碼DNA。1920年,德國漢堡大學植物學教授漢斯·溫克勒(Hans Winkler)首次使用基因組這一名詞。

更精確地講,一個生物體的基因組是指一套染色體中的完整的DNA序列。例如,生物個體體細胞中的二倍體由兩套染色體組成,其中一套DNA序列就是一個基因組。基因組一詞可以特指整套DNA(例如,核基因組),也可以用於包含自己DNA序列的細胞器基因組,如粒線體基因組或葉綠體基因組。當人們說一個有性生殖物種的基因組正在測序時,通常是指測定一套常染色體和兩種性染色體的序列,這樣來代表可能的兩種性別。即使在只有一種性別的物種中,「一套基因組序列」可能也綜合了來自不同個體的染色體。通常使用中,「遺傳組成」一詞有時在交流中即指某特定個體或物種的基因組。對相關物種全部基因組性質的研究通常被稱為基因組學,該學科與遺傳學不同,後者一般研究單個或一組基因的性質。

基因組的種類[編輯]

大部分生物體比病毒複雜,除了染色體,有時或總是包含額外的遺傳物質。某些情況下,比如對致病微生物的基因組測序,這裏基因組就包含了在質體中的遺傳物質。在這種情況下基因組就包含了所有的基因和非編碼DNA。

而對於像人類這樣的脊椎動物,基因組通常指的只是染色體DNA。因此,儘管人類線粒體裏包含了基因,但這些基因並不作為基因組的一部分。事實上,有時候稱線粒體擁有自己的基因組,通常叫做線粒體基因組

基因組和遺傳變異[編輯]

必須指出僅有一個基因組並不能獲得物種的遺傳差異或遺傳多態性。例如,原則上講,人類基因組序列可以僅僅從某個個體的一個細胞的一半DNA中測定。要知道是哪些DNA變異導致特定性狀或疾病則需要進行個體間比較。這一點也解釋了通常使用「基因組」(與通常使用「基因」相提並論)不僅僅指某特定DNA序列,也指某物種整個家族的序列。

儘管這個概念看上去與直覺相牴觸,其實這與說沒有任何一個特定的形狀是印度豹的形狀是相同的概念。印度豹形狀各異,它們的基因組序列也並不相同。然而各動物個體和它們的序列都有共性,因此可以從單一實例中來了解印度豹和「豹性」。

測序與作圖[編輯]

在1976年,比利時根特大學瓦爾特·菲爾斯英語Walter Fiers第一個完成了一個基因組的完整測序——RNA病毒噬菌體MS2英語Bacteriophage MS2的基因組。次年,弗雷德里克·桑格完成了Φ-X174噬菌體英語Phi X 174的測序,這是第一個完成測序的DNA基因組,全基因組只有5386個鹼基對[1]。在20世紀90年代中期,生物三域的第一個全基因組測序在很短一段時間內陸續完成。第一個被測序的細菌基因組是流感嗜血桿菌(Haemophilus influenzae),由The Institute for Genomic Research團隊於1995年完成。幾個月以後,第一個真核生物基因組的測序也由歐洲科學家完成了。它是一種帶有16個染色體的芽殖酵母——釀酒酵母(Saccharomyces cerevisiae),其測序工作開始於80年代中期。很快地在1996年,第一個古菌基因組——詹氏甲烷球菌英語Methanocaldococcus jannaschii(Methanococcus jannaschii)基因組也被測序,同樣由The Institute for Genomic Research團隊完成。

新技術的發展使得測序成本快速地下降,測序耗時也顯著減少,完成全基因組測序的生物越來越多。其他基因組計劃包括小鼠水稻擬南芥河豚和細菌(如大腸桿菌)等皆被完成測序。1990年啟動的人類基因組計劃旨在對人類基因組繪製物理圖譜測序[2][3]

新的測序技術,如大規模並行測序英語massive parallel sequencing也開闢了個人基因組測序作為一種診斷工具的前景。其中標誌性的一步是2007年完成了對DNA雙螺旋結構的發現者之一詹姆斯·杜威·沃森個人的基因組的測序[4]。而測序費用也一直在降低,可能最終測序單個基因組只需要幾千美元

基因組構成[編輯]

提交到GenBank中的各物種的基因組大小與已注釋的蛋白質總數對比的雙對數坐標圖[5],藍色:病毒基因組、紅色:原核基因組、綠色:真核基因組

「基因組構成」(Genome composition)用於描述成一個單倍體基因組的組成,包括基因組大小非重複DNA重複DNA所佔的比重等。通過不同基因組間的比較研究,科學家可以更好地理解給定基因組的進化史。

當討論基因組的構成時,首先要區別的是原核基因組還是真核基因組,兩者在基因組組成上有很大的不同。在原核生物中,基因組的大部分(85-90%)都是非重複DNA,這意味着其中主要的都是編碼DNA,非編碼區域只佔了一小部分[6]。與之相反,真核生物的蛋白質編碼基因有着外顯子-內含子的結構特點,而且存在大量豐富的重複DNA序列。特別是哺乳動物和植物中,基因組的大部分都由重複DNA構成[7]

大部分的生物體常常攜帶除位於染色體之外的遺傳物質,在有的情況下,例如對致病微生物的基因組測序,「基因組」就包括了位於質體的額外的遺傳物質。在這種情況下,「基因組」描述的是所有基因以及有潛在功能的非編碼DNA。

真核生物例如植物、原生生物和動物中,基因組含有特指位於染色體DNA上的信息的意思。所以,即使這些生物含有葉綠體或者線粒體,它們有自己的DNA,但這些DNA所攜帶的信息不被包括在基因組中,事實上,有時我們說線粒體含有自己的基因組,即「線粒體基因組」,而在葉綠體中的被稱為「葉綠體基因組英語Chloroplast DNA」。

基因組大小[編輯]

基因組大小是指一種生物單倍體基因組的全部DNA鹼基對數。在原核生物和低等真核生物中,基因組大小與生物形態的複雜性基本呈正相關關係;但是在軟體動物以及其它更高等的真核生物中,這種相關性就不存在了[7][8]。這一現象可能是由基因組中的重複DNA引起。

鑑於基因組如此複雜,一種研究策略就是使生物體在理論上可以生存的條件下減少基因組中的基因數目直至最小。對於單細胞生物和多細胞生物最小基因組的實驗研究已經開展(見發育生物學),這些工作在體內in vivo)和體外in silico)進行[9][10]

這裏列出了一些重要的或有代表性的基因組的大小,更多基因組大小的請見#參見

類型 生物 學名 基因組大小(鹼基對
病毒 豬圓環病毒I型 1,759 已知最小的基因組[11]
病毒 猿猴病毒SV40 5,224 [12]
病毒 噬菌體Φ-X174 5,386 最早完成測序的DNA基因組[13]
病毒 人類免疫缺陷病毒HIV 9,749 [14]
病毒 噬菌體λ 48,502 常作為重組DNA的克隆載體。[15][16][17]
細菌 大腸桿菌 Escherichia coli 4.6Mb [18]
變形蟲 無恆變形蟲 Amoeba dubia 670Gb 已知的最大基因組[19](但有爭議)[20]
植物 貝母屬一種 Fritillary assyriaca 130Gb
真菌 釀酒酵母 Saccharomyces cerevisiae 12.1Mb 第一個測序的真核生物基因組,完成於1996年[21]
線蟲 咖啡短體線蟲 Pratylenchus coffeae 20Mb 已知最小的動物基因組[22]
線蟲 秀麗隱桿線蟲 Caenorhabditis elegans 100Mb 第一個測序的多細胞生物基因組,完成於1998年12月[23]
昆蟲 黑腹果蠅 Drosophila melanogaster 130Mb [24]
哺乳動物 小家鼠 Mus musculus 2.7Gb [25]
哺乳動物 Homo sapiens 3.2Gb [26][27]
魚類 金娃娃(一種河豚 Tetraodon nigroviridis 385Mb 已知最小的脊椎動物基因組約為340Mb[28][29]-385Mb[30]
魚類 石花肺魚 Protopterus aethiopicus 130Gb 已知最大的脊椎動物基因組

非重複DNA[編輯]

非重複DNA的總長除以基因組大小即為非重複DNA比重。蛋白質編碼基因和非編碼RNA基因一般都是非重複的DNA[31]。而更大的基因組並不意味着更多的基因,隨着高等真核生物的基因組大小的增加,非重複DNA的比重相應減少[7]

不同生物中的非重複DNA的比重會有很大不同,一些原核生物如大腸桿菌幾乎只有非重複DNA,低等真核生物比如秀麗隱桿線蟲黑腹果蠅的非重複DNA仍比重複DNA多[7][32],而更高等的真核生物的重複DNA比重超過了非重複DNA。在一些植物和兩棲動物中,非重複DNA的比重不超過20%,成了基因組中的少數組分[7]

重複DNA[編輯]

基因組中的重複DNA可大致分為兩類:串聯重複和散在重複[33]

串聯重複[編輯]

串聯重複常由複製時的滑移英語Replication slippage不等位的交換英語Unequal crossing over基因轉換英語gene conversion引起[34]微衛星衛星DNA是基因組中的串聯重複序列[35]雖然串聯重複序列在基因組中起很大作用,但是在哺乳動物基因組中卻表現為散在重複序列。

散在重複[編輯]

散在重複通常來自轉座子的反轉錄轉座,但也包括蛋白質編碼的基因家族與假基因。轉座子是一類DNA序列,它們能夠在基因組中通過轉錄或逆轉錄,在內切酶的作用下,在其他基因座上出現[6][36],被認為是高等真核生物的進化驅動力之一[37]。轉座子可分為兩大類:I型轉座子(反轉錄轉座子)和II型轉座子(DNA轉座子)[36]

基因組演化[編輯]

基因組不僅僅是是生物基因的集合,對其研究和比較能獲得生物演化信息的更多細節。一些基因組性質如「染色體數」(核型)、基因組大小、基因順序、密碼子偏好性英語codon usage biasGC含量能反映出現存生物的許多基因組演化信息。

基因複製在基因組形成過程中起重要作用。真核生物的基因組存在大量重複序列。按照不同重複頻率,可分為高度重複序列、中度重複序列、低度重複序列。這些重複序列是生物多樣性的基礎。

基因水平轉移常常用來解釋親緣關係很遠的生物之間為什麼會有很相近的基因。基因水平轉移在微生物之間比較常見。另外,真核生物的核基因組中也有些從葉綠體線粒體轉移來的基因。

基因組的次領域[編輯]

參考文獻[編輯]

引用[編輯]

  1. ^ [1]
  2. ^ What's a Genome?. Genomenewsnetwork.org. 2003-01-15 [27 January 2011]. 
  3. ^ NCBI_user_services. Mapping Factsheet. 2004-03-29 [27 January 2011]. 
  4. ^ Wade, Nicholas. Genome of DNA Pioneer Is Deciphered. The New York Times. 2007-05-31 [2 April 2010]. 
  5. ^ Koonin, Eugene V. The Logic of Chance: The Nature and Origin of Biological Evolution. FT Press. 2011-08-31. ISBN 9780132542494. 
  6. ^ 6.0 6.1 Koonin, Eugene V.; Wolf, Yuri I. Constraints and plasticity in genome and molecular-phenome evolution. Nature Reviews Genetics. 2010, 11 (7): 487–498. PMC 3273317. PMID 20548290. doi:10.1038/nrg2810. 
  7. ^ 7.0 7.1 7.2 7.3 7.4 Lewin, Benjamin. Genes VIII 8th. Upper Saddle River, NJ: Pearson/Prentice Hall. 2004. ISBN 0-13-143981-2. 
  8. ^ Gregory TR, Nicol JA, Tamm H, Kullman B, Kullman K, Leitch IJ, Murray BG, Kapraun DF, Greilhuber J, Bennett MD. Eukaryotic genome size databases. Nucleic Acids Research. 3 January 2007, 35 (Database): D332–D338. doi:10.1093/nar/gkl828. 
  9. ^ Glass JI, Assad-Garcia N, Alperovich N, Yooseph S, Lewis MR, Maruf M, Hutchison CA 3rd, Smith HO, Venter JC; Assad-Garcia; Alperovich; Yooseph; Lewis; Maruf; Hutchison; Smith; Venter. Essential genes of a minimal bacterium. Proc Natl Acad Sci USA. 2006, 103 (2): 425–30. Bibcode:2006PNAS..103..425G. PMC 1324956. PMID 16407165. doi:10.1073/pnas.0510013103. 
  10. ^ Forster AC, Church GM. Towards synthesis of a minimal cell. Mol Syst Biol. 2006, 2 (1): 45. PMC 1681520. PMID 16924266. doi:10.1038/msb4100090. 
  11. ^ Mankertz P. Molecular Biology of Porcine Circoviruses. Animal Viruses: Molecular Biology. Caister Academic Press. 2008. ISBN 978-1-904455-22-6. 
  12. ^ Fiers, W.; Contreras, R.; Haegeman, G.; Rogiers, R.; Van De Voorde, A.; Van Heuverswyn, H.; Van Herreweghe, J.; Volckaert, G.; Ysebaert, M. Complete nucleotide sequence of SV40 DNA. Nature. 1978, 273 (5658): 113–120. Bibcode:1978Natur.273..113F. PMID 205802. doi:10.1038/273113a0. 
  13. ^ Sanger, F.; Air, G.M.; Barrell, B.G.; Brown, N.L.; Coulson, A.R.; Fiddes, J.C.; Hutchison, C.A.; Slocombe, P. M.; Smith, M. Nucleotide sequence of bacteriophage phi X174 DNA. Nature. 1977, 265 (5596): 687–695. Bibcode:1977Natur.265..687S. PMID 870828. doi:10.1038/265687a0. 
  14. ^ Virology - Human Immunodeficiency Virus And Aids, Structure: The Genome And Proteins Of HIV. Pathmicro.med.sc.edu. 2010-07-01 [27 January 2011]. 
  15. ^ Thomason, Lynn; Court, Donald L.; Bubunenko, Mikail; Costantino, Nina; Wilson, Helen; Datta, Simanti; Oppenheim, Amos. Recombineering: genetic engineering in bacteria using homologous recombination. Current Protocols in Molecular Biology. 2007,. Chapter 1: Unit 1.16. ISBN 0471142727. PMID 18265390. doi:10.1002/0471142727.mb0116s78. 
  16. ^ Court, D. L.; Oppenheim, A. B.; Adhya, S. L. A new look at bacteriophage lambda genetic networks. Journal of Bacteriology. 2007, 189 (2): 298–304. PMC 1797383. PMID 17085553. doi:10.1128/JB.01215-06. 
  17. ^ Sanger, F.; Coulson, A.R.; Hong, G.F.; Hill, D.F.; Petersen, G.B. Nucleotide sequence of bacteriophage lambda DNA. Journal of Molecular Biology. 1982, 162 (4): 729–73. PMID 6221115. doi:10.1016/0022-2836(82)90546-0. 
  18. ^ Frederick R. Blattner, Guy Plunkett III; 等. The Complete Genome Sequence of Escherichia coli K-12. Science. 1997, 277 (5331): 1453–1462. PMID 9278503. doi:10.1126/science.277.5331.1453. 
  19. ^ Parfrey LW, Lahr DJG, Katz LA. The Dynamic Nature of Eukaryotic Genomes. Molecular Biology and Evolution. 2008, 25 (4): 787–94. PMC 2933061. PMID 18258610. doi:10.1093/molbev/msn032. 
  20. ^ ScienceShot: Biggest Genome Ever 互聯網檔案館存檔,存檔日期2010-10-11., comments: "The measurement for Amoeba dubia and other protozoa which have been reported to have very large genomes were made in the 1960s using a rough biochemical approach which is now considered to be an unreliable method for accurate genome size determinations."
  21. ^ Saccharomyces Genome Database. Yeastgenome.org. [27 January 2011]. 
  22. ^ Gregory TR. Animal Genome Size Database. http://www.genomesize.com. 2005.  外部連結存在於|publisher= (幫助)
  23. ^ The C. elegans Sequencing Consortium. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science. 1998, 282 (5396): 2012–2018. PMID 9851916. doi:10.1126/science.282.5396.2012. 
  24. ^ Adams MD, Celniker SE, Holt RA; 等. The genome sequence of Drosophila melanogaster. Science. 2000, 287 (5461): 2185–95 [25 May 2007]. Bibcode:2000Sci...287.2185.. PMID 10731132. doi:10.1126/science.287.5461.2185. 
  25. ^ Church, DM; Goodstadt, L; Hillier, LW; Zody, MC; Goldstein, S; She, X; Bult, CJ; Agarwala, R; Cherry, JL; DiCuccio, M; Hlavina, W; Kapustin, Y; Meric, P; Maglott, D; Birtle, Z; Marques, AC; Graves, T; Zhou, S; Teague, B; Potamousis, K; Churas, C; Place, M; Herschleb, J; Runnheim, R; Forrest, D; Amos-Landgraf, J; Schwartz, DC; Cheng, Z; Lindblad-Toh, K; Eichler, EE; Ponting, CP; Mouse Genome Sequencing, Consortium. Roberts, Richard J, 編. Lineage-specific biology revealed by a finished genome assembly of the mouse. PLoS Biology. May 5, 2009, 7 (5): e1000112. PMC 2680341. PMID 19468303. doi:10.1371/journal.pbio.1000112. 
  26. ^ Human Genome Project Information Site Has Been Updated. Ornl.gov. 2013-07-23 [6 February 2014]. 
  27. ^ Venter, J. C.; Adams, M.; Myers, E.; Li, P.; Mural, R.; Sutton, G.; Smith, H.; Yandell, M.; Evans, C.; Holt, R. A.; Gocayne, J. D.; Amanatides, P.; Ballew, R. M.; Huson, D. H.; Wortman, J. R.; Zhang, Q.; Kodira, C. D.; Zheng, X. H.; Chen, L.; Skupski, M.; Subramanian, G.; Thomas, P. D.; Zhang, J.; Gabor Miklos, G. L.; Nelson, C.; Broder, S.; Clark, A. G.; Nadeau, J.; McKusick, V. A.; Zinder, N. The Sequence of the Human Genome. Science. 2001, 291 (5507): 1304–1351. Bibcode:2001Sci...291.1304V. PMID 11181995. doi:10.1126/science.1058040.  編輯
  28. ^ Crollius, HR; Jaillon, O; Dasilva, C; Ozouf-Costaz, C; Fizames, C; Fischer, C; Bouneau, L; Billault, A; Quetier, F; Saurin, W; Bernot, A; Weissenbach, J. Characterization and Repeat Analysis of the Compact Genome of the Freshwater Pufferfish Tetraodon nigroviridis. Genome Research. 2000, 10 (7): 939–949. PMC 310905. PMID 10899143. doi:10.1101/gr.10.7.939. 
  29. ^ Olivier Jaillon; 等. Genome duplication in the teleost fish Tetraodon nigroviridis reveals the early vertebrate proto-karyotype. Nature. 21 October 2004, 431 (7011): 946–957. Bibcode:2004Natur.431..946J. PMID 15496914. doi:10.1038/nature03025. 
  30. ^ Tetraodon Project Information. [17 October 2012]. 
  31. ^ Britten, RJ; Davidson, EH. Repetitive and non-repetitive DNA sequences and a speculation on the origins of evolutionary novelty. The Quarterly review of biology. June 1971, 46 (2): 111–38. PMID 5160087. doi:10.1086/406830. 
  32. ^ Naclerio, G; Cangiano, G, Coulson, A, Levitt, A, Ruvolo, V, La Volpe, A. Molecular and genomic organization of clusters of repetitive DNA sequences in Caenorhabditis elegans. Journal of Molecular Biology. 1992-07-05, 226 (1): 159–68. PMID 1619649. doi:10.1016/0022-2836(92)90131-3. 
  33. ^ Stojanovic, edited by Nikola. Computational genomics : current methods. Wymondham: Horizon Bioscience. 2007. ISBN 1-904933-30-0. 
  34. ^ Li, YC; Korol, AB, Fahima, T, Beiles, A, Nevo, E. Microsatellites: genomic distribution, putative functions and mutational mechanisms: a review. Molecular ecology. December 2002, 11 (12): 2453–65. PMID 12453231. doi:10.1046/j.1365-294X.2002.01643.x. 
  35. ^ Schlötterer, C. Microsatellite analysis indicates genetic differentiation of the neo-sex chromosomes in Drosophila americana americana. Heredity. December 2000, 85 (Pt 6): 610–6. PMID 11240628. doi:10.1046/j.1365-2540.2000.00797.x. 
  36. ^ 36.0 36.1 Wessler, S. R. Eukaryotic Transposable Elements and Genome Evolution Special Feature: Transposable elements and the evolution of eukaryotic genomes. Proceedings of the National Academy of Sciences. 13 November 2006, 103 (47): 17600–17601. Bibcode:2006PNAS..10317600W. doi:10.1073/pnas.0607612103. 
  37. ^ Kazazian, H. H. Mobile Elements: Drivers of Genome Evolution. Science. 12 March 2004, 303 (5664): 1626–1632. Bibcode:2004Sci...303.1626K. PMID 15016989. doi:10.1126/science.1089670. 

書目[編輯]

  • Benfey, P and Protopapas, AD (2004). Essentials of Genomics. Prentice Hall.
  • Brown, TA (2002). Genomes 2. Bios Scientific Publishers.
  • Gibson, G and Muse, SV (2004). A Primer of Genome Science (Second Edition). Sinauer Assoc.
  • Gregory, TR (ed.) (2005). The Evolution of the Genome. Elsevier.
  • Reece, RJ (2004). Analysis of Genes and Genomes. John Wiley & Sons.
  • Saccone, C and Pesole, G (2003). Handbook of Comparative Genomics. John Wiley & Sons.

外部連結[編輯]

參見[編輯]