基因家族

維基百科,自由的百科全書
Mup基因家族的系統發生樹

基因家族(英語:Gene family),是來源於同一個祖先,由一個基因通過基因重複而產生兩個或更多的拷貝而構成的一組基因,它們在結構和功能上具有明顯的相似性,編碼相似的蛋白質產物。[1]一個這樣的家族是人類血紅蛋白亞基的基因,10個基因在不同染色體上的兩個簇中,稱為α-珠蛋白和β-珠蛋白基因座。這兩個基因簇被認為是由於前體基因在大約5億年前被複製而產生的[2]

基因根據共享的核苷酸蛋白質序列被分為家族。 系統發生技術可以用作更嚴格的測試。外顯子在編碼序列中的位置可用於推斷共同的祖先。 了解基因編碼的蛋白質序列可以讓研究人員應用方法來發現蛋白質序列之間的相似性,這些相似性提供的信息比DNA序列之間的相似性或差異性更多。

如果一個基因家族的基因編碼蛋白質,那麼術語蛋白質家族通常以與基因家族類似的方式使用。

基因家族沿特定譜系的擴展或收縮可能是偶然的,也可能是自然選擇的結果[3]。區分這兩種情況在實踐中往往很困難。 最近的工作使用統計模型和算法技術的組合來檢測受自然選擇影響的基因家族[4]

國際人類基因組組織(HUGO)人類基因組組織基因命名委員會英語HUGO Gene Nomenclature Committee(HGNC) 使用基因家族成員的「主幹」(或「根」)符號(通過同源性或功能)創建命名方案,並使用分層編號系統來區分各個成員[5][6]。 例如,對於過氧化物氧還酶(Peroxiredoxin)家族,PRDX 是根符號,家族成員為 PRDX1、PRDX2、PRDX3、PRDX4、PRDX5 和 PRDX6。

同一家族基因可以緊密排列在一起,形成一個基因簇,但多數時候,它們是分散在同一染色體的不同位置,或者存在於不同的染色體上的,各自具有不同的表達調控模式。

基本結構[編輯]

Gene phylogeny as lines within grey species phylogeny. Top: An ancestral gene duplication produces two paralogs (histone H1.1 and 1.2). A speciation event produces orthologs in the two daughter species (human and chimpanzee). Bottom: in a separate species (E. coli), an gene has a similar function (histone-like nucleoid-structuring protein) but has a separate evolutionary origin and so is an analog.

基因組組織的一個層次是將基因分組到幾個基因家族中[7][8]。 基因家族是共享共同祖先的相關基因組。 基因家族的成員可能是旁系同源物或直系同源物。 基因旁系同源物是同一物種中具有相似序列的基因,而基因直系同源物是不同物種中具有相似序列的基因。 基因家族在大小、序列多樣性和排列方面變化很大。 根據家族內基因的多樣性和功能,家族可分為多基因家族或超家族[7][9]

多基因家族通常由具有相似序列和功能的成員組成,儘管高度差異(在序列和/或功能水平上)不會導致基因從基因家族中移除。 家族中的單個基因可能在同一條染色體上緊密排列在一起,也可能分散在不同染色體上的整個基因組中。 由於它們序列的相似性和重疊功能,家族中的單個基因通常共享調控元件[7][9]。在某些情況下,基因成員具有相同(或幾乎相同)的序列。 這些家族允許根據需要在短時間內表達大量基因產物。 其他家族允許在不同細胞類型或生物體發育的不同階段表達相似但特定的產物[7]

超家族比單個多基因家族大得多。 超家族包含多達數百個基因,包括多個多基因家族以及單個基因成員。 大量的成員使得超家族可以廣泛分散,一些基因聚集在一起,一些基因分散得很遠。 這些基因在序列和功能上是多種多樣的,顯示出不同的表達水平和獨立的調節控制[7][9]

演化[編輯]

基因家族是基因組中信息存儲層次結構的一部分,在多細胞生物的演化和多樣性中發揮著重要作用。 基因家族是信息和遺傳變異的大單位[7]。 隨著演化時間的推移,基因家族隨著新基因家族的形成和一些基因家族的丟失而擴大和收縮。在幾個演化譜系中,基因以相對相同的速率獲得和丟失。 當自然選擇有利於額外的基因拷貝時,就會發生基因家族的適應性擴展。 當環境壓力源作用於一個物種時就是這種情況。 基因擴增在細菌中更為常見,是一個可逆過程。 基因家族的適應性收縮通常是由功能喪失突變的積累引起的。 過早停止基因轉錄的無義突變在種群中固定下來,導致基因丟失。 當環境的變化使基因變得多餘時,就會發生這個過程。

功能家族[編輯]

除了按演化(結構基因家族)分類外,人類基因組組織基因命名委員會英語HUGO Gene Nomenclature Committee(HGNC)還在其主幹命名法中按功能製作「基因家族」[10]。 因此,主幹也可以指具有相同功能的基因,通常是同一蛋白質複合體的一部分。 例如,BRCA1BRCA2 是不相關的基因,它們都是根據它們在乳腺癌中的作用而命名的,而 RPS2RPS3 是在同一小亞基中發現的不相關的核糖體蛋白

HGNC 還維護著一個「基因組」(以前稱為「基因家族」)分類。 一個基因可以是多個組的成員,所有組形成一個層次結構。 與主幹分類一樣,結構組和功能組都存在。

參見[編輯]

參考資料[編輯]

  1. ^ 朱玉賢等 《分子生物學》 高等教育出版社 ISBN 978-7-04-022214-2
  2. ^ Nussbaum, Robert L.; McInnes, Roderick R.; Willard, Huntington F. Thompson & Thompson Genetics in Medicine 8th. Philadelphia, PA: Elsevier. 2016: 25. ISBN 978-1-4377-0696-3. 
  3. ^ Hartl, D.L. and Clark A.G. 2007. Principles of population genetics. Chapter 7, page 372.
  4. ^ Demuth, Jeffery P.; Bie, Tijl De; Stajich, Jason E.; Cristianini, Nello; Hahn, Matthew W.; Borevitz, Justin. The Evolution of Mammalian Gene Families. PLOS ONE. 20 December 2006, 1 (1): e85. Bibcode:2006PLoSO...1...85D. PMC 1762380可免費查閱. PMID 17183716. doi:10.1371/journal.pone.0000085可免費查閱. 
  5. ^ Daugherty, LC; Seal, RL; Wright, MW; Bruford, EA. Gene family matters: expanding the HGNC resource.. Human Genomics. Jul 5, 2012, 6 (1): 4. PMC 3437568可免費查閱. PMID 23245209. doi:10.1186/1479-7364-6-4. 
  6. ^ HGNC. Gene group help. [2020-10-13]. (原始內容存檔於2023-06-01). 
  7. ^ 7.0 7.1 7.2 7.3 7.4 7.5 Hartwell, Leland H.; et al. Genetics : from genes to genomes 4th. New York: McGraw-Hill. 2011. ISBN 978-0073525266. 
  8. ^ Demuth, JP; Hahn, MW. The life and death of gene families.. BioEssays. January 2009, 31 (1): 29–39. PMID 19153999. S2CID 9528185. doi:10.1002/bies.080085. 
  9. ^ 9.0 9.1 9.2 Ohta, Tomoka. Gene families: multigene families and superfamilies. eLS. 2008. ISBN 978-0470015902. doi:10.1038/npg.els.0005126. 
  10. ^ What is a stem symbol?. HGNC FAQ. [2023-05-20]. (原始內容存檔於2023-05-20).