基因本體

維基百科,自由的百科全書

基因本體論(Gene ontologyGO)是一種系統地對物種基因及其產物屬性進行注釋的方法和過程[1]。它的目標是:1)維護和發展有限的基因及其產物屬性描述的詞彙;2)注釋基因及其產物,同化和傳播注釋數據;3)提供方便的工具訪問數據;4)實現在實驗數據的基礎上,使用GO進行程式解析,例如基因富集組分分析。它主要包括三個分支:細胞組件、分子功能和生物過程。

基因本體論也是一個更大的系統分類項目的一部分,這個項目是開放生物醫學系統注釋(Open Biomedical Ontologies (OBO))[2]

與基因命名法不同,除了維護和控制發展基因及其產物性質描述的詞彙,基因本體論也致力於使用機器學習可以理解的標記語言來進行基因標註,這樣統一所有物種的基因注釋(而基因命名法注釋會根據不同的生物系統分類而有不同的注釋)。

隨着生物技術的發展越來越快,人們得到的數據越來越多。需要尋找一種方法來組織整理這些信息。基因本體論提供了一個省時省力的解決方案,基因產物在數據庫中被賦上GO的詞條,進而科學家們可以到數據庫中去查詢這些生物學的相關信息。基因本體是一個有向無環圖(DAG)型的本體。目前,GO中使用了is_a、part_of和regulates三種關係。

概念[編輯]

實際上,本體論是指對所知知識加以闡述的方法,對可勘察到的事物及其相互聯繫進行描述。在生物信息領域, 搜尋信息的一個主要的瓶頸就是, 生物學及相關學科的不同領域使用不同的術語,不僅讓信息查找變得困難,也使數據的交流和分享更加困難。例如在一些不同的醫療數據庫中,可能會存在很多不一致的描述,給數據的挖掘和分享帶來很多麻煩。基因本體論提供了統一定義的條目來表示基因產物的屬性。

基因本體的注釋主要立足於以下三個角度:

在基因注釋中的每個每個條目(GO term)會有

  • 一個條目名稱,通常是一個詞或着一串詞
  • 一個唯一的ID,通常由字母和數字組成
  • 一個引用源的定義
  • 一個命名域來指示所屬的域。

每個條目也會有同義名(synonyms),同義名所指示內容與該條目完全等同,能夠連接到其它相關數據庫。每個條目會有條目涵義以及使用的注釋。基因本體是一個有向無環圖(DAG)型的本體,每個條目都與其它的同域或者不同域的條目定義了關係。GO被設計成種屬中立的語言,能夠使用在包括原核生物、真核生物、單細胞生物和多細胞生物上。

GO不是靜止不變的,它是由一些研究和注釋社區以及與GO項目直接相關人士提出建議或請求來進行的添加、修正或改動的。例如,一個注釋者可能要求用某一個條目來表示一個代謝通路,或者在社區專家的幫助下可以修改注釋的某個部分。建議的修改通過GO的編輯評審後,會被整合到合適的地方。

GO注釋文件可以在GO官網[3]免費下載到,也可以使用GO browser AmiGO[4]網站來進行訪問使用。GO注釋文件有多種不同的格式。GO項目也提供向其它分類系統連接的圖的下載。

示例條目[編輯]
id: GO:0000016
name: lactase activity
namespace: molecular_function
def: "Catalysis of the reaction: lactose + H2O=D-glucose + D-galactose." [EC:3.2.1.108]
synonym: "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
synonym: "lactose galactohydrolase activity" EXACT [EC:3.2.1.108]
xref: EC:3.2.1.108
xref: MetaCyc:LACTASE-RXN
xref: Reactome:20536
is_a: GO:0004553 ! hydrolase activity, hydrolyzing O-glycosyl compounds
數據來源[5]

參見[編輯]

參考文獻[編輯]

  1. ^ The Gene Ontology project in 2008. Nucleic Acids Research. 2008-1, 36 (Database issue): D440–D444 [2018-08-06]. ISSN 0305-1048. PMC 2238979可免費查閱. PMID 17984083. doi:10.1093/nar/gkm883. (原始內容存檔於2022-03-24). 
  2. ^ Smith, Barry; Ashburner, Michael; Rosse, Cornelius; Bard, Jonathan; Bug, William; Ceusters, Werner; Goldberg, Louis J; Eilbeck, Karen; Ireland, Amelia. The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration. Nature biotechnology. 2007-11, 25 (11): 1251 [2018-08-06]. ISSN 1087-0156. PMC 2814061可免費查閱. PMID 17989687. doi:10.1038/nbt1346. (原始內容存檔於2020-06-23). 
  3. ^ Gene Ontology Consortium | Gene Ontology Consortium. www.geneontology.org. [2018-08-06]. (原始內容存檔於2014-11-26) (英語). 
  4. ^ Consortium, Gene Ontology. AmiGO 2: Welcome. amigo.geneontology.org. [2018-08-06]. (原始內容存檔於2020-12-18) (英語). 
  5. ^ 示例条目. (原始內容存檔於2015-10-06).