基因銀行

维基百科,自由的百科全书
跳转至: 导航搜索
GenBank
内容
有機體 所有
相關信息
研究中心 NCBI
发布日期 1982年
访问入口
数据格式
网站 NCBI
下載地址 ncbi ftp
網絡服務地址
工具
Web BLAST
Standalone BLAST
其他
许可 Public domain-US Government

基因銀行GenBank)是一个开放获取序列数据库英语sequence database,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。

此数据库是国际协作核酸序列数据库英语International Nucleotide Sequence Database Collaboration(INSDC)的一部分,由美国国家生物技术信息中心(NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。

成立三十年来,GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库,其数据正被全球数以百万计的研究人员获取与引用。GenBank中的数据量正以每18个月翻一番的速度持续指數增長[1][2],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[3]

历史[编辑]

1979年,洛斯阿拉莫斯国家实验室(LANL)理论生物学和生物物理学小组Walter Goad英语Walter Goad等人建立了洛斯阿拉莫斯序列数据库,最终成为了公共的 GenBank数据库的前身[4]。1982年,由美国国立卫生研究院、美国国家科学基金会、美国能源部和国防部共同出资,LANL与BBN科技公司合作,成立了GenBank。到1983年底,已有超过2,000个序列被存储在GenBank。

在20世纪80年代中期,斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目[5]。作为最早的互联网生物信息学社区项目,GenBank计划为生物学家打造一个开放获取BIOSCI英语BIOSCI/Bionet消息社群。1989到1992年,GenBank被转移到新成立的美国国家生物技术信息中心[6]

Genbank和EMBL在1986/1987年出版的《核苷酸序列》I到VII卷

发展[编辑]

在GenBank的版本162.0(2007年8月)的发行说明英语release notes中道出:“从1982年到现在,GenBank中的碱基数每隔18个月翻一番。”[7]

截至2013年7月8日  (2013-07-08),GenBank的版本196.0已有165,740,164个基因座,152,599,230,112个碱基,165,740,164个报导序列[3]。 GenBank数据库还包括一些额外的数据集,不包括在这个统计内。

GenBank中碱基对数目的增长,1982到2007,半对数图英语Semi-log plot
GenBank中碱基数前二十的物种(版本 191)[8]
物种 碱基对
智人 Homo sapiens 16,310,774,187
小家鼠 Mus musculus 9,974,977,889
褐鼠 Rattus norvegicus 6,521,253,272
家牛 Bos taurus 5,386,258,455
玉米 Zea mays 5,062,731,057
野豬 Sus scrofa 4,887,861,860
斑馬魚 Danio rerio 3,120,857,462
紫色球海胆英语Strongylocentrotus purpuratus Strongylocentrotus purpuratus 1,435,236,534
普通獼猴 Macaca mulatta 1,256,203,101
水稻 Oryza sativa Japonica Group 1,255,686,573
红花烟草英语Nicotiana tabacum Nicotiana tabacum 1,197,357,811
非洲爪蟾 Xenopus (Silurana) tropicalis 1,249,938,611
黑腹果蝇 Drosophila melanogaster 1,119,965,220
黑猩猩 Pan troglodytes 1,008,323,292
拟南芥 Arabidopsis thaliana 1,144,226,616
家犬 Canis lupus familiaris 951,238,343
酿酒葡萄 Vitis vinifera 999,010,073
原雞 Gallus gallus 899,631,338
大豆 Glycine max 906,638,854
普通小麦 Triticum aestivum 898,689,329

另见[编辑]

参考文献[编辑]

  1. ^ Benson D, et al.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190. 
  2. ^ Benson D, et al.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867. 
  3. ^ 3.0 3.1 GenBank release notes. NCBI. 
  4. ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21. 
  5. ^ LANL GenBank History
  6. ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. doi:10.1093/nar/18.6.1517. PMC 330520. PMID 2326192. 
  7. ^ Benson, D. A.; Cavanaugh, M.; Clark, K.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W. GenBank. Nucleic Acids Research. 2012, 41 (Database issue): D36–D42. doi:10.1093/nar/gks1195. PMC 3531190. PMID 23193287.  编辑
  8. ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. 2011-01, 39 (Database issue): D32–37. doi:10.1093/nar/gkq1079. PMC 3013681. PMID 21071399. 


外部链接[编辑]