蛋白质家族

维基百科,自由的百科全书
跳转至: 导航搜索
人类亲环蛋白英语Cyclophilin家族,其一些成员的异构酶结构域的结构表示。

蛋白质家族英语:Protein family)是一组与进化相关的蛋白质。在许多情况下,蛋白质家族具有相应的基因家族,其中每个基因编码具有1:1关系的相应蛋白质。蛋白质家族术语不应该与"科 (生物)"(英语:Family (biology))混淆,因为它("科 (生物)")用于生物分类学。

家族中的蛋白质来自共同的祖先(见同源),通常具有相似的三维结构,功能和显着的序列相似性。其中最重要的是序列相似性(通常是氨基酸序列),因为它是同源的最严格指标,因此是共同祖先的最清晰的指标。使用序列比对方法评估一组序列之间的相似性的重要性存在相当完善的框架。不共享共同祖先的蛋白质不太可能显示统计学上显着的序列相似性,使序列比对成为识别蛋白质家族成员的有力工具。

有时候,家族有时被分组成更大的演化支称为蛋白质超家族英语Protein superfamily,基于结构和机械相似性,即使没有可识别的序列同源性。

目前,已经定义了超过60,000个蛋白质家族[1],尽管蛋白质家族定义中的歧义导致不同的研究人员有数量的变化。

蛋白质家族资源[编辑]

有许多生物数据库记录蛋白质家族的例子,并允许用户识别新鉴定的蛋白质是否属于已知家族。 以下是几个例子:

  • Pfam - 蛋白家族数据库比对和HMMs

类似地,存在许多数据库搜索算法,例如:

  • BLAST - DNA序列相似性检索
  • BLASTp - 蛋白质序列相似性检索

参见[编辑]

参考文献[编辑]

  1. ^ Kunin, V.; Cases, I.; Enright, A. J.; De Lorenzo, V.; Ouzounis, C. A. Myriads of protein families, and still counting. Genome Biology. 2003, 4 (2): 401. PMC 151299. PMID 12620116. doi:10.1186/gb-2003-4-2-401.