编码区

维基百科,自由的百科全书
跳转至: 导航搜索

基因的编码区英语Coding region),亦称为“编码序列”(Coding sequence)或“CDS”(Coding DNA Sequence),是指DNARNA中由外显子组成,编码蛋白质的部分。该区域的边界范围从靠近5′末端起始密码子开始,到靠近3′末端终止密码子为止。mRNA的编码区范围位于5′非翻译区和部分同样为外显子的3′非翻译区之间。[1]

某个生物体的编码区是指该生物由基因编码区组成的基因组的总和。[2]

编码序列注释[编辑]

虽然识别DNA序列内的开放阅读框简单明了,但识别编码序列却并非如此,因为细胞只会把所有开放阅读框的一部分翻译为蛋白质。[3]目前CDS预测通过对细胞mRNA取样测序完成,但要判断给定mRAN究竟哪一部分实际翻译为了蛋白质,目前仍是问题。CDS预测属于基因预测的一部分,后者不仅包括对编码蛋白质的DNA序列预测,也包括对其它功能元件,如RNA基因和调节序列的预测。

参见[编辑]

参考文献[编辑]

  1. ^ Twyman, Richard. Gene Structure. The Wellcome Trust. 1 August 2003 [6 April 2003]. 
  2. ^ Goto et al., Mami. Analysis of CpG Dinucleotide Frequency in Bacterial Genomes with Respect to Genomic Regions and Codon. The Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan. April 8, 2000 [6 April 2009]. 
  3. ^ Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi. CDS Annotation in Full-Length cDNA Sequence. Genome Research (Cold Spring Harbor Laboratory Press). September 2011, 21 (9): 1478–1487 [18 September 2011]. doi:10.1101/gr.1060303