本页使用了标题或全文手工转换

码位

维基百科,自由的百科全书
跳转至: 导航搜索

字符编码术语中,码位或称编码位置[1],即英文的code point或code position,是组成码空间(或代码页)的数值[2]。 例如,ASCII码包含128个码位,范围是016进制到 7F16进制, 扩展ASCII码包含256个码位,范围是016进制到FF16进制, 而Unicode包含1,114,112个码位, 范围是016进制到10FFFF16进制. Unicode码空间划分为17个Unicode字符平面 (基本多文种平面, 16个辅助平面), 每个平面有65,536 (= 216) 个码位. 因此Unicode码空间总计是17 × 65,536 = 1,114,112.

定义[编辑]

码位的抽象意涵, 不同于下列概念:

  • 作为具体编码的比特流。例如,UTF-16编码的比特流,既可以是大尾序,也可以是小尾序。
  • 具有特定字形的字符. 因为字符集中的字符(码位)的具体外观随字型(font)——字体显示样式——的不同而变化。
  • 特定码空间的编码方式。例如,一个Unicode码空间的码位,可以用UTF-8编码;也可以用UTF-16编码。
  • 用不同字形显示一个字符.

参考[编辑]

  1. ^ GB 18030-2005《信息技术 中文编码字符集》中,既使用了码位,也用了编码位置。
  2. ^ Glossary of Unicode Terms