GB 18030
维基百科,自由的百科全书
GB 18030,全称:国家标准GB 18030-2005《信息技术 中文编码字符集》,是中华人民共和国现时最新的内码字集,是GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》的修订版。与GB 2312-1980完全兼容,与GBK基本兼容,支持GB 13000及Unicode的全部统一汉字,共收录汉字70244个。
GB 18030主要有以下特点:
- 與 UTF-8 相同,采用多字节编码,每个字可以由1个、2个或4个字节组成。
- 编码空间庞大,最多可定义161万个字元。
- 支持中国国內少数民族的文字,不需要动用造字区。
- 汉字收录范围包含繁体汉字以及日韩汉字
本规格的初版是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施。此规格为在中国境内所有软件产品支持的强制规格。
目录 |
字节结构 [编辑]
- 单字节,其值从0到0x7F。
- 双字节,第一个字节的值从0x81到0xFE,第二个字节的值从0x40到0xFE(不包括0x7F)。
- 四字节,第一个字节的值从0x81到0xFE,第二个字节的值从0x30到0x39,第三个字节从0x81到0xFE,第四个字节从0x30到0x39。
版本 [编辑]
- GB 18030-2000,兼容 Unicode 3.0 中日韓統一表意文字,共收27533个汉字;2000年3月17日发布
- GB 18030-2005,更新至 Unicode 4.1 中日韓統一表意文字及增加少数民族文字,共有70244个汉字;2005年11月8日发布、2006年5月1日实施
参见 [编辑]
外部連結 [编辑]
- 新浪网:关于GB18030汉字编码标准集
- 新浪网:电脑汉字不够用 计算机也要“扫盲”
- http://source.icu-project.org/repos/icu/data/trunk/charset/data/xml/gb-18030-2000.xml
- ICU Converter Explorer: GB18030(英语)
- 微软有关GB18030编码的介绍(英语)
- 微软:老旧软体可能发生的兼容问題(英语)
- 微软 Win2000 GB18030 支持包
|
|||||||||||||||||||||||||||||||||||||||||||||||