国家标准代码

维基百科,自由的百科全书
跳转至: 导航搜索

国家标准代码,简称国标码,是中华人民共和国的中文常用汉字编码集,亦为新加坡采用。

目前中华人民共和国官方强制使用GB 18030-2005标准,但GB 2312-80仍然在部分领域被使用。

强制标准冠以“GB”。推荐标准冠以“GB/T”。

常见国家标准代码列表[编辑]

  • GB 2312-80《信息交换用汉字编码字符集 基本集》(又称 GB 或 GB0)
  • GB 13000.1-93《信息技术 通用多八位编码字符集(UCS)第一部分》(相当于 ISO 10646-1:1993 中文版)
  • GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》
  • GB 18030-2005《信息技术 中文编码字符集》

其他中华人民共和国发布有关汉字标准代码列表:

  • GB/T 12345 - 90《信息交换用汉字编码字符集 第一辅助集》(又称 GB1)
  • GB/T 7589 - 87《信息交换用汉字编码字符集 第二辅助集》(又称 GB2)
  • GB 13131 - 91《信息交换用汉字编码字符集 第三辅助集》(又称 GB3)
  • GB/T 7590 - 87《信息交换用汉字编码字符集 第四辅助集》(又称 GB4)
  • GB 13132 - 91《信息交换用汉字编码字符集 第五辅助集》(又称 GB5)
  • GB/T 16500 - 1998《信息交换用汉字编码字符集 第七辅助集》

由於 GB 2312-80 只收录了6763个汉字,未能覆盖繁体中文字、部分人名、方言、古汉语等方面出现的罕用字,所以发布了以上的辅助集。

其中,GB/T 12345-90辅助集是GB 2312-80基本集的繁体字版本;GB 13131-91是GB/T 7589-87的繁体字版本;GB 13132-91是GB/T 7590-87的繁体字版本。而GB/T 16500-1998是繁体字版本,并无对应的简体字版本。

鉴於第二辅助集及第四辅助集,有不少汉字均是“类推简化汉字”,实用性不高,因而较少人采用,而且沒有收入通用字符集ISO/IEC 10646 標準[1]

中华人民共和国国家标准总局于2000年推出强制性的GB 18030-2000标准。於2001年8月31日后发布或出厂的产品,必须符合GB 18030-2000的相关要求。这个标准的最新版本是GB 18030-2005,它的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充0x8139EE39--0x82358738部分为强制性。

相關標準列表(按首次出版時間排列)[编辑]

標準號 名稱 別名 漢字數 備注
GB 2312-80 信息交换用汉字编码字符集 基本集 GB / GB0 6763 GB 6345.1-86 等字模集有附錄對 GB 2312-80 之修訂,但 GB 2312 本身一直未有更新,詳見 GB 2312 條目
GB/T 7589-87 信息交换用汉字编码字符集 第二辅助集 GB2 7237 向 ISO 10646 提交時使用繁體字版本
GB/T 7590-87 信息交换用汉字编码字符集 第四辅助集 GB4 7039 向 ISO 10646 提交時使用繁體字版本
GB 8565.2-88 信息处理文本通讯用编码字符集 第二部分 (無)[2] 636 主要用於電訊;GB2漢字520個、GB4漢字92個、來自《第一批異體字整理表》之異體字23個及“啰”字。此字符集補充了 GB 2312,使之能包括整個《现代汉语通用字表
GB/T 12345-90 信息交换用汉字编码字符集 第一辅助集 GB1 6866 GB 2312 繁體版,增補103字
GB 13131-91 信息交换用汉字编码字符集 第三辅助集 GB3 7237 GB/T 7589 繁體版
GB 13132-91 信息交换用汉字编码字符集 第五辅助集 GB5 7039 GB/T 7590 繁體版
ISO-IR-165 通訊用中文多位元組字符集 (無) 8464[3] 集合 GB 2312-80(包括 GB 6345.1-86 新增之字符及調整)及 GB 8565.2-88
GB 13000.1-93 信息技术 通用多八位编码字符集(UCS)第一部分 (無) 20902 另有302個兼容漢字(當中十二個:U+FA0E, U+FA0F, U+FA11, U+FA13, U+FA14, U+FA1F, U+FA21, U+FA23, U+FA24, U+FA27, U+FA28 及 U+FA29 有獨立形音義,統一碼聯盟建議不要視之為兼容漢字)
GBK 汉字扩展内码规范[4] (無) 21003 除了來自 ISO 10646-1 / GB 13000.1 之20902字,另有 ISO 10646-1 / GB 13000.1 中21個兼容漢字(包括上述十二個有獨立形音義兼容字),以方便和 Big5CNS11643JISIBM 文件雙向轉換[4]、未收入 ISO 10646 的《簡化字總表》漢字52個、《康熙字典》及《辭海漢字部件28個;後80字暫時對應 Unicode 編碼之私人使用區(Private Use Area),新版 Unicode 已全部收納。Microsoft Code Page 936 收入21個兼容漢字[5][6],未收後80字
GB/T 15564-1995 图文电视广播用汉字编码字符集 香港子集 (無) 111 所有字皆來自 GB 13000.1
GB/T 16500-1998 信息交换用汉字编码字符集 第七辅助集 (無)[7] 3778 其他 GB 未收錄之 GB13000.1 漢字
GB 18030-2005 信息技术 中文编码字符集 (無)[8] 70244 首版本 GB 18030-2000

参看[编辑]

注釋[编辑]

  1. ^ ISO 10646 收錄的是其非簡化形式(unsimplified forms),見中日韓統一表意文字#字源
  2. ^ 向 ISO 10646 提交漢字時稱為 G8
  3. ^ 一說8443(Ken Lunde, CJKV Information Processing, 1999, O'Reilly & Associates, Inc., P.82)
  4. ^ 4.0 4.1 簡體中文版 Windows 95 “GBK 内码输入法”帮助文件,1995年
  5. ^ http://www.microsoft.com/globaldev/reference/dbcs/936/936_FD.mspx
  6. ^ http://www.microsoft.com/globaldev/reference/dbcs/936/936_FE.mspx
  7. ^ 在 ISO 10646 文件中稱為 GE;本應稱為“GB7”,但中國向 ISO 10646 提交漢字時將《現代漢語通用字表》稱為 G7
  8. ^ 在 ISO 10646 文件中稱為 G9

外部链接[编辑]