GB 2312

GB 2312
MIME / IANA	GB_2312-80 （EUC 名为GB2312）
别名	iso-ir-58, chinese, csGB2312, csISO58GB231280
语言	简体中文, 英文; 部分支援：; 繁体中文, 西里尔文, 希腊文
标准	GB/T 2312-1980
分类	可支援ISO-2022双字节字元集，中日韩编码
拓展成	ISO-IR-165
编码格式	EUC-CN (GB2312),; HZ-GB-2312
前用	中文电码
后续	GBK，GB 18030
其他相关编码	JIS X 0208，KS X 1001
	查; 论; 编;

GB/T 2312^{[注 1]}，GB/T 2312—80 或 GB/T 2312—1980 是中华人民共和国国家标准简体中文字符集，全称《信息交换用汉字编码字符集·基本集》，通常简称GB（“国标”汉语拼音首字母），又称GB0，由中国国家标准总局于1980年发布，1981年5月1日实施。GB/T 2312编码通行于中国大陆；新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB/T 2312。

概述

GB/T 2312标准共收录6763个汉字，其中一级汉字3755个，二级汉字3008个；同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、注音符号、俄语西里尔字母在内的682个字符。

GB/T 2312的出现，基本满足了汉字的计算机处理需要，它所收录的汉字已经覆盖中国大陆99.75%的使用频率。但对于人名、古汉语等方面出现的罕用字和繁体字，GB/T 2312不能处理，而是由一系列的国标辅助集负责编码和显示（如GB/T 12345《信息交换用汉字编码字符集　第一辅助集》、GB/T 7589 《信息交换用汉字编码字符集第二辅助集》及GB/T 7590《信息交换用汉字编码字符集第四辅助集》），但是 ISO-2022-CN-EXT 最终未给国标除了 GB/T 2312 以外的其他辅助集提供逃逸字符串^[1]^[2]。后来GBK及GB 18030汉字字符集相继出现以解决这些问题。

分区表示

GB/T 2312 中对所收汉字进行了“分区”处理，每区含有94个汉字／符号，共计94个区。实际上，GB/T 2312 只使用了87区。

用所在的区和位来表示字符（实际上就是码位）的方法称为区位码（或许叫“区位号”更为恰当^{[来源请求]}）。例如“万”字在45区82位，所以“万”字的区位码是 45-82（45是“区码”，82是“位码”）。在储存进电脑时，电脑会在区位码上加上特定数字后才保存进内存以确保和其他编码兼容（如 ASCII）。转码后，区位码的“区码”会变成“高位字节”，而“位码”会变成“低位字节”。

下列是 GB/T 2312 分区后在区段内储存的字符：

01~09区（682个）：特殊符号、数字、英文字符、制表符等，包括拉丁字母、希腊字母、日文平假名及片假名字母、注音符号、俄语西里尔字母等在内的682个全角字符；
10~15区：空区，留待扩展；在附录3，第10区推荐作为 GB 1988—80 中的94个图形字符区域（即第3区字符之半形版本）。
16~55区（3755个）：常用汉字（也称一级汉字），按拼音排序；
56~87区（3008个）：非常用汉字（也称二级汉字），按部首/笔画排序；
88~94区：空区，留待扩展。

字节结构

在 GB 2312 内，每个汉字及符号的码位使用两个字节来表示。第一个字节称为“高位字节”，对应分区的编号（把区位码的“区码”加上特定值）；第二个字节称为“低位字节”，对应区段内的个别码位（把区位码的“位码”加上特定值）。

ISO 2022-CN（国标码、交换码）

为了避开ASCII字符中的不可显示字符（十六进制为0×00至0×1F，十进制为0至31）及空格字符（十六进制为0×20，十进制为32），国标码（又称为交换码）参考 ISO 2022 规定表示非 ASCII 字符双字节编码范围为十六进制为 <21 21>-<7E 7E>，十进制为 (33, 33) 至 (126, 126)。因此，在进行码位转换时，须将“区码”和“位码”分别加上32（十六进制为0×20）作为国标码。

在这个编码模式内，软件需要使用低端控制字符（C0），高端控制字符（C1）和US-ASCII字符集（GL）标注字符属于单字节（ASCII）还是双字节，相对容易造成乱码（如丢失控制/转义字符）。

在 GB/T 2312 内，高位字节使用了0x21—0x77（把01—87区的区号加32或0×20），低位字节使用了0x21—0x7E（把01—94加上32或0×20）。

例：“万”字（区位码 45-82）的 ISO 2022 码十进制为：(45+32, 82+32) = (77, 114)，十六进制为：<4D 72>。^[3]^[4]

EUC-CN（机内码、内码）

因为国标码和通用的ASCII码冲突，因此后续为了方便辨认单字节和双字节的编码，部分厂商在 ISO 2022 的基础上把双字节字符的二进制最高位都从 0 换成 1，即相当于把 ISO 2022 的每个字节都再加上128（十六进制为0×80）得到“机内码”表示，简称“内码”。把“区码”和“位码”分别加上160（十六进制为0×A0）也可以得到相同的机内码表示，这种格式也就是EUC。使用GB/T 2312的程序通常采用 EUC 储存方法，以便兼容于 ASCII。这种格式称为EUC-CN。浏览器编码表上的“GB2312”就是指这种表示法。

在 GB/T 2312 内，高位字节使用了0xA1—0xF7（把01—87区的区号加160或0×A0），低位字节使用了0xA1—0xFE（把01—94加上160或0×A0）。非 ASCII 字符双字节编码范围为十六进制为 <A1 A1>-<FE FE>，十进制为 (161, 161) 至 (254, 254)。

例：“万”字（区位码 45-82）的 EUC 码十进制为：(45+160, 82+160) = (205, 242)，十六进制为：<CD F2>。^[3]^[4]

HZ

HZ 编码是由李枫峰在1988年发明的编码系统^[5]。其目的是在7字节的限制下（如电子邮件）储存 GB/T 2312 的双字节字符。其在 ISO 2022 编码字符的前后分别加上转义字符~{（7E 7B）和~}（7E 7D）后，使用正常的ASCII转码变成 ASCII 字符。部分机器也可以接受使用 EUC-CN 编码的转义字符。

例：“万”字（区位码 45-82）的 ISO 2022 码十六进制为 <4D 72>。加上转义字符后，字符串变成7E 7B 4D 72 7E 7D。HZ的编码即为~{Mr~}（M的ASCII码是0×4D，r的ASCII码是0×72）。^[6]

修订

GB 5007.1—85《信息交换用汉字 24x24 点阵字模集》首次附录对 GB/T 2312之更正，包括：

调整拉丁字母“g”的字形
补充六个拼音符号 ɑ ḿ ń ň ǹ ɡ，用于汉语拼音^{[注 2]}
“鍾”更正为“锺”
于第10区补充94个半字图形字符（第3区之半形版本，相当于GB 1988—80）
于第11区加入第8区首32个拼音符号（包括以上补充六个）之半形版本。

GB 5007.1—1985曾将“麴”（84—80）更换成“麹”，但是后续修订（GB 5007.1—2001 和 GB/T 5007.1—2010）和其他字模集仍旧保留 GB/T 2312的繁体偏旁“麥”之“麴”。

GB/T 2312本身一直未有修订，但此等修订部分收入相关字模集（下详）、GB/T 12345、后续之GBK及GB 18030。

GB/T 2312亦用于ISO-IR-165。

两种不同的GB/T 2312实现

有两种不同的GB/T 2312实现，在它们之间存在少量的差别，其中至少有一个是错误的。

区位码（EUC码）	GBK子集		GB2312.TXT		字符名称^[9]
01-04 (<A1 A4>)	U+00B7 · MIDDLE DOT		U+30FB ・ KATAKANA MIDDLE DOT		间隔点
01-10 (<A1 AA>)	U+2014 — EM DASH		U+2015 ― HORIZONTAL BAR		破折号

GBK子集与GBK/GB 18030兼容，GB2312.TXT则不兼容。后者基于ftp.unicode.org曾经提供的GB2312.TXT实现，^[10]于2011年由官方弃用，^[11]2016年9月时已无原文件踪迹。此外还有很多种厂商实现。^[10]

截至2015年^[update]，微软.NET使用的是“GBK子集”实现。ICU（英语：International Components for Unicode）^[12]、libiconv-1.14、^[13]php-5.6、ActivePerl-5.20、Java 1.7、Python 3.4^[14]都使用“GB2312.TXT”实现。Ruby 2.2兼容两者编码，但内部使用“GBK子集”实现。W3C的编码技术指南规定，应将gb2312字节流视为GBK编码，与GB18030一并使用同一解码器解码。^[15]

字模集

GB 5007.1—1985《信息交换用汉字 24×24 点阵字模集》
GB 5007.2—1985《信息交换用汉字 24×24 点阵字模数据集》
GB 5199.1—1985《信息交换用汉字 15×16 点阵字模集》
GB 5199.2—1985《信息交换用汉字 15×16 点阵字模数据集》
GB 6345.1—1986《信息交换用汉字 32×32 点阵字模集》
GB 6345.2—1986《信息交换用汉字 32×32 点阵字模数据集》
GB/T 12034—1989《信息交换用汉字 32×32 点阵仿宋体字模集及数据集》
GB/T 12035—1989《信息交换用汉字 32×32 点阵楷体字模集及数据集》
GB/T 12036—1989《信息交换用汉字 32×32 点阵黑体字模集及数据集》
GB/T 12037—1989《信息交换用汉字 36×36 点阵宋体字模集及数据集》
GB/T 12038—1989《信息交换用汉字 36×36 点阵仿宋体字模集及数据集》
GB/T 12039—1989《信息交换用汉字 36×36 点阵楷体字模集及数据集》
GB/T 12040—1989《信息交换用汉字 36×36 点阵黑体字模集及数据集》
GB/T 12041—1989《信息交换用汉字 48×48 点阵宋体字模集及数据集》
GB/T 12042—1989《信息交换用汉字 48×48 点阵仿宋体字模集及数据集》
GB/T 12043—1989《信息交换用汉字 48×48 点阵楷体字模集及数据集》
GB/T 12044—1989《信息交换用汉字 48×48 点阵黑体字模集及数据集》
GB/T 13443—1992《信息交换用汉字 128×128 点阵楷体字模集及数据集》
GB/T 13444—1992《信息交换用汉字 128×128 点阵仿宋体字模集及数据集》
GB/T 13445—1992《信息交换用汉字 256×256 点阵楷体字模集及数据集》
GB/T 13446—1992《信息交换用汉字 256×256 点阵仿宋体字模集及数据集》
GB/T 13844—1992《图形信息交换用矢量汉字单线宋体字模集及数据集》
GB/T 13845—1992《图形信息交换用矢量汉字宋体字模集及数据集》
GB/T 13846—1992《图形信息交换用矢量汉字仿宋体字模集及数据集》
GB/T 13847—1992《图形信息交换用矢量汉字楷体字模集及数据集》
GB/T 13848—1992《图形信息交换用矢量汉字黑体字模集及数据集》

注释

^ 自2017年3月23日起，根据2017年第7号公告和强制性标准整合精简结论，该标准转化成推荐性标准，不再强制执行，由“GB 2312—80”改称为“GB/T 2312”。中国国家标准全文公开系统 - GB/T 2312-1980. 中国国家标准全文公开系统. [2020-03-30]. （原始内容存档于2021-02-27）.
^ ɑ（U+0251）
ḿ（U+1E3F；Unicode 3.0 始开始收纳，故代码页936亦未收^[7]）
ń（U+0144）
ň（U+0148）
ǹ（U+01F9；Unicode 3.0 始开始收纳，故代码页936亦未收^[8]）
ɡ（U+0261）

参考文献

^ Lunde, Ken. CJKV information processing: Chinese, Japanese, Korean & Vietnamese computing 2nd Ed. Sebastopol, Calif: O'Reilly & Associates. : 239. ISBN 9780596514471.
^ RFC 1922 (1996)
^ ^3.0 ^3.1 品雪. 中文编码小知识. 知乎专栏. [2022-05-02] （中文）.
^ ^4.0 ^4.1 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年十二月 [2022-05-02]. ISBN 978-0-596-51447-1. （原始内容存档于2011-08-29）. 请检查|date=中的日期值 (帮助)
^ HZ — A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII Characters. （原始内容存档于2005-10-27）.
^ HZ-GB-2312中文编码详解 - 云+社区 - 腾讯云. cloud.tencent.com. [2022-05-02]. （原始内容存档于2020-09-29）.
^ http://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx
^ http://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx
^ GB 2312-1980: Information technology—Chinese ideogram coded character set for information interchange （basic set）. [2 October 2016].
^ ^10.0 ^10.1 Haible, Bruno. GB2312 （Conversion Tables）. [29 September 2016]. （原始内容存档于2016-10-20）.
^ Readme - MAPPINGS/OBSOLETE/EASTASIA. 9 August 2001 [29 September 2016]. （原始内容存档于2015-08-01）.
^ java-EUC_CN-1.3_P.ucm. [29 September 2016]. ^{[永久失效链接]}
^ libiconv:lib/gb2312.h. GNU Savannah. [29 September 2016].
^ Issue 24036. Python Bug Tracker. [2015-04-24]. （原始内容存档于2016-03-04）.
^ Encoding § Names and labels. W3C. [29 September 2016]. （原始内容存档于2017-03-18）.

外部链接

GB2312 80信息交换用汉字编码字符集基本集 - 中华人民共和国教育部政府门户网站（页面存档备份，存于互联网档案馆）
TransWiki中文 - GB2312汉字拼音对照表
GB2312 简体中文编码表（页面存档备份，存于互联网档案馆）
信息交换用汉字编码字符集属性^{[永久失效链接]}（官方）
GB 2312-80 (CJKV Information Processing,Appendix E) "STSong-Light" font designed by Changzhou SinoType Technology （页面存档备份，存于互联网档案馆）
図书馆员のコンピュータ基础讲座：GB 2312-80コード表（页面存档备份，存于互联网档案馆）（日语）

参见

同一时期的其他汉字编码：大五码、中文标准交换码、中文资讯交换码、香港增补字符集、JIS X 0208
统一码、通用字符集（ISO/IEC 10646）
中日韩统一表意文字
GB/T 12345

[1] 自2017年3月23日起，根据2017年第7号公告和强制性标准整合精简结论，该标准转化成推荐性标准，不再强制执行，由“GB 2312—80”改称为“GB/T 2312”。中国国家标准全文公开系统 - GB/T 2312-1980. 中国国家标准全文公开系统. [2020-03-30]. （原始内容存档于2021-02-27）.

[10] ɑ（U+0251）
ḿ（U+1E3F；Unicode 3.0 始开始收纳，故代码页936亦未收^[7]）
ń（U+0144）
ň（U+0148）
ǹ（U+01F9；Unicode 3.0 始开始收纳，故代码页936亦未收^[8]）
ɡ（U+0261）

[2] Lunde, Ken. CJKV information processing: Chinese, Japanese, Korean & Vietnamese computing 2nd Ed. Sebastopol, Calif: O'Reilly & Associates. : 239. ISBN 9780596514471.

[rfc1922-3] RFC 1922 (1996)

[zhongwenbianma-zhihu-4] 3.0 ^3.1 品雪. 中文编码小知识. 知乎专栏. [2022-05-02] （中文）.

[cjkvi-5] 4.0 ^4.1 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年十二月 [2022-05-02]. ISBN 978-0-596-51447-1. （原始内容存档于2011-08-29）. 请检查|date=中的日期值 (帮助)

[hz-6] HZ — A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII Characters. （原始内容存档于2005-10-27）.

[7] HZ-GB-2312中文编码详解 - 云+社区 - 腾讯云. cloud.tencent.com. [2022-05-02]. （原始内容存档于2020-09-29）.

[8] ttp://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx

[9] ttp://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx

[gb2312-80-11] GB 2312-1980: Information technology—Chinese ideogram coded character set for information interchange （basic set）. [2 October 2016].

[many-mappings-12] 10.0 ^10.1 Haible, Bruno. GB2312 （Conversion Tables）. [29 September 2016]. （原始内容存档于2016-10-20）.

[13] Readme - MAPPINGS/OBSOLETE/EASTASIA. 9 August 2001 [29 September 2016]. （原始内容存档于2015-08-01）.

[14] va-EUC_CN-1.3_P.ucm. [29 September 2016]. ^{[永久失效链接]}

[15] v:lib/gb2312.h. GNU Savannah. [29 September 2016].

[16] Issue 24036. Python Bug Tracker. [2015-04-24]. （原始内容存档于2016-03-04）.

[17] Encoding § Names and labels. W3C. [29 September 2016]. （原始内容存档于2017-03-18）.

[注 1]

[1]

[2]

[3]

[4]

[5]

[6]

[注 2]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[7]

[8]

查论编字符编码
早期电信	电报电码（英语：Telegraph code）库克与惠斯通（英语：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英语：Morse code for non-Latin alphabets）日文（英语：Wabun code）中文西里尔字母（英语：Russian Morse code）韩文（英语：SKATS）博多与莫瑞 Fieldata（英语：Fieldata） ASCII ISO/IEC 646 BCDIC（英语：BCD (character encoding)）电传文讯（英语：Teletex）与电传视讯（英语：Videotex）／电视资讯 T.51/ISO/IEC 6937（英语：T.51/ISO/IEC 6937） ITU T.61（英语：ITU T.61） ITU T.101（英语：Videotex character set）世界系统电传文讯（英语：World System Teletext）字元集（英语：Teletext character set）
ISO/IEC 8859	现行 -1（西欧语言） -2（中欧语言） -3（马耳他文／世界文） -4（北欧语言） -5（西里尔字母） -6（阿拉伯文） -7（希腊文） -8（希伯来文） -9（土耳其文） -10（北日耳曼语支） -11（泰文） -13（波罗的语族） -14（凯尔特语族） -15（新西欧语言） -16（罗马尼亚文）废止 -12（梵文）提议 KOI-8西里尔字母（英语：ISO-IR-111）萨米文（英语：ISO-IR-197）改编威尔士文（英语：ISO-IR-182）巴伦支西里尔字母（英语：ISO-IR-200）爱沙尼亚文（英语：Code page 922）乌克兰西里尔字母（英语：Code page 1124）
书目	MARC-8（英语：MARC-8） ANSEL（英语：ANSEL）中文资讯交换码 ISO 5426（英语：ISO 5426） ISO 5427（英语：ISO 5427） ISO 5428（英语：ISO 5428） ISO 6438 ISO 6862（英语：ISO 6862）
国家标准	ArmSCII BraSCII（英语：BraSCII）中文标准交换码 DIN 66003（英语：DIN 66003） ELOT 927（英语：ELOT 927） GOST 10859（英语：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英语：JIS X 0212） JIS X 0213（英语：JIS X 0213） KOI-7（英语：KOI-7） KPS 9566 KS X 1001 KS X 1002（英语：KS X 1002） LST 1564（英语：LST 1564） LST 1590-4（英语：LST 1590-4） PASCII Shift JIS SI 960（英语：SI 960） TIS-620（英语：Thai Industrial Standard 620-2533） TSCII VISCII（英语：VISCII） VSCII YUSCII（英语：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英语：ISO/IEC 10367） EUC ISO-IR-165
macOS代码页	亚美尼亚文（英语：Mac OS Armenian）阿拉伯文巴伦支西里尔字母（英语：Mac OS Barents Cyrillic）凯尔特语族（英语：Mac OS Celtic）中欧语言克罗地亚文（英语：Mac OS Croatian encoding）西里尔字母（英语：Mac OS Cyrillic encoding）梵文波斯文（英语：MacFarsi encoding）字体X（英语：Macintosh Font X encoding）盖尔文（英语：Mac OS Gaelic）乔治亚文（英语：Mac OS Georgian）希腊文（英语：MacGreek encoding）古吉拉特文（英语：Mac OS Gujarati）古木基文（英语：Mac OS Gurmukhi）希伯来文（英语：Mac OS Hebrew）冰岛文（英语：Mac OS Icelandic encoding）因纽特文（英语：Mac OS Inuit）键盘（英语：Mac OS Keyboard encoding）拉丁文（英语：Macintosh Latin encoding）马耳他文／世界文（英语：Mac OS Maltese/Esperanto encoding）欧甘字母（英语：Mac OS Ogham）罗曼语族罗马尼亚文（英语：Mac OS Romanian encoding）萨米文（英语：Mac OS Sámi）土耳其文（英语：Mac OS Turkish encoding）土耳其西里尔字母（英语：Mac OS Turkic Cyrillic）乌克兰文（英语：Mac OS Ukrainian encoding） VT100（英语：VT100 encoding）
DOS代码页	437 668（英语：Code page 668） 708（英语：Code page 708） 720（英语：Code page 720） 737（英语：Code page 737） 770（英语：Code page 770） 773（英语：Code page 773） 775（英语：Code page 775） 776（英语：Code page 776） 777（英语：Code page 777） 778（英语：Code page 778） 850（英语：Code page 850） 851（英语：Code page 851） 852（英语：Code page 852） 853（英语：Code page 853） 855（英语：Code page 855） 856（英语：Code page 856） 857（英语：Code page 857） 858（英语：Code page 858） 859（英语：Code page 859） 860（英语：Code page 860） 861（英语：Code page 861） 862（英语：Code page 862） 863（英语：Code page 863） 864（英语：Code page 864） 865（英语：Code page 865） 866（英语：Code page 866） 867（英语：Code page 867） 868（英语：Code page 868） 869（英语：Code page 869） 897（英语：Code page 897） 899（英语：Code page 899） 903（英语：Code page 903） 904（英语：Code page 904） 932（英语：Code page 932 (IBM)） 936（英语：Code page 936 (IBM)） 942（英语：Code page 942） 949（英语：Code page 949 (IBM)） 950 951（英语：Code page 951） 1040（英语：Code page 1040） 1042（英语：Code page 1042） 1043（英语：Code page 1043） 1046（英语：Code page 1046） 1098（英语：Code page 1098） 1115（英语：Code page 1115） 1116（英语：Code page 1116） 1117（英语：Code page 1117） 1118（英语：Code page 1118） 1127（英语：Code page 1127） 3846（英语：Code page 3846） ABICOMP（英语：ABICOMP character set） CS Indic（英语：CS Indic character set） CSX Indic（英语：CSX Indic character set） CSX+ Indic（英语：CSX+ Indic character set） CWI-2（英语：CWI-2）伊朗系统（英语：Iran System encoding）卡梅尼茨（英语：Kamenický encoding）马索维亚（英语：Mazovia encoding） MIK（英语：MIK (character set)）
IBM AIX代码页	895（英语：Code page 895） 896（英语：Code page 896） 912（英语：Code page 912） 915（英语：Code page 915） 921（英语：Code page 921） 922（英语：Code page 922） 1006（英语：Code page 1006） 1008（英语：Code page 1008） 1009（英语：Code page 1009） 1010（英语：Code page 1010） 1012（英语：Code page 1012） 1013（英语：Code page 1013） 1014（英语：Code page 1014） 1015（英语：Code page 1015） 1016（英语：Code page 1016） 1017（英语：Code page 1017） 1018（英语：Code page 1018） 1019（英语：Code page 1019） 1124（英语：Code page 1124） 1133（英语：Code page 1133）
Microsoft Windows代码页（英语：Windows code page）	CER-GS（英语：CER-GS） 932（英语：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英语：Code page 1169） Extended Latin-8（英语：Extended Latin-8） 1250（英语：Windows-1250） 1251（英语：Windows-1251） 1252 1253（英语：Windows-1253） 1254（英语：Windows-1254） 1255（英语：Windows-1255） 1256（英语：Windows-1256） 1257（英语：Windows-1257） 1258（英语：Windows-1258） 1270（英语：Windows-1270）西里尔字母+芬兰文（英语：Windows Cyrillic + Finnish）西里尔字母+法文（英语：Windows Cyrillic + French）西里尔字母+德文（英语：Windows Cyrillic + German）希腊语变音符号（英语：Windows Polytonic Greek）
EBCDIC代码页	37（英语：Code page 37） EBCDIC中的日文（英语：Japanese language in EBCDIC） DKOI（英语：DKOI）
DEC终端机（VTx（英语：VT220））	MCS（英语：Multinational Character Set） NRCS（英语：National Replacement Character Set）加拿大法文（英语：Code page 1020）瑞士文（英语：Code page 1021）西班牙文（英语：Code page 1023）英国英文（英语：Code page 1101）荷兰文（英语：Code page 1102）芬兰文（英语：Code page 1103）法文（英语：Code page 1104）挪威文／丹麦文（英语：Code page 1105）瑞典文（英语：Code page 1106）挪威文／丹麦文（替代）（英语：Code page 1107） 8位元希腊文（英语：Code page 1287） 8位元土耳其文（英语：Code page 1288） SI 960（英语：SI 960）希伯来文（英语：DEC Hebrew）特殊图形（英语：DEC Special Graphics）技术（英语：DEC Technical Character Set）
特定平台	1057（英语：Code page 1057） Acorn（英语：RISC OS character set） Adobe标准（英语：PostScript Standard Encoding） Adobe Latin 1（英语：PostScript Latin 1 Encoding） Amstrad CPC（英语：Amstrad CPC character set） Apple II（英语：Apple II character set）雅达利资讯交换标准码（英语：ATASCII）雅达利ST（英语：Atari ST character set） BICS（英语：Bitstream International Character Set）卡西欧计算机（英语：Casio calculator character sets） CDC（英语：CDC display code） Compucolor II（英语：Compucolor II character set） CP/M+（英语：Amstrad CP/M Plus character set） DEC RADIX 50（英语：DEC RADIX 50） DEC MCS（英语：Multinational Character Set）/NRCS（英语：National Replacement Character Set） DG国际（英语：DG International） Fieldata（英语：Fieldata） GEM（英语：GEM character set） GSM 03.38（英语：GSM 03.38） HP Roman（英语：HP Roman） HP FOCAL（英语：FOCAL character set） HP RPL（英语：RPL character set） SQUOZE（英语：SQUOZE） LICS（英语：Lotus International Character Set） LMBCS（英语：Lotus Multi-Byte Character Set） MSX（英语：MSX character set） NEC APC（英语：NEC APC character set） NeXT（英语：NeXT character set） PETSCII（英语：PETSCII） SEGA SC-3000（英语：Sega SC-3000 character set）夏普计算机（英语：Sharp pocket computer character sets）夏普MZ（英语：Sharp MZ character set）辛克莱QL（英语：Sinclair QL character set）符号电传文讯（英语：Teletext character set）德州仪器计算机（英语：TI calculator character sets） TRS-80（英语：TRS-80 character set）文图拉国际（英语：Ventura International） WISCII（英语：Wang International Standard Code for Information Interchange） XCCS（英语：Xerox Character Code Standard） ZX80（英语：ZX80 character set） ZX81（英语：ZX81 character set） ZX Spectrum（英语：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英语：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英语：Tamil All Character Encoding） Unicode编码比较（英语：Comparison of Unicode encodings）
TeX排版系统	科克（英语：Cork encoding） LY1（英语：LY1 encoding） OML（英语：OML encoding） OMS（英语：OMS encoding） OT1（英语：OT1 encoding）
其他代码页	ABICOMP（英语：ABICOMP character set） ASMO 449（英语：ASMO 449）大五码 APL符号数位编码（英语：Digital encoding of APL symbols） ISO-IR-68（英语：ISO-IR-68） ARIB STD-B24 HZ（英语：HZ (character encoding)） IEC-P27-1（英语：IEC-P27-1） INIS 7位元（英语：INIS character set） INIS-8（英语：8位元） ISO-IR-169（英语：ISO-IR-169） ISO 2033（英语：ISO 2033） KOI -R -RU（英语：KOI8-RU） -U 今昔文字镜 SEASCII（英语：Stanford Extended ASCII） Stanford/ITS（英语：Stanford/ITS character set） TRON（英语：TRON (encoding)）统合韩文代码（英语：Unified Hangul Code）
控制字符	摩斯电码专用代码（英语：Prosigns for Morse code） C0与C1控制字符 ISO/IEC 6429 JIS X 0211（英语：JIS X 0211） Unicode控制字符空白字元
相关条目	CCSID（英语：CCSID） HTML字符编码字符集探测中日韩统一表意文字硬件代码页（英语：Hardware code page）磁性墨水字元识别码（英语：Magnetic ink character recognition）乱码中文乱码可变宽度编码
字元集