ISO-IR-165

ISO-IR-165《通讯用中文多字节字符集》（Codes of the Chinese graphic character set for communication）是中国大陆于1992年为国际电信联盟电信标准化部门（CCITT）^[1] 创制之中文多字节通讯字符集。该编码在ISO 2022下注册的名称为 ISO-IR-165，可以使用 ISO-2022-CN-EXT 进行编码。

ISO-IR-165 整合 GB 2312（包括 GB/T 6345.1-86《信息交换用汉字 32x32 点阵字模集》新增之字符及调整^[2]）以及 GB/T 8565.2-88《信息处理文本通信用编码字符集第二部分：图形字符集》。该标准合共 8446 个字符。

GB/T 6345.1的修订和补充

GB/T 6345.1-1986《信息交换用汉字 32x32 点阵字模集》（后续改成GB/T 6345.1-2010）包括了对 GB/T 2312 的修正和补充。^[2]相关的修订最早是由GB 5007.1–85《信息交换用汉字 24x24 点阵字模集》所加入。

GB/T 6345.1 对现有 GB/T 2312 的修订^[2]
区位码	EUC码	GB/T 2312（未修订）	GB/T 6341.1	备注
03-71	0xA3E7		ɡ	^[a]
79-81	0xEFF1	锺	锺	^[b]

^ 对应 Unicode U+FF47 ｇ；但是 GB/T 6341.1 的字形也可以对应至U+0261 ɡ 。
^ 原字对应繁体中文的U+937E 鍾，修改后成为简体的U+953A 锺。《汉字简化方案》内原先将“鍾”合并进“钟”（“鐘”的简化字），后续1986年的《简化字总表》允许在人名中使用“锺”，而相似的标准（如 GB/T 5007.1–85）也将该字修改成使用简体“钅”旁的“锺”。

后续实践 GB/T 2312 的编码（如Windows 的代码页936）将 79-81 对应的汉字 Unicode 码从“鍾”改为“锺”。^[3]

GB/T 6345.1-86 也在 GB/T 2312 的基础上在第 10 区补充了ISO 646-CN 的半宽字符（3 区的字符为全宽字符）和第 8 区补充了 6 个汉语拼音字符。^[2]这些补充也在 GB/T 12345 内出现，而 GB/T 12345 也额外在第 6 区加上了 29 个竖排标点符号。^[2]^[4]

2011年发布的 GB/T 6345.1-2010 正式在第 11 区增加了对应 8 区 32 个汉语拼音字符（包括新补充的6个字符）的半宽版本。^[5]这个补充并未在 GB 18030 内实行。^[6]

Classic Mac OS 内的简体中文编码（基于EUC-CN修改）^[7] 和 GB 18030 包含了 GB/T 6345.1 补充的 6 个汉语拼音字符（但是不包括半宽版本）和 GB/T 12345 补充的竖排标点符号。^[6] 新增的 6 个汉语拼音字符如下：^[7]

GB/T 2312 第 8 区的扩充
区位码	EUC码	字符^[7]^[6]	备注
08-27	0xA8BB	U+0251 ɑ
08-28	0xA8BC	U+1E3F ḿ	^[a]
08-29	0xA8BD	U+0144 ń
08-30	0xA8BE	U+0148 ň
08-31	0xA8BF	U+01F9 ǹ	^[b]
08-32	0xA8C0	U+0261	^[c]

^ Windows CP936^[8] 和 GB 18030-2000 映射至私用区 U+E7C7，GB 18030-2005 修改成 U+1E3F。^[6]
^ 此字符是在 Unicode 3.0 新增的，在这之前该字符一般映射至 U+006E, U+0300。^[7] Windows CP936 映射至私用区 U+E7C8。^[8]
^ 与未修订 GB/T 2312 的 03-71 一样（见上表）。ISO-IR-165 的 Unicode 映射有差异。

GB/T 8565.2 的修订和补充

GB/T 8565.2-1988《信息处理文本通信用编码字符集第二部分：图形字符集》也定义了 GB/T 2312 的补充字符，在 13-15 区和 90-94 区之间新增了 705 个字符，其中 15 区新增的 69 个字符是非汉字。该修订包括了 GB/T 6345.1 的修订，但是没有包括补充字符。^[2]

Unihan 资料库中引用中国大陆来源 GB/T 8565 的汉字使用 G8 来标示。^[1]

CCITT 修订

ISO-IR-165 包括了 GB/T 6345.1 和 GB/T 8565.2 在 GB/T 2312 的新增补充字符。另外，ISO-IR-165 也新增了 161 个字符，其中 139 个汉字是“普通汉字和异体”。^[2]^[9]有时这些 CCITT 的新增字会和 GB/T 8565.2 混淆，包括以前的 Unihan 资料库。^[1]

CCITT 在第 6 区新增了对应第 3 区的像字符^[9]，这些字符和 Mac OS 简体中文^[7] 和 GB 18030^[6] 的新增字符相撞。

ISO-IR-165 包含了 GB/T 6345.1 的订正，但是其中有两个字符的 Unicode 映射与 GB/T 2312 和 GB/T 6345.1 扩展的映射不同。下表显示各标准的映射和对应字形，也另附 GB 18030 的对应编码：

区位码	EUC码	GB/T 2312（未修订）	GB/T 6345.1^[5]	GB/T 6345.1 映射^[7]	ISO-IR-165^[9]	ISO-IR-165映射^[10]	GB 18030^[6]	GB 18030 映射^[6]
03-71	0xA3E7		ɡ	U+FF47	ɡ	U+0261		U+FF47
08-32	0xA8C0	（无）		U+0261		U+FF47	ɡ	U+0261
79-81	0xEFF1	鍾	锺	U+953A	锺	U+953A	锺	U+953A

来源

^ ^1.0 ^1.1 ^1.2 Chung, Jaemin. Pseudo-G8 characters (PDF). 2018-01-24 [2022-05-05]. ISO/IEC JTC 1/SC 2/WG 2/IRG N2276. （原始内容 (PDF)存档于2022-03-19）.
^ ^2.0 ^2.1 ^2.2 ^2.3 ^2.4 ^2.5 ^2.6 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年12月 [2022-05-06]. ISBN 978-0-596-51447-1. （原始内容存档于2011-08-29）.
^ Steele, Shawn. cp936 to Unicode table. Microsoft, Unicode Consortium. 2000 [2022-05-05]. （原始内容存档于2022-03-18）.
^ Lunde, Ken. Appendix F: GB/T 12345 (PDF). CJKV Information Processing (O'Reilly). 1998 [2022-05-05]. ISBN 9781565922242. （原始内容 (PDF)存档于2019-02-02）.
^ ^5.0 ^5.1 中华人民共和国国家标准化管理委员会. GB/T 6345.1-2010 信息技术汉字编码字符集(基本集) 32点阵字型第1部分宋体. 中国. 2011-01-10 （中文（中国大陆））.
^ ^6.0 ^6.1 ^6.2 ^6.3 ^6.4 ^6.5 ^6.6 Standardization Administration of China (SAC). GB 18030-2005: Information Technology—Chinese coded character set. 2005-11-18.
^ ^7.0 ^7.1 ^7.2 ^7.3 ^7.4 ^7.5 Mac OS 简体中文版本对 Unicode 3.0 后的映射. Apple, Inc. [2022-05-05]. （原始内容存档于2021-02-05）.
^ ^8.0 ^8.1 Microsoft. CODEPAGE 936: PRC GBK (XGB) - ANSI, OEM. Unicode Consortium. [2022-05-05]. （原始内容存档于2021-01-19）.
^ ^9.0 ^9.1 ^9.2 CCITT. Codes of the Chinese graphic character set for communication (PDF). ITSCJ/IPSJ. 1992-07-13 [2022-05-06]. （原始内容 (PDF)存档于2022-03-10）.
^ Viswanadha, Raghuram. Unicode to ISO-IR-165 table. International Components for Unicod-e. IBM. 2000-08-30. （备注：编号根据来源使用 7 位元或 ISO 2022：加上 0×80 生成EUC码，或减去 0×20 生成区位码）

外部链接

ISO-IR-165:1992（页面存档备份，存于互联网档案馆）

[3] 对应 Unicode U+FF47 ｇ；但是 GB/T 6341.1 的字形也可以对应至U+0261 ɡ 。

[4] 原字对应繁体中文的U+937E 鍾，修改后成为简体的U+953A 锺。《汉字简化方案》内原先将“鍾”合并进“钟”（“鐘”的简化字），后续1986年的《简化字总表》允许在人名中使用“锺”，而相似的标准（如 GB/T 5007.1–85）也将该字修改成使用简体“钅”旁的“锺”。

[11] Windows CP936^[8] 和 GB 18030-2000 映射至私用区 U+E7C7，GB 18030-2005 修改成 U+1E3F。^[6]

[12] 此字符是在 Unicode 3.0 新增的，在这之前该字符一般映射至 U+006E, U+0300。^[7] Windows CP936 映射至私用区 U+E7C8。^[8]

[13] 与未修订 GB/T 2312 的 03-71 一样（见上表）。ISO-IR-165 的 Unicode 映射有差异。

[chung-1] 1.0 ^1.1 ^1.2 Chung, Jaemin. Pseudo-G8 characters (PDF). 2018-01-24 [2022-05-05]. ISO/IEC JTC 1/SC 2/WG 2/IRG N2276. （原始内容 (PDF)存档于2022-03-19）.

[cjkvip-2] 2.0 ^2.1 ^2.2 ^2.3 ^2.4 ^2.5 ^2.6 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年12月 [2022-05-06]. ISBN 978-0-596-51447-1. （原始内容存档于2011-08-29）.

[ms936-5] Steele, Shawn. cp936 to Unicode table. Microsoft, Unicode Consortium. 2000 [2022-05-05]. （原始内容存档于2022-03-18）.

[cjkv-12345-6] Lunde, Ken. Appendix F: GB/T 12345 (PDF). CJKV Information Processing (O'Reilly). 1998 [2022-05-05]. ISBN 9781565922242. （原始内容 (PDF)存档于2019-02-02）.

[gb6345-2010-7] 5.0 ^5.1 中华人民共和国国家标准化管理委员会. GB/T 6345.1-2010 信息技术汉字编码字符集(基本集) 32点阵字型第1部分宋体. 中国. 2011-01-10 （中文（中国大陆））.

[gb18030-8] 6.0 ^6.1 ^6.2 ^6.3 ^6.4 ^6.5 ^6.6 Standardization Administration of China (SAC). GB 18030-2005: Information Technology—Chinese coded character set. 2005-11-18.

[macsimpchinese-9] 7.0 ^7.1 ^7.2 ^7.3 ^7.4 ^7.5 Mac OS 简体中文版本对 Unicode 3.0 后的映射. Apple, Inc. [2022-05-05]. （原始内容存档于2021-02-05）.

[ms936-with-pua-10] 8.0 ^8.1 Microsoft. CODEPAGE 936: PRC GBK (XGB) - ANSI, OEM. Unicode Consortium. [2022-05-05]. （原始内容存档于2021-01-19）.

[iso-ir-14] 9.0 ^9.1 ^9.2 CCITT. Codes of the Chinese graphic character set for communication (PDF). ITSCJ/IPSJ. 1992-07-13 [2022-05-06]. （原始内容 (PDF)存档于2022-03-10）.

[15] Viswanadha, Raghuram. Unicode to ISO-IR-165 table. International Components for Unicod-e. IBM. 2000-08-30. （备注：编号根据来源使用 7 位元或 ISO 2022：加上 0×80 生成EUC码，或减去 0×20 生成区位码）

[1]

[2]

[a]

[b]

[3]

[4]

[5]

[6]

[7]

[a]

[b]

[c]

[8]

[9]

[10]

查论编字符编码
早期电信	电报电码（英语：Telegraph code）库克与惠斯通（英语：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英语：Morse code for non-Latin alphabets）日文（英语：Wabun code）中文西里尔字母（英语：Russian Morse code）韩文（英语：SKATS）博多与莫瑞 Fieldata（英语：Fieldata） ASCII ISO/IEC 646 BCDIC（英语：BCD (character encoding)）电传文讯（英语：Teletex）与电传视讯（英语：Videotex）／电视资讯 T.51/ISO/IEC 6937（英语：T.51/ISO/IEC 6937） ITU T.61（英语：ITU T.61） ITU T.101（英语：Videotex character set）世界系统电传文讯（英语：World System Teletext）字元集（英语：Teletext character set）
ISO/IEC 8859	现行 -1（西欧语言） -2（中欧语言） -3（马耳他文／世界文） -4（北欧语言） -5（西里尔字母） -6（阿拉伯文） -7（希腊文） -8（希伯来文） -9（土耳其文） -10（北日耳曼语支） -11（泰文） -13（波罗的语族） -14（凯尔特语族） -15（新西欧语言） -16（罗马尼亚文）废止 -12（梵文）提议 KOI-8西里尔字母（英语：ISO-IR-111）萨米文（英语：ISO-IR-197）改编威尔士文（英语：ISO-IR-182）巴伦支西里尔字母（英语：ISO-IR-200）爱沙尼亚文（英语：Code page 922）乌克兰西里尔字母（英语：Code page 1124）
书目	MARC-8（英语：MARC-8） ANSEL（英语：ANSEL）中文资讯交换码 ISO 5426（英语：ISO 5426） ISO 5427（英语：ISO 5427） ISO 5428（英语：ISO 5428） ISO 6438 ISO 6862（英语：ISO 6862）
国家标准	ArmSCII BraSCII（英语：BraSCII）中文标准交换码 DIN 66003（英语：DIN 66003） ELOT 927（英语：ELOT 927） GOST 10859（英语：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英语：JIS X 0212） JIS X 0213（英语：JIS X 0213） KOI-7（英语：KOI-7） KPS 9566 KS X 1001 KS X 1002（英语：KS X 1002） LST 1564（英语：LST 1564） LST 1590-4（英语：LST 1590-4） PASCII Shift JIS SI 960（英语：SI 960） TIS-620（英语：Thai Industrial Standard 620-2533） TSCII VISCII（英语：VISCII） VSCII YUSCII（英语：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英语：ISO/IEC 10367） EUC ISO-IR-165
macOS代码页	亚美尼亚文（英语：Mac OS Armenian）阿拉伯文巴伦支西里尔字母（英语：Mac OS Barents Cyrillic）凯尔特语族（英语：Mac OS Celtic）中欧语言克罗地亚文（英语：Mac OS Croatian encoding）西里尔字母（英语：Mac OS Cyrillic encoding）梵文波斯文（英语：MacFarsi encoding）字体X（英语：Macintosh Font X encoding）盖尔文（英语：Mac OS Gaelic）乔治亚文（英语：Mac OS Georgian）希腊文（英语：MacGreek encoding）古吉拉特文（英语：Mac OS Gujarati）古木基文（英语：Mac OS Gurmukhi）希伯来文（英语：Mac OS Hebrew）冰岛文（英语：Mac OS Icelandic encoding）因纽特文（英语：Mac OS Inuit）键盘（英语：Mac OS Keyboard encoding）拉丁文（英语：Macintosh Latin encoding）马耳他文／世界文（英语：Mac OS Maltese/Esperanto encoding）欧甘字母（英语：Mac OS Ogham）罗曼语族罗马尼亚文（英语：Mac OS Romanian encoding）萨米文（英语：Mac OS Sámi）土耳其文（英语：Mac OS Turkish encoding）土耳其西里尔字母（英语：Mac OS Turkic Cyrillic）乌克兰文（英语：Mac OS Ukrainian encoding） VT100（英语：VT100 encoding）
DOS代码页	437 668（英语：Code page 668） 708（英语：Code page 708） 720（英语：Code page 720） 737（英语：Code page 737） 770（英语：Code page 770） 773（英语：Code page 773） 775（英语：Code page 775） 776（英语：Code page 776） 777（英语：Code page 777） 778（英语：Code page 778） 850（英语：Code page 850） 851（英语：Code page 851） 852（英语：Code page 852） 853（英语：Code page 853） 855（英语：Code page 855） 856（英语：Code page 856） 857（英语：Code page 857） 858（英语：Code page 858） 859（英语：Code page 859） 860（英语：Code page 860） 861（英语：Code page 861） 862（英语：Code page 862） 863（英语：Code page 863） 864（英语：Code page 864） 865（英语：Code page 865） 866（英语：Code page 866） 867（英语：Code page 867） 868（英语：Code page 868） 869（英语：Code page 869） 897（英语：Code page 897） 899（英语：Code page 899） 903（英语：Code page 903） 904（英语：Code page 904） 932（英语：Code page 932 (IBM)） 936（英语：Code page 936 (IBM)） 942（英语：Code page 942） 949（英语：Code page 949 (IBM)） 950 951（英语：Code page 951） 1040（英语：Code page 1040） 1042（英语：Code page 1042） 1043（英语：Code page 1043） 1046（英语：Code page 1046） 1098（英语：Code page 1098） 1115（英语：Code page 1115） 1116（英语：Code page 1116） 1117（英语：Code page 1117） 1118（英语：Code page 1118） 1127（英语：Code page 1127） 3846（英语：Code page 3846） ABICOMP（英语：ABICOMP character set） CS Indic（英语：CS Indic character set） CSX Indic（英语：CSX Indic character set） CSX+ Indic（英语：CSX+ Indic character set） CWI-2（英语：CWI-2）伊朗系统（英语：Iran System encoding）卡梅尼茨（英语：Kamenický encoding）马索维亚（英语：Mazovia encoding） MIK（英语：MIK (character set)）
IBM AIX代码页	895（英语：Code page 895） 896（英语：Code page 896） 912（英语：Code page 912） 915（英语：Code page 915） 921（英语：Code page 921） 922（英语：Code page 922） 1006（英语：Code page 1006） 1008（英语：Code page 1008） 1009（英语：Code page 1009） 1010（英语：Code page 1010） 1012（英语：Code page 1012） 1013（英语：Code page 1013） 1014（英语：Code page 1014） 1015（英语：Code page 1015） 1016（英语：Code page 1016） 1017（英语：Code page 1017） 1018（英语：Code page 1018） 1019（英语：Code page 1019） 1124（英语：Code page 1124） 1133（英语：Code page 1133）
Microsoft Windows代码页（英语：Windows code page）	CER-GS（英语：CER-GS） 932（英语：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英语：Code page 1169） Extended Latin-8（英语：Extended Latin-8） 1250（英语：Windows-1250） 1251（英语：Windows-1251） 1252 1253（英语：Windows-1253） 1254（英语：Windows-1254） 1255（英语：Windows-1255） 1256（英语：Windows-1256） 1257（英语：Windows-1257） 1258（英语：Windows-1258） 1270（英语：Windows-1270）西里尔字母+芬兰文（英语：Windows Cyrillic + Finnish）西里尔字母+法文（英语：Windows Cyrillic + French）西里尔字母+德文（英语：Windows Cyrillic + German）希腊语变音符号（英语：Windows Polytonic Greek）
EBCDIC代码页	37（英语：Code page 37） EBCDIC中的日文（英语：Japanese language in EBCDIC） DKOI（英语：DKOI）
DEC终端机（VTx（英语：VT220））	MCS（英语：Multinational Character Set） NRCS（英语：National Replacement Character Set）加拿大法文（英语：Code page 1020）瑞士文（英语：Code page 1021）西班牙文（英语：Code page 1023）英国英文（英语：Code page 1101）荷兰文（英语：Code page 1102）芬兰文（英语：Code page 1103）法文（英语：Code page 1104）挪威文／丹麦文（英语：Code page 1105）瑞典文（英语：Code page 1106）挪威文／丹麦文（替代）（英语：Code page 1107） 8位元希腊文（英语：Code page 1287） 8位元土耳其文（英语：Code page 1288） SI 960（英语：SI 960）希伯来文（英语：DEC Hebrew）特殊图形（英语：DEC Special Graphics）技术（英语：DEC Technical Character Set）
特定平台	1057（英语：Code page 1057） Acorn（英语：RISC OS character set） Adobe标准（英语：PostScript Standard Encoding） Adobe Latin 1（英语：PostScript Latin 1 Encoding） Amstrad CPC（英语：Amstrad CPC character set） Apple II（英语：Apple II character set）雅达利资讯交换标准码（英语：ATASCII）雅达利ST（英语：Atari ST character set） BICS（英语：Bitstream International Character Set）卡西欧计算机（英语：Casio calculator character sets） CDC（英语：CDC display code） Compucolor II（英语：Compucolor II character set） CP/M+（英语：Amstrad CP/M Plus character set） DEC RADIX 50（英语：DEC RADIX 50） DEC MCS（英语：Multinational Character Set）/NRCS（英语：National Replacement Character Set） DG国际（英语：DG International） Fieldata（英语：Fieldata） GEM（英语：GEM character set） GSM 03.38（英语：GSM 03.38） HP Roman（英语：HP Roman） HP FOCAL（英语：FOCAL character set） HP RPL（英语：RPL character set） SQUOZE（英语：SQUOZE） LICS（英语：Lotus International Character Set） LMBCS（英语：Lotus Multi-Byte Character Set） MSX（英语：MSX character set） NEC APC（英语：NEC APC character set） NeXT（英语：NeXT character set） PETSCII（英语：PETSCII） SEGA SC-3000（英语：Sega SC-3000 character set）夏普计算机（英语：Sharp pocket computer character sets）夏普MZ（英语：Sharp MZ character set）辛克莱QL（英语：Sinclair QL character set）符号电传文讯（英语：Teletext character set）德州仪器计算机（英语：TI calculator character sets） TRS-80（英语：TRS-80 character set）文图拉国际（英语：Ventura International） WISCII（英语：Wang International Standard Code for Information Interchange） XCCS（英语：Xerox Character Code Standard） ZX80（英语：ZX80 character set） ZX81（英语：ZX81 character set） ZX Spectrum（英语：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英语：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英语：Tamil All Character Encoding） Unicode编码比较（英语：Comparison of Unicode encodings）
TeX排版系统	科克（英语：Cork encoding） LY1（英语：LY1 encoding） OML（英语：OML encoding） OMS（英语：OMS encoding） OT1（英语：OT1 encoding）
其他代码页	ABICOMP（英语：ABICOMP character set） ASMO 449（英语：ASMO 449）大五码 APL符号数位编码（英语：Digital encoding of APL symbols） ISO-IR-68（英语：ISO-IR-68） ARIB STD-B24 HZ（英语：HZ (character encoding)） IEC-P27-1（英语：IEC-P27-1） INIS 7位元（英语：INIS character set） INIS-8（英语：8位元） ISO-IR-169（英语：ISO-IR-169） ISO 2033（英语：ISO 2033） KOI -R -RU（英语：KOI8-RU） -U 今昔文字镜 SEASCII（英语：Stanford Extended ASCII） Stanford/ITS（英语：Stanford/ITS character set） TRON（英语：TRON (encoding)）统合韩文代码（英语：Unified Hangul Code）
控制字符	摩斯电码专用代码（英语：Prosigns for Morse code） C0与C1控制字符 ISO/IEC 6429 JIS X 0211（英语：JIS X 0211） Unicode控制字符空白字元
相关条目	CCSID（英语：CCSID） HTML字符编码字符集探测中日韩统一表意文字硬件代码页（英语：Hardware code page）磁性墨水字元识别码（英语：Magnetic ink character recognition）乱码中文乱码可变宽度编码
字元集