中文标准交换码

CNS 11643
别名	中文标准交换码
语言	繁体中文
标准	CNS 11643
分类	ISO 2022、双字节字元集、中日韩统一表意文字
编码格式	EUC-TW (所有字面); ISO-2022-CN-EXT (字面1–7); ISO-2022-CN (字面1和字面2);
其他相关编码	大五码、中文资讯交换码
	查; 论; 编;

中文标准交换码（Chinese Standard Interchange Code，简称CSIC），是中华民国国家标准11643号，简称CNS 11643，旧名通用汉字标准交换码（Chinese Ideographic Standard Code for Information Interchange，简称CISCII），是中华民国政府为中文资讯处理制定的字元编码方案，与许多学术图书馆系统采用的中文资讯交换码同属于中文交换码。中文标准交换码基于ISO 2022定义，和ASCII相容，其EUC版本为EUC-TW。

简介

1980年9月，行政院国家科学委员会集合编码专家、学者在溪头举行会议，建立国家中文资讯标准交换码的编码原则，并报请行政院核定。隔年，行政院函令国科会、教育部、中央标准局及主计处电子处理资料中心组成专案作业小组，推动编码工作。经多次会商，于1983年10月底完成“通用汉字标准交换码”的试用版，试行二年。试用期满后，国科会与主计处电资中心邀集相关单位与业者组成技术小组，检讨试用结果，并根据检讨结果修订编码原则予以重编。1986年8月4日由经济部中央标准局（后改名为标准检验局）正式公布，取名“通用汉字标准交换码”，其内容包括第一字面、第二字面共13,051字^[1]。

1980年代万“码”奔腾，业界使用各种不同的字符编码，如大五码、王安码、IBM 5550码、公会码、电信码^[2]、倚天码等；CNS11643与大五码字数相同（大五码有13,053字，但有两个重码）。借由此国家标准交换码的公布与使用，做为各种不同内码间的桥梁，使得不同的内码也可以互相沟通和交换，资料可共享。

为因应各界对扩大中文字元集的需求，中央标准局于1990年委托资讯工业策进会进行扩编。CNS 11643于1992年使用至第七字面，共48,027字，并更名为“中文标准交换码”。2003年，标准检验局委托中文数码化技术推广基金会再次扩编，于2004年推出新版的CNS11643，将编码空间由原先规定的十六字面增加到八十字面，并使用至第十五字面。2014年，使用第十七、十九字面。2021年，使用第二十四字面^[3]^[4]。

“CNS11643中文交换码全字库”为1999年时，由主计处电资中心委托中文数码化技术推广基金会建置，用以解决中文码查询、转码与缺字问题。为配合2012年的行政院组织改造，全字库改由研考会办理，自2014年又由继承研考会业务的国家发展委员会管理。2022年8月27日数位发展部成立后，网站管理机构调整为数位部^[5]。全字库目前已收纳10万8,800多个文字及符号。若扣除第八和第九字面中的非汉字字元以及第一字面中的符号、注音、部首、汉字构件等字元，以有仓颉码属性的字来计算，大约有9万6,600多个汉字^[6]^[7]。

版本

年份	标准名称	更改
1983	CNS11643-1983	通用汉字标准交换码试用版推出，包括13,053字及441个符号，12月推出的大五码，字集与字序与交换码试用版完全相同，仅字码定义不同。
1986	CNS11643-1986	通用汉字标准交换码正式版发行，包括13,051个字（删除2个重复字，调整20个字顺序）与441个符号，其余均与试用版相同。
1988	CNS11643-1986	增加第十四字面使用者加字区交换码，共增加6,148字。
1989	CNS11643-1986	再增加第十四字面使用者加字区交换码，共增加157字。
1992	CNS11643-1992	扩充第3至7字面，增加部首和数字符号，并更换名称为中文标准交换码，总共包括48,027个字与684个符号。
2002	CNS14649	国际标准ISO 10646／Unicode的中文版“CNS 14649广用多八位元编码字元集”推出，包括中、日、韩、越等20,902个汉字，及全球使用的字元。
2004	CNS11643-2004	编码架构扩充至八十字面。
2008	CNS11643-2008	扩充版发行，增加了户政用字与异体字等。

编码格式

CNS 11643遵循ISO/IEC 2022所规定的七位元94个图形字元（英语：Graphic character）多字节延伸编码格式^[4]，以2个字节 (byte)为中文码编码单位，以十六进位制之文数字表示，并且避开控制码所在的范围。字面字集之排列，大抵以使用频率为次序，第一字面以常用字为主，第二字面以次常用字为主，第三字面以部分罕用字及较常用异体字为主，其后的字面大多以罕用字、异体字、教育部闽客语用字及户政、役政、地政等机关用字为主。在每一字面中，依先笔画后部首排列顺序来编订字码（每一字面均以文字笔画总数为第一次序，笔划数同则按照部首为次序，部首同再按照笔顺为次序）^[8]。

CNS 11643采用多字面编码结构，并借助ISO/IEC 2022所规定的逸出顺序（escape sequence）和调用控制符切换字面。因此，同样的正规字元码在CNS 11643的不同字面会代表不同的汉字（例如：第1字面字元码454A为中文字“日”，而第2字面的454A是中文字“碇”）。CNS 11643在新版中规定了延伸字元码，作为任一字元的唯一字元码。中文标准交换码延伸字元码是在正规字元码前，附加该字元所属字面的字面指示码^[4]。

终结字元

目前 CNS11643 的1~7 字面之终结字元（最后字元、最终字节） [F] 已获国际标准组织 ISO 正式登记为 47 至 4D ，亦可使用于字集之指定^[8]^[9]。依据ISO 237之规定，各国的国家标准若要成为国际间之中文资讯交换标准，必须向国际标准组织申请注册，并由国际标准组织正式公布，如此全球各国即可依国际标准公布之终结字元进行资料交换。

CNS 11643-1992所包括的七个字面，每个字面均分别向ISO秘书处欧洲计算机制造商协会申请相对应之终结字元。经由资讯工业策进会之协助申请，1993年2月1日CNS 11643第一、第二字面正式获得终结字元：47和48，1994年3月25日CNS 11643第三至第七字面也正式获得终结字元：49 - 4D。

CNS字面	CNS暂用终结字元	ISO正式终结字元
第一字面	30	47
第二字面	31	48
第三字面	32	49
第四字面	33	4A
第五字面	34	4B
第六字面	35	4C
第七字面	36	4D

与大五码关系

大五码为资讯工业策进会与台湾十三家资讯业者签约，共同为“五大软件专案”所设计的中文字符编码。该字符编码于1983年12月推出，共收录13,053个汉字（有两字重复编码，故实际上只有13,051个字）、408个符号、33个控制字元^[13]，其字元的范围与顺序都和1983年10月推出的“通用汉字标准交换码”试用版相同，但码位不同。“通用汉字标准交换码”在1986年推出正式版，删除试用版的2个重复编码字，调整了20个字的顺序。

大五码后来成为繁体中文社群最常用的电脑汉字字集标准，然而所涵盖的字数不敷实际需求，造成厂商各自增删，衍生成多种不同版本。2003年中文数码化技术推广基金会接受经济部标准检验局委托，召集国内业者代表、专家和学者，就大五码字元表的原始版本和业界主要版本予以重整，称为Big5-2003^[14]。重整后的版本，去除了重复编码，并新增7个中文字，以及370个符号，包括30个数字符号、24个部首、14个罕用符号、268个日本假名，以及34个表格符号^[13]。其成果最后收录至CNS 11643的附录之中^[15]。

参看

资料来源

^ 余保伦. 與文字共舞－中文數位化發展簡介 (PDF). 中华民国统计资讯网. [2022-12-16]. （原始内容存档 (PDF)于2022-12-16）.
^ 陈冠州. 電信碼. 国家教育研究院乐词网. 1995-12 [2024-04-29]. （原始内容存档于2024-04-29）.
^ 存档副本. [2015-03-28]. （原始内容存档于2015-04-02）.
^ ^4.0 ^4.1 ^4.2 曾士熊. 認識中文字元碼：十、中文標準交換碼（CNS 11643）. [2022-12-16]. （原始内容存档于2022-05-28）.
^ 全字库中文标准交换码. 全字庫介紹. [2022-12-16]. （原始内容存档于2022-12-16）.
^ 全字庫現況. [2022-12-16]. （原始内容存档于2023-01-27）.
^ 全字庫中文標準交換碼 - 中文碼現況. [2022-12-17]. （原始内容存档于2022-12-17）. 现有字数：现行全字库中，户政与地政部分用字经检查为认同字，因而删除该码位资料，但仍保留该码位的位置，现有字数即去除这些被认同掉的字码，所计算得到的总字数……全字库第八字面和第九字面所储存的是拼音文字，所以没有注音、仓颉等属性资料码位个数
^ ^8.0 ^8.1 認識全字庫＞中文碼介紹. [2022-12-17]. （原始内容存档于2021-05-14）.
^ 附錄1﹕中文字碼處理說明 (PDF). [2022-12-17]. （原始内容存档 (PDF)于2022-12-17）.
^ 存档副本. [2021-12-12]. （原始内容存档于2022-07-14）.
^ 存档副本. [2021-12-12]. （原始内容存档于2022-07-14）.
^ 存档副本. [2021-12-12]. （原始内容存档于2022-07-10）.
^ ^13.0 ^13.1 曾士熊. 認識中文字元碼：九、Big5和Big5E. [2022-12-17]. （原始内容存档于2022-05-28）.
^ 認識全字庫＞中文碼介紹. [2022-12-17]. （原始内容存档于2021-05-14）.
^ 谢东翰. 預覽「Big5 2003」. [2022-12-17]. （原始内容存档于2022-12-17）.

外部链接

CNS11643中文标准交换码全字库（页面存档备份，存于互联网档案馆）
CNS11643中文标准交换码全字库资料集（页面存档备份，存于互联网档案馆）
CNS 11643与Unicode对照表（页面存档备份，存于互联网档案馆）
曾士熊：认识中文字元码 - 中文标准交换码（CNS 11643）（页面存档备份，存于互联网档案馆）
依据各平面显示所有字符的PDF（旧资料）

[余保倫-1] 余保伦. 與文字共舞－中文數位化發展簡介 (PDF). 中华民国统计资讯网. [2022-12-16]. （原始内容存档 (PDF)于2022-12-16）.

[2] 陈冠州. 電信碼. 国家教育研究院乐词网. 1995-12 [2024-04-29]. （原始内容存档于2024-04-29）.

[3] 存档副本. [2015-03-28]. （原始内容存档于2015-04-02）.

[曾士熊-CNS-4] 4.0 ^4.1 ^4.2 曾士熊. 認識中文字元碼：十、中文標準交換碼（CNS 11643）. [2022-12-16]. （原始内容存档于2022-05-28）.

[5] 全字库中文标准交换码. 全字庫介紹. [2022-12-16]. （原始内容存档于2022-12-16）.

[全字庫現況-6] 全字庫現況. [2022-12-16]. （原始内容存档于2023-01-27）.

[7] 全字庫中文標準交換碼 - 中文碼現況. [2022-12-17]. （原始内容存档于2022-12-17）. 现有字数：现行全字库中，户政与地政部分用字经检查为认同字，因而删除该码位资料，但仍保留该码位的位置，现有字数即去除这些被认同掉的字码，所计算得到的总字数……全字库第八字面和第九字面所储存的是拼音文字，所以没有注音、仓颉等属性资料码位个数

[CNS11643-8] 8.0 ^8.1 認識全字庫＞中文碼介紹. [2022-12-17]. （原始内容存档于2021-05-14）.

[9] 附錄1﹕中文字碼處理說明 (PDF). [2022-12-17]. （原始内容存档 (PDF)于2022-12-17）.

[10] 存档副本. [2021-12-12]. （原始内容存档于2022-07-14）.

[11] 存档副本. [2021-12-12]. （原始内容存档于2022-07-14）.

[12] 存档副本. [2021-12-12]. （原始内容存档于2022-07-10）.

[Big5-13] 13.0 ^13.1 曾士熊. 認識中文字元碼：九、Big5和Big5E. [2022-12-17]. （原始内容存档于2022-05-28）.

[14] 認識全字庫＞中文碼介紹. [2022-12-17]. （原始内容存档于2021-05-14）.

[15] 谢东翰. 預覽「Big5 2003」. [2022-12-17]. （原始内容存档于2022-12-17）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

查论编字符编码
早期电信	电报电码（英语：Telegraph code）库克与惠斯通（英语：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英语：Morse code for non-Latin alphabets）日文（英语：Wabun code）中文西里尔字母（英语：Russian Morse code）韩文（英语：SKATS）博多与莫瑞 Fieldata（英语：Fieldata） ASCII ISO/IEC 646 BCDIC（英语：BCD (character encoding)）电传文讯（英语：Teletex）与电传视讯（英语：Videotex）／电视资讯 T.51/ISO/IEC 6937（英语：T.51/ISO/IEC 6937） ITU T.61（英语：ITU T.61） ITU T.101（英语：Videotex character set）世界系统电传文讯（英语：World System Teletext）字元集（英语：Teletext character set）
ISO/IEC 8859	现行 -1（西欧语言） -2（中欧语言） -3（马耳他文／世界文） -4（北欧语言） -5（西里尔字母） -6（阿拉伯文） -7（希腊文） -8（希伯来文） -9（土耳其文） -10（北日耳曼语支） -11（泰文） -13（波罗的语族） -14（凯尔特语族） -15（新西欧语言） -16（罗马尼亚文）废止 -12（梵文）提议 KOI-8西里尔字母（英语：ISO-IR-111）萨米文（英语：ISO-IR-197）改编威尔士文（英语：ISO-IR-182）巴伦支西里尔字母（英语：ISO-IR-200）爱沙尼亚文（英语：Code page 922）乌克兰西里尔字母（英语：Code page 1124）
书目	MARC-8（英语：MARC-8） ANSEL（英语：ANSEL）中文资讯交换码 ISO 5426（英语：ISO 5426） ISO 5427（英语：ISO 5427） ISO 5428（英语：ISO 5428） ISO 6438 ISO 6862（英语：ISO 6862）
国家标准	ArmSCII BraSCII（英语：BraSCII）中文标准交换码 DIN 66003（英语：DIN 66003） ELOT 927（英语：ELOT 927） GOST 10859（英语：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英语：JIS X 0212） JIS X 0213（英语：JIS X 0213） KOI-7（英语：KOI-7） KPS 9566 KS X 1001 KS X 1002（英语：KS X 1002） LST 1564（英语：LST 1564） LST 1590-4（英语：LST 1590-4） PASCII Shift JIS SI 960（英语：SI 960） TIS-620（英语：Thai Industrial Standard 620-2533） TSCII VISCII（英语：VISCII） VSCII YUSCII（英语：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英语：ISO/IEC 10367） EUC ISO-IR-165
macOS代码页	亚美尼亚文（英语：Mac OS Armenian）阿拉伯文巴伦支西里尔字母（英语：Mac OS Barents Cyrillic）凯尔特语族（英语：Mac OS Celtic）中欧语言克罗地亚文（英语：Mac OS Croatian encoding）西里尔字母（英语：Mac OS Cyrillic encoding）梵文波斯文（英语：MacFarsi encoding）字体X（英语：Macintosh Font X encoding）盖尔文（英语：Mac OS Gaelic）乔治亚文（英语：Mac OS Georgian）希腊文（英语：MacGreek encoding）古吉拉特文（英语：Mac OS Gujarati）古木基文（英语：Mac OS Gurmukhi）希伯来文（英语：Mac OS Hebrew）冰岛文（英语：Mac OS Icelandic encoding）因纽特文（英语：Mac OS Inuit）键盘（英语：Mac OS Keyboard encoding）拉丁文（英语：Macintosh Latin encoding）马耳他文／世界文（英语：Mac OS Maltese/Esperanto encoding）欧甘字母（英语：Mac OS Ogham）罗曼语族罗马尼亚文（英语：Mac OS Romanian encoding）萨米文（英语：Mac OS Sámi）土耳其文（英语：Mac OS Turkish encoding）土耳其西里尔字母（英语：Mac OS Turkic Cyrillic）乌克兰文（英语：Mac OS Ukrainian encoding） VT100（英语：VT100 encoding）
DOS代码页	437 668（英语：Code page 668） 708（英语：Code page 708） 720（英语：Code page 720） 737（英语：Code page 737） 770（英语：Code page 770） 773（英语：Code page 773） 775（英语：Code page 775） 776（英语：Code page 776） 777（英语：Code page 777） 778（英语：Code page 778） 850（英语：Code page 850） 851（英语：Code page 851） 852（英语：Code page 852） 853（英语：Code page 853） 855（英语：Code page 855） 856（英语：Code page 856） 857（英语：Code page 857） 858（英语：Code page 858） 859（英语：Code page 859） 860（英语：Code page 860） 861（英语：Code page 861） 862（英语：Code page 862） 863（英语：Code page 863） 864（英语：Code page 864） 865（英语：Code page 865） 866（英语：Code page 866） 867（英语：Code page 867） 868（英语：Code page 868） 869（英语：Code page 869） 897（英语：Code page 897） 899（英语：Code page 899） 903（英语：Code page 903） 904（英语：Code page 904） 932（英语：Code page 932 (IBM)） 936（英语：Code page 936 (IBM)） 942（英语：Code page 942） 949（英语：Code page 949 (IBM)） 950 951（英语：Code page 951） 1040（英语：Code page 1040） 1042（英语：Code page 1042） 1043（英语：Code page 1043） 1046（英语：Code page 1046） 1098（英语：Code page 1098） 1115（英语：Code page 1115） 1116（英语：Code page 1116） 1117（英语：Code page 1117） 1118（英语：Code page 1118） 1127（英语：Code page 1127） 3846（英语：Code page 3846） ABICOMP（英语：ABICOMP character set） CS Indic（英语：CS Indic character set） CSX Indic（英语：CSX Indic character set） CSX+ Indic（英语：CSX+ Indic character set） CWI-2（英语：CWI-2）伊朗系统（英语：Iran System encoding）卡梅尼茨（英语：Kamenický encoding）马索维亚（英语：Mazovia encoding） MIK（英语：MIK (character set)）
IBM AIX代码页	895（英语：Code page 895） 896（英语：Code page 896） 912（英语：Code page 912） 915（英语：Code page 915） 921（英语：Code page 921） 922（英语：Code page 922） 1006（英语：Code page 1006） 1008（英语：Code page 1008） 1009（英语：Code page 1009） 1010（英语：Code page 1010） 1012（英语：Code page 1012） 1013（英语：Code page 1013） 1014（英语：Code page 1014） 1015（英语：Code page 1015） 1016（英语：Code page 1016） 1017（英语：Code page 1017） 1018（英语：Code page 1018） 1019（英语：Code page 1019） 1124（英语：Code page 1124） 1133（英语：Code page 1133）
Microsoft Windows代码页（英语：Windows code page）	CER-GS（英语：CER-GS） 932（英语：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英语：Code page 1169） Extended Latin-8（英语：Extended Latin-8） 1250（英语：Windows-1250） 1251（英语：Windows-1251） 1252 1253（英语：Windows-1253） 1254（英语：Windows-1254） 1255（英语：Windows-1255） 1256（英语：Windows-1256） 1257（英语：Windows-1257） 1258（英语：Windows-1258） 1270（英语：Windows-1270）西里尔字母+芬兰文（英语：Windows Cyrillic + Finnish）西里尔字母+法文（英语：Windows Cyrillic + French）西里尔字母+德文（英语：Windows Cyrillic + German）希腊语变音符号（英语：Windows Polytonic Greek）
EBCDIC代码页	37（英语：Code page 37） EBCDIC中的日文（英语：Japanese language in EBCDIC） DKOI（英语：DKOI）
DEC终端机（VTx（英语：VT220））	MCS（英语：Multinational Character Set） NRCS（英语：National Replacement Character Set）加拿大法文（英语：Code page 1020）瑞士文（英语：Code page 1021）西班牙文（英语：Code page 1023）英国英文（英语：Code page 1101）荷兰文（英语：Code page 1102）芬兰文（英语：Code page 1103）法文（英语：Code page 1104）挪威文／丹麦文（英语：Code page 1105）瑞典文（英语：Code page 1106）挪威文／丹麦文（替代）（英语：Code page 1107） 8位元希腊文（英语：Code page 1287） 8位元土耳其文（英语：Code page 1288） SI 960（英语：SI 960）希伯来文（英语：DEC Hebrew）特殊图形（英语：DEC Special Graphics）技术（英语：DEC Technical Character Set）
特定平台	1057（英语：Code page 1057） Acorn（英语：RISC OS character set） Adobe标准（英语：PostScript Standard Encoding） Adobe Latin 1（英语：PostScript Latin 1 Encoding） Amstrad CPC（英语：Amstrad CPC character set） Apple II（英语：Apple II character set）雅达利资讯交换标准码（英语：ATASCII）雅达利ST（英语：Atari ST character set） BICS（英语：Bitstream International Character Set）卡西欧计算机（英语：Casio calculator character sets） CDC（英语：CDC display code） Compucolor II（英语：Compucolor II character set） CP/M+（英语：Amstrad CP/M Plus character set） DEC RADIX 50（英语：DEC RADIX 50） DEC MCS（英语：Multinational Character Set）/NRCS（英语：National Replacement Character Set） DG国际（英语：DG International） Fieldata（英语：Fieldata） GEM（英语：GEM character set） GSM 03.38（英语：GSM 03.38） HP Roman（英语：HP Roman） HP FOCAL（英语：FOCAL character set） HP RPL（英语：RPL character set） SQUOZE（英语：SQUOZE） LICS（英语：Lotus International Character Set） LMBCS（英语：Lotus Multi-Byte Character Set） MSX（英语：MSX character set） NEC APC（英语：NEC APC character set） NeXT（英语：NeXT character set） PETSCII（英语：PETSCII） SEGA SC-3000（英语：Sega SC-3000 character set）夏普计算机（英语：Sharp pocket computer character sets）夏普MZ（英语：Sharp MZ character set）辛克莱QL（英语：Sinclair QL character set）符号电传文讯（英语：Teletext character set）德州仪器计算机（英语：TI calculator character sets） TRS-80（英语：TRS-80 character set）文图拉国际（英语：Ventura International） WISCII（英语：Wang International Standard Code for Information Interchange） XCCS（英语：Xerox Character Code Standard） ZX80（英语：ZX80 character set） ZX81（英语：ZX81 character set） ZX Spectrum（英语：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英语：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英语：Tamil All Character Encoding） Unicode编码比较（英语：Comparison of Unicode encodings）
TeX排版系统	科克（英语：Cork encoding） LY1（英语：LY1 encoding） OML（英语：OML encoding） OMS（英语：OMS encoding） OT1（英语：OT1 encoding）
其他代码页	ABICOMP（英语：ABICOMP character set） ASMO 449（英语：ASMO 449）大五码 APL符号数位编码（英语：Digital encoding of APL symbols） ISO-IR-68（英语：ISO-IR-68） ARIB STD-B24 HZ（英语：HZ (character encoding)） IEC-P27-1（英语：IEC-P27-1） INIS 7位元（英语：INIS character set） INIS-8（英语：8位元） ISO-IR-169（英语：ISO-IR-169） ISO 2033（英语：ISO 2033） KOI -R -RU（英语：KOI8-RU） -U 今昔文字镜 SEASCII（英语：Stanford Extended ASCII） Stanford/ITS（英语：Stanford/ITS character set） TRON（英语：TRON (encoding)）统合韩文代码（英语：Unified Hangul Code）
控制字符	摩斯电码专用代码（英语：Prosigns for Morse code） C0与C1控制字符 ISO/IEC 6429 JIS X 0211（英语：JIS X 0211） Unicode控制字符空白字元
相关条目	CCSID（英语：CCSID） HTML字符编码字符集探测中日韩统一表意文字硬件代码页（英语：Hardware code page）磁性墨水字元识别码（英语：Magnetic ink character recognition）乱码中文乱码可变宽度编码
字元集

简介

版本

编码格式

终结字元

最新版本

与大五码关系

参看

资料来源

外部链接