GB 2312

GB 2312
MIME / IANA	GB_2312-80 （EUC 名為GB2312）
別名	iso-ir-58, chinese, csGB2312, csISO58GB231280
語言	簡體中文, 英文; 部分支援：; 繁體中文, 西里爾文, 希臘文
標準	GB/T 2312-1980
分類	可支援ISO-2022雙字節字元集，中日韓編碼
拓展成	ISO-IR-165
編碼格式	EUC-CN (GB2312),; HZ-GB-2312
前用	中文電碼
後續	GBK，GB 18030
其他相關編碼	JIS X 0208，KS X 1001
	閱; 論; 編;

GB/T 2312^{[註 1]}，GB/T 2312—80 或 GB/T 2312—1980 是中華人民共和國國家標準簡體中文字符集，全稱《信息交換用漢字編碼字符集·基本集》，通常簡稱GB（「國標」漢語拼音首字母），又稱GB0，由中國國家標準總局於1980年發佈，1981年5月1日實施。GB/T 2312編碼通行於中國大陸；新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟件都支持GB/T 2312。

概述

GB/T 2312標準共收錄6763個漢字，其中一級漢字3755個，二級漢字3008個；同時收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、注音符號、俄語西里爾字母在內的682個字符。

GB/T 2312的出現，基本滿足了漢字的計算機處理需要，它所收錄的漢字已經覆蓋中國大陸99.75%的使用頻率。但對於人名、古漢語等方面出現的罕用字和繁體字，GB/T 2312不能處理，而是由一系列的國標輔助集負責編碼和顯示（如GB/T 12345《信息交換用漢字編碼字符集　第一輔助集》、GB/T 7589 《信息交換用漢字編碼字符集第二輔助集》及GB/T 7590《信息交換用漢字編碼字符集第四輔助集》），但是 ISO-2022-CN-EXT 最終未給國標除了 GB/T 2312 以外的其他輔助集提供逃逸字符串^[1]^[2]。後來GBK及GB 18030漢字字符集相繼出現以解決這些問題。

分區表示

GB/T 2312 中對所收漢字進行了「分區」處理，每區含有94個漢字／符號，共計94個區。實際上，GB/T 2312 只使用了87區。

用所在的區和位來表示字符（實際上就是碼位）的方法稱為區位碼（或許叫「區位號」更為恰當^{[來源請求]}）。例如「万」字在45區82位，所以「万」字的區位碼是 45-82（45是「區碼」，82是「位碼」）。在儲存進電腦時，電腦會在區位碼上加上特定數字後才保存進內存以確保和其他編碼兼容（如 ASCII）。轉碼後，區位碼的「區碼」會變成「高位字節」，而「位碼」會變成「低位字節」。

下列是 GB/T 2312 分區後在區段內儲存的字符：

01~09區（682個）：特殊符號、數字、英文字符、制表符等，包括拉丁字母、希臘字母、日文平假名及片假名字母、注音符號、俄語西里爾字母等在內的682個全形字符；
10~15區：空區，留待擴展；在附錄3，第10區推薦作為 GB 1988—80 中的94個圖形字符區域（即第3區字符之半形版本）。
16~55區（3755個）：常用漢字（也稱一級漢字），按拼音排序；
56~87區（3008個）：非常用漢字（也稱二級漢字），按部首/筆畫排序；
88~94區：空區，留待擴展。

字節結構

在 GB 2312 內，每個漢字及符號的碼位使用兩個字節來表示。第一個字節稱為「高位字節」，對應分區的編號（把區位碼的「區碼」加上特定值）；第二個字節稱為「低位字節」，對應區段內的個別碼位（把區位碼的「位碼」加上特定值）。

ISO 2022-CN（國標碼、交換碼）

為了避開ASCII字符中的不可顯示字符（十六進制為0×00至0×1F，十進制為0至31）及空格字符（十六進制為0×20，十進制為32），國標碼（又稱為交換碼）參考 ISO 2022 規定表示非 ASCII 字符雙字節編碼範圍為十六進制為 <21 21>-<7E 7E>，十進制為 (33, 33) 至 (126, 126)。因此，在進行碼位轉換時，須將「區碼」和「位碼」分別加上32（十六進制為0×20）作為國標碼。

在這個編碼模式內，軟件需要使用低端控制字符（C0），高端控制字符（C1）和US-ASCII字符集（GL）標註字符屬於單字節（ASCII）還是雙字節，相對容易造成亂碼（如丟失控制/轉義字符）。

在 GB/T 2312 內，高位字節使用了0x21—0x77（把01—87區的區號加32或0×20），低位字節使用了0x21—0x7E（把01—94加上32或0×20）。

例：「万」字（區位碼 45-82）的 ISO 2022 碼十進制為：(45+32, 82+32) = (77, 114)，十六進制為：<4D 72>。^[3]^[4]

EUC-CN（機內碼、內碼）

因為國標碼和通用的ASCII碼衝突，因此後續為了方便辨認單字節和雙字節的編碼，部分廠商在 ISO 2022 的基礎上把雙字節字符的二進制最高位都從 0 換成 1，即相當於把 ISO 2022 的每個字節都再加上128（十六進制為0×80）得到「機內碼」表示，簡稱「內碼」。把「區碼」和「位碼」分別加上160（十六進制為0×A0）也可以得到相同的機內碼表示，這種格式也就是EUC。使用GB/T 2312的程序通常採用 EUC 儲存方法，以便兼容於 ASCII。這種格式稱為EUC-CN。瀏覽器編碼表上的「GB2312」就是指這種表示法。

在 GB/T 2312 內，高位字節使用了0xA1—0xF7（把01—87區的區號加160或0×A0），低位字節使用了0xA1—0xFE（把01—94加上160或0×A0）。非 ASCII 字符雙字節編碼範圍為十六進制為 <A1 A1>-<FE FE>，十進制為 (161, 161) 至 (254, 254)。

例：「万」字（區位碼 45-82）的 EUC 碼十進制為：(45+160, 82+160) = (205, 242)，十六進制為：<CD F2>。^[3]^[4]

HZ

HZ 編碼是由李楓峰在1988年發明的編碼系統^[5]。其目的是在7位元組的限制下（如電子郵件）儲存 GB/T 2312 的雙字節字符。其在 ISO 2022 編碼字符的前後分別加上轉義字符~{（7E 7B）和~}（7E 7D）後，使用正常的ASCII轉碼變成 ASCII 字符。部分機器也可以接受使用 EUC-CN 編碼的轉義字符。

例：「万」字（區位碼 45-82）的 ISO 2022 碼十六進制為 <4D 72>。加上轉義字符後，字符串變成7E 7B 4D 72 7E 7D。HZ的編碼即為~{Mr~}（M的ASCII碼是0×4D，r的ASCII碼是0×72）。^[6]

修訂

GB 5007.1—85《信息交換用漢字 24x24 點陣字模集》首次附錄對 GB/T 2312之更正，包括：

調整拉丁字母「g」的字形
補充六個拼音符號 ɑ ḿ ń ň ǹ ɡ，用於漢語拼音^{[註 2]}
「鍾」更正為「锺」
於第10區補充94個半字圖形字符（第3區之半形版本，相當於GB 1988—80）
於第11區加入第8區首32個拼音符號（包括以上補充六個）之半形版本。

GB 5007.1—1985曾將「麴」（84—80）更換成「麹」，但是後續修訂（GB 5007.1—2001 和 GB/T 5007.1—2010）和其他字模集仍舊保留 GB/T 2312的繁體偏旁「麥」之「麴」。

GB/T 2312本身一直未有修訂，但此等修訂部份收入相關字模集（下詳）、GB/T 12345、後續之GBK及GB 18030。

GB/T 2312亦用於ISO-IR-165。

兩種不同的GB/T 2312實現

有兩種不同的GB/T 2312實現，在它們之間存在少量的差別，其中至少有一個是錯誤的。

區位碼（EUC碼）	GBK子集		GB2312.TXT		字符名稱^[9]
01-04 (<A1 A4>)	U+00B7 · MIDDLE DOT		U+30FB ・ KATAKANA MIDDLE DOT		間隔點
01-10 (<A1 AA>)	U+2014 — EM DASH		U+2015 ― HORIZONTAL BAR		破折號

GBK子集與GBK/GB 18030兼容，GB2312.TXT則不兼容。後者基於ftp.unicode.org曾經提供的GB2312.TXT實現，^[10]於2011年由官方棄用，^[11]2016年9月時已無原文件蹤跡。此外還有很多種廠商實現。^[10]

截至2015年^[update]，微軟.NET使用的是「GBK子集」實現。ICU（英語：International Components for Unicode）^[12]、libiconv-1.14、^[13]php-5.6、ActivePerl-5.20、Java 1.7、Python 3.4^[14]都使用「GB2312.TXT」實現。Ruby 2.2兼容兩者編碼，但內部使用「GBK子集」實現。W3C的編碼技術指南規定，應將gb2312字節流視為GBK編碼，與GB18030一併使用同一解碼器解碼。^[15]

字模集

GB 5007.1—1985《信息交換用漢字 24×24 點陣字模集》
GB 5007.2—1985《信息交換用漢字 24×24 點陣字模數據集》
GB 5199.1—1985《信息交換用漢字 15×16 點陣字模集》
GB 5199.2—1985《信息交換用漢字 15×16 點陣字模數據集》
GB 6345.1—1986《信息交換用漢字 32×32 點陣字模集》
GB 6345.2—1986《信息交換用漢字 32×32 點陣字模數據集》
GB/T 12034—1989《信息交換用漢字 32×32 點陣仿宋體字模集及數據集》
GB/T 12035—1989《信息交換用漢字 32×32 點陣楷體字模集及數據集》
GB/T 12036—1989《信息交換用漢字 32×32 點陣黑體字模集及數據集》
GB/T 12037—1989《信息交換用漢字 36×36 點陣宋體字模集及數據集》
GB/T 12038—1989《信息交換用漢字 36×36 點陣仿宋體字模集及數據集》
GB/T 12039—1989《信息交換用漢字 36×36 點陣楷體字模集及數據集》
GB/T 12040—1989《信息交換用漢字 36×36 點陣黑體字模集及數據集》
GB/T 12041—1989《信息交換用漢字 48×48 點陣宋體字模集及數據集》
GB/T 12042—1989《信息交換用漢字 48×48 點陣仿宋體字模集及數據集》
GB/T 12043—1989《信息交換用漢字 48×48 點陣楷體字模集及數據集》
GB/T 12044—1989《信息交換用漢字 48×48 點陣黑體字模集及數據集》
GB/T 13443—1992《信息交換用漢字 128×128 點陣楷體字模集及數據集》
GB/T 13444—1992《信息交換用漢字 128×128 點陣仿宋體字模集及數據集》
GB/T 13445—1992《信息交換用漢字 256×256 點陣楷體字模集及數據集》
GB/T 13446—1992《信息交換用漢字 256×256 點陣仿宋體字模集及數據集》
GB/T 13844—1992《圖形信息交換用向量漢字單線宋體字模集及數據集》
GB/T 13845—1992《圖形信息交換用向量漢字宋體字模集及數據集》
GB/T 13846—1992《圖形信息交換用向量漢字仿宋體字模集及數據集》
GB/T 13847—1992《圖形信息交換用向量漢字楷體字模集及數據集》
GB/T 13848—1992《圖形信息交換用向量漢字黑體字模集及數據集》

註釋

^ 自2017年3月23日起，根據2017年第7號公告和強制性標準整合精簡結論，該標準轉化成推薦性標準，不再強制執行，由「GB 2312—80」改稱為「GB/T 2312」。中国国家标准全文公开系统 - GB/T 2312-1980. 中國國家標準全文公開系統. [2020-03-30]. （原始內容存檔於2021-02-27）.
^ ɑ（U+0251）
ḿ（U+1E3F；Unicode 3.0 始開始收納，故代碼頁936亦未收^[7]）
ń（U+0144）
ň（U+0148）
ǹ（U+01F9；Unicode 3.0 始開始收納，故代碼頁936亦未收^[8]）
ɡ（U+0261）

參考文獻

^ Lunde, Ken. CJKV information processing: Chinese, Japanese, Korean & Vietnamese computing 2nd Ed. Sebastopol, Calif: O'Reilly & Associates. : 239. ISBN 9780596514471.
^ RFC 1922 (1996)
^ ^3.0 ^3.1 品雪. 中文编码小知识. 知乎專欄. [2022-05-02] （中文）.
^ ^4.0 ^4.1 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年十二月 [2022-05-02]. ISBN 978-0-596-51447-1. （原始內容存檔於2011-08-29）. 請檢查|date=中的日期值 (幫助)
^ HZ — A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII Characters. （原始內容存檔於2005-10-27）.
^ HZ-GB-2312中文编码详解 - 云+社区 - 腾讯云. cloud.tencent.com. [2022-05-02]. （原始內容存檔於2020-09-29）.
^ http://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx
^ http://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx
^ GB 2312-1980: Information technology—Chinese ideogram coded character set for information interchange （basic set）. [2 October 2016].
^ ^10.0 ^10.1 Haible, Bruno. GB2312 （Conversion Tables）. [29 September 2016]. （原始內容存檔於2016-10-20）.
^ Readme - MAPPINGS/OBSOLETE/EASTASIA. 9 August 2001 [29 September 2016]. （原始內容存檔於2015-08-01）.
^ java-EUC_CN-1.3_P.ucm. [29 September 2016]. ^{[永久失效連結]}
^ libiconv:lib/gb2312.h. GNU Savannah. [29 September 2016].
^ Issue 24036. Python Bug Tracker. [2015-04-24]. （原始內容存檔於2016-03-04）.
^ Encoding § Names and labels. W3C. [29 September 2016]. （原始內容存檔於2017-03-18）.

外部連結

GB2312 80信息交換用漢字編碼字符集基本集 - 中華人民共和國教育部政府入門網站（頁面存檔備份，存於互聯網檔案館）
TransWiki中文 - GB2312漢字拼音對照表
GB2312 簡體中文編碼表（頁面存檔備份，存於互聯網檔案館）
信息交換用漢字編碼字符集屬性^{[永久失效連結]}（官方）
GB 2312-80 (CJKV Information Processing,Appendix E) "STSong-Light" font designed by Changzhou SinoType Technology （頁面存檔備份，存於互聯網檔案館）
図書館員のコンピュータ基礎講座：GB 2312-80コード表（頁面存檔備份，存於互聯網檔案館）（日語）

參見

同一時期的其他漢字編碼：大五碼、中文標準交換碼、中文資訊交換碼、香港增補字符集、JIS X 0208
統一碼、通用字符集（ISO/IEC 10646）
中日韓統一表意文字
GB/T 12345

[1] 自2017年3月23日起，根據2017年第7號公告和強制性標準整合精簡結論，該標準轉化成推薦性標準，不再強制執行，由「GB 2312—80」改稱為「GB/T 2312」。中国国家标准全文公开系统 - GB/T 2312-1980. 中國國家標準全文公開系統. [2020-03-30]. （原始內容存檔於2021-02-27）.

[10] ɑ（U+0251）
ḿ（U+1E3F；Unicode 3.0 始開始收納，故代碼頁936亦未收^[7]）
ń（U+0144）
ň（U+0148）
ǹ（U+01F9；Unicode 3.0 始開始收納，故代碼頁936亦未收^[8]）
ɡ（U+0261）

[2] Lunde, Ken. CJKV information processing: Chinese, Japanese, Korean & Vietnamese computing 2nd Ed. Sebastopol, Calif: O'Reilly & Associates. : 239. ISBN 9780596514471.

[rfc1922-3] RFC 1922 (1996)

[zhongwenbianma-zhihu-4] 3.0 ^3.1 品雪. 中文编码小知识. 知乎專欄. [2022-05-02] （中文）.

[cjkvi-5] 4.0 ^4.1 Lunde, Ken Roger. CJKV Information Processing 第二版. O'Reilly. 2008年十二月 [2022-05-02]. ISBN 978-0-596-51447-1. （原始內容存檔於2011-08-29）. 請檢查|date=中的日期值 (幫助)

[hz-6] HZ — A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and ASCII Characters. （原始內容存檔於2005-10-27）.

[7] HZ-GB-2312中文编码详解 - 云+社区 - 腾讯云. cloud.tencent.com. [2022-05-02]. （原始內容存檔於2020-09-29）.

[8] ttp://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx

[9] ttp://www.microsoft.com/globaldev/reference/dbcs/936/936_A8.mspx

[gb2312-80-11] GB 2312-1980: Information technology—Chinese ideogram coded character set for information interchange （basic set）. [2 October 2016].

[many-mappings-12] 10.0 ^10.1 Haible, Bruno. GB2312 （Conversion Tables）. [29 September 2016]. （原始內容存檔於2016-10-20）.

[13] Readme - MAPPINGS/OBSOLETE/EASTASIA. 9 August 2001 [29 September 2016]. （原始內容存檔於2015-08-01）.

[14] va-EUC_CN-1.3_P.ucm. [29 September 2016]. ^{[永久失效連結]}

[15] v:lib/gb2312.h. GNU Savannah. [29 September 2016].

[16] Issue 24036. Python Bug Tracker. [2015-04-24]. （原始內容存檔於2016-03-04）.

[17] Encoding § Names and labels. W3C. [29 September 2016]. （原始內容存檔於2017-03-18）.

[註 1]

[1]

[2]

[3]

[4]

[5]

[6]

[註 2]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[7]

[8]

閱論編字元編碼
早期電信	電報電碼（英語：Telegraph code）庫克與惠斯通（英語：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英語：Morse code for non-Latin alphabets）日文（英語：Wabun code）中文西里爾字母（英語：Russian Morse code）韓文（英語：SKATS）博多與莫瑞 Fieldata（英語：Fieldata） ASCII ISO/IEC 646 BCDIC（英語：BCD (character encoding)）電傳文訊（英語：Teletex）與電傳視訊（英語：Videotex）／電視資訊 T.51/ISO/IEC 6937（英語：T.51/ISO/IEC 6937） ITU T.61（英語：ITU T.61） ITU T.101（英語：Videotex character set）世界系統電傳文訊（英語：World System Teletext）字元集（英語：Teletext character set）
ISO/IEC 8859	現行 -1（西歐語言） -2（中歐語言） -3（馬爾他文／世界文） -4（北歐語言） -5（西里爾字母） -6（阿拉伯文） -7（希臘文） -8（希伯來文） -9（土耳其文） -10（北日耳曼語支） -11（泰文） -13（波羅的語族） -14（凱爾特語族） -15（新西歐語言） -16（羅馬尼亞文）廢止 -12（梵文）提議 KOI-8西里爾字母（英語：ISO-IR-111）薩米文（英語：ISO-IR-197）改編威爾斯文（英語：ISO-IR-182）巴倫支西里爾字母（英語：ISO-IR-200）愛沙尼亞文（英語：Code page 922）烏克蘭西里爾字母（英語：Code page 1124）
書目	MARC-8（英語：MARC-8） ANSEL（英語：ANSEL）中文資訊交換碼 ISO 5426（英語：ISO 5426） ISO 5427（英語：ISO 5427） ISO 5428（英語：ISO 5428） ISO 6438 ISO 6862（英語：ISO 6862）
國家標準	ArmSCII BraSCII（英語：BraSCII）中文標準交換碼 DIN 66003（英語：DIN 66003） ELOT 927（英語：ELOT 927） GOST 10859（英語：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英語：JIS X 0212） JIS X 0213（英語：JIS X 0213） KOI-7（英語：KOI-7） KPS 9566 KS X 1001 KS X 1002（英語：KS X 1002） LST 1564（英語：LST 1564） LST 1590-4（英語：LST 1590-4） PASCII Shift JIS SI 960（英語：SI 960） TIS-620（英語：Thai Industrial Standard 620-2533） TSCII VISCII（英語：VISCII） VSCII YUSCII（英語：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英語：ISO/IEC 10367） EUC ISO-IR-165
macOS代碼頁	亞美尼亞文（英語：Mac OS Armenian）阿拉伯文巴倫支西里爾字母（英語：Mac OS Barents Cyrillic）凱爾特語族（英語：Mac OS Celtic）中歐語言克羅地亞文（英語：Mac OS Croatian encoding）西里爾字母（英語：Mac OS Cyrillic encoding）梵文波斯文（英語：MacFarsi encoding）字體X（英語：Macintosh Font X encoding）蓋爾文（英語：Mac OS Gaelic）喬治亞文（英語：Mac OS Georgian）希臘文（英語：MacGreek encoding）古吉拉特文（英語：Mac OS Gujarati）古木基文（英語：Mac OS Gurmukhi）希伯來文（英語：Mac OS Hebrew）冰島文（英語：Mac OS Icelandic encoding）因紐特文（英語：Mac OS Inuit）鍵盤（英語：Mac OS Keyboard encoding）拉丁文（英語：Macintosh Latin encoding）馬爾他文／世界文（英語：Mac OS Maltese/Esperanto encoding）歐甘字母（英語：Mac OS Ogham）羅曼語族羅馬尼亞文（英語：Mac OS Romanian encoding）薩米文（英語：Mac OS Sámi）土耳其文（英語：Mac OS Turkish encoding）土耳其西里爾字母（英語：Mac OS Turkic Cyrillic）烏克蘭文（英語：Mac OS Ukrainian encoding） VT100（英語：VT100 encoding）
DOS代碼頁	437 668（英語：Code page 668） 708（英語：Code page 708） 720（英語：Code page 720） 737（英語：Code page 737） 770（英語：Code page 770） 773（英語：Code page 773） 775（英語：Code page 775） 776（英語：Code page 776） 777（英語：Code page 777） 778（英語：Code page 778） 850（英語：Code page 850） 851（英語：Code page 851） 852（英語：Code page 852） 853（英語：Code page 853） 855（英語：Code page 855） 856（英語：Code page 856） 857（英語：Code page 857） 858（英語：Code page 858） 859（英語：Code page 859） 860（英語：Code page 860） 861（英語：Code page 861） 862（英語：Code page 862） 863（英語：Code page 863） 864（英語：Code page 864） 865（英語：Code page 865） 866（英語：Code page 866） 867（英語：Code page 867） 868（英語：Code page 868） 869（英語：Code page 869） 897（英語：Code page 897） 899（英語：Code page 899） 903（英語：Code page 903） 904（英語：Code page 904） 932（英語：Code page 932 (IBM)） 936（英語：Code page 936 (IBM)） 942（英語：Code page 942） 949（英語：Code page 949 (IBM)） 950 951（英語：Code page 951） 1040（英語：Code page 1040） 1042（英語：Code page 1042） 1043（英語：Code page 1043） 1046（英語：Code page 1046） 1098（英語：Code page 1098） 1115（英語：Code page 1115） 1116（英語：Code page 1116） 1117（英語：Code page 1117） 1118（英語：Code page 1118） 1127（英語：Code page 1127） 3846（英語：Code page 3846） ABICOMP（英語：ABICOMP character set） CS Indic（英語：CS Indic character set） CSX Indic（英語：CSX Indic character set） CSX+ Indic（英語：CSX+ Indic character set） CWI-2（英語：CWI-2）伊朗系統（英語：Iran System encoding）卡梅尼茨（英語：Kamenický encoding）馬索維亞（英語：Mazovia encoding） MIK（英語：MIK (character set)）
IBM AIX代碼頁	895（英語：Code page 895） 896（英語：Code page 896） 912（英語：Code page 912） 915（英語：Code page 915） 921（英語：Code page 921） 922（英語：Code page 922） 1006（英語：Code page 1006） 1008（英語：Code page 1008） 1009（英語：Code page 1009） 1010（英語：Code page 1010） 1012（英語：Code page 1012） 1013（英語：Code page 1013） 1014（英語：Code page 1014） 1015（英語：Code page 1015） 1016（英語：Code page 1016） 1017（英語：Code page 1017） 1018（英語：Code page 1018） 1019（英語：Code page 1019） 1124（英語：Code page 1124） 1133（英語：Code page 1133）
Microsoft Windows代碼頁（英語：Windows code page）	CER-GS（英語：CER-GS） 932（英語：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英語：Code page 1169） Extended Latin-8（英語：Extended Latin-8） 1250（英語：Windows-1250） 1251（英語：Windows-1251） 1252 1253（英語：Windows-1253） 1254（英語：Windows-1254） 1255（英語：Windows-1255） 1256（英語：Windows-1256） 1257（英語：Windows-1257） 1258（英語：Windows-1258） 1270（英語：Windows-1270）西里爾字母+芬蘭文（英語：Windows Cyrillic + Finnish）西里爾字母+法文（英語：Windows Cyrillic + French）西里爾字母+德文（英語：Windows Cyrillic + German）希臘語變音符號（英語：Windows Polytonic Greek）
EBCDIC代碼頁	37（英語：Code page 37） EBCDIC中的日文（英語：Japanese language in EBCDIC） DKOI（英語：DKOI）
DEC終端機（VTx（英語：VT220））	MCS（英語：Multinational Character Set） NRCS（英語：National Replacement Character Set）加拿大法文（英語：Code page 1020）瑞士文（英語：Code page 1021）西班牙文（英語：Code page 1023）英國英文（英語：Code page 1101）荷蘭文（英語：Code page 1102）芬蘭文（英語：Code page 1103）法文（英語：Code page 1104）挪威文／丹麥文（英語：Code page 1105）瑞典文（英語：Code page 1106）挪威文／丹麥文（替代）（英語：Code page 1107） 8位元希臘文（英語：Code page 1287） 8位元土耳其文（英語：Code page 1288） SI 960（英語：SI 960）希伯來文（英語：DEC Hebrew）特殊圖形（英語：DEC Special Graphics）技術（英語：DEC Technical Character Set）
特定平臺	1057（英語：Code page 1057） Acorn（英語：RISC OS character set） Adobe標準（英語：PostScript Standard Encoding） Adobe Latin 1（英語：PostScript Latin 1 Encoding） Amstrad CPC（英語：Amstrad CPC character set） Apple II（英語：Apple II character set）雅達利資訊交換標準碼（英語：ATASCII）雅達利ST（英語：Atari ST character set） BICS（英語：Bitstream International Character Set）卡西歐計算機（英語：Casio calculator character sets） CDC（英語：CDC display code） Compucolor II（英語：Compucolor II character set） CP/M+（英語：Amstrad CP/M Plus character set） DEC RADIX 50（英語：DEC RADIX 50） DEC MCS（英語：Multinational Character Set）/NRCS（英語：National Replacement Character Set） DG國際（英語：DG International） Fieldata（英語：Fieldata） GEM（英語：GEM character set） GSM 03.38（英語：GSM 03.38） HP Roman（英語：HP Roman） HP FOCAL（英語：FOCAL character set） HP RPL（英語：RPL character set） SQUOZE（英語：SQUOZE） LICS（英語：Lotus International Character Set） LMBCS（英語：Lotus Multi-Byte Character Set） MSX（英語：MSX character set） NEC APC（英語：NEC APC character set） NeXT（英語：NeXT character set） PETSCII（英語：PETSCII） SEGA SC-3000（英語：Sega SC-3000 character set）夏普計算機（英語：Sharp pocket computer character sets）夏普MZ（英語：Sharp MZ character set）辛克萊QL（英語：Sinclair QL character set）符號電傳文訊（英語：Teletext character set）德州儀器計算機（英語：TI calculator character sets） TRS-80（英語：TRS-80 character set）文圖拉國際（英語：Ventura International） WISCII（英語：Wang International Standard Code for Information Interchange） XCCS（英語：Xerox Character Code Standard） ZX80（英語：ZX80 character set） ZX81（英語：ZX81 character set） ZX Spectrum（英語：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英語：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英語：Tamil All Character Encoding） Unicode編碼比較（英語：Comparison of Unicode encodings）
TeX排版系統	科克（英語：Cork encoding） LY1（英語：LY1 encoding） OML（英語：OML encoding） OMS（英語：OMS encoding） OT1（英語：OT1 encoding）
其他代碼頁	ABICOMP（英語：ABICOMP character set） ASMO 449（英語：ASMO 449）大五碼 APL符號數位編碼（英語：Digital encoding of APL symbols） ISO-IR-68（英語：ISO-IR-68） ARIB STD-B24 HZ（英語：HZ (character encoding)） IEC-P27-1（英語：IEC-P27-1） INIS 7位元（英語：INIS character set） INIS-8（英語：8位元） ISO-IR-169（英語：ISO-IR-169） ISO 2033（英語：ISO 2033） KOI -R -RU（英語：KOI8-RU） -U 今昔文字鏡 SEASCII（英語：Stanford Extended ASCII） Stanford/ITS（英語：Stanford/ITS character set） TRON（英語：TRON (encoding)）統合韓文代碼（英語：Unified Hangul Code）
控制字符	摩斯電碼專用代碼（英語：Prosigns for Morse code） C0與C1控制字符 ISO/IEC 6429 JIS X 0211（英語：JIS X 0211） Unicode控制字符空白字元
相關條目	CCSID（英語：CCSID） HTML字符編碼字符集探測中日韓統一表意文字硬件代碼頁（英語：Hardware code page）磁性墨水字元識別碼（英語：Magnetic ink character recognition）亂碼中文亂碼可變寬度編碼
字元集