Unicode字符平面映射
目前的 Unicode 字元分為 17 組編排, 每組稱為平面(Plane),而每平面擁有65536(即 216)個代碼點。然而目前只用了少數平面。
| 平面 | 始末字元值 | 中文名稱 | 英文名稱 |
|---|---|---|---|
| 0號平面 | U+0000 - U+FFFF | 基本多文種平面 | Basic Multilingual Plane, 簡稱 BMP |
| 1號平面 | U+10000 - U+1FFFF | 多文種補充平面 | Supplementary Multilingual Plane, 簡稱 SMP |
| 2號平面 | U+20000 - U+2FFFF | 表意文字補充平面 | Supplementary Ideographic Plane, 簡稱 SIP |
| 3號平面 | U+30000 - U+3FFFF | 表意文字第三平面(未正式使用[1]) | Tertiary Ideographic Plane, 簡稱 TIP |
| 4號平面 至 13號平面 |
U+40000 - U+DFFFF | (尚未使用) | |
| 14號平面 | U+E0000 - U+EFFFF | 特別用途補充平面 | Supplementary Special-purpose Plane, 簡稱 SSP |
| 15號平面 | U+F0000 - U+FFFFF | 保留作為私人使用區(A區)[2] | Private Use Area-A, 簡稱 PUA-A |
| 16號平面 | U+100000 - U+10FFFF | 保留作為私人使用區(B區)[2] | Private Use Area-B, 簡稱 PUA-B |
目录 |
基本多文种平面 [编辑]
基本多文种平面(Basic Multilingual Plane, BMP),或称第零平面或零號平面(Plane 0),是Unicode中的一个编码区段。编码从U+0000至U+FFFF。
- 状态
现版本为修订6.1.0版,2012年1月31日出版。已分配编码区段为:
| 编码范围 | 中文名称 | 英语名称 |
|---|---|---|
| 0000-001F | C0控制符 | C0 Controls |
| 0020-007F | 基本拉丁文 | Basic Latin |
| 0080-009F | C1控制符 | C1 Controls |
| 00A0-00FF | 拉丁文补充-1 | Latin 1 Supplement |
| 0100-017F | 拉丁文扩展-A | Latin Extended-A |
| 0180-024F | 拉丁文扩展-B | Latin Extended-B |
| 0250-02AF | 国际音标扩展 | IPA Extensions |
| 02B0-02FF | 占位修饰符号 | Spacing Modifiers |
| 0300-036F | 结合附加符号 | Combining Diacritics Marks |
| 0370-03FF | 希腊字母及科普特字母 | Greek and Coptic |
| 0400-04FF | 西里尔字母 | Cyrillic |
| 0500-052F | 西里尔字母补充 | Cyrillic Supplement |
| 0530-058F | 亚美尼亚字母 | Armenian |
| 0590-05FF | 希伯来文 | Hebrew |
| 0600-06FF | 阿拉伯文 | Arabic |
| 0700-074F | 叙利亚文 | Syriac |
| 0750-077F | 阿拉伯文补充 | Arabic Supplement |
| 0780-07BF | 它拿字母 | Thaana |
| 07C0-07FF | 西非書面語言 | N'Ko |
| 0800-083F | 撒玛利亚字母 | Samaritan |
| 0840-085F | Mandaic | |
| 0860-08FF | 待定 | |
| 0900-097F | 天城文 | Devanagari |
| 0980-09FF | 孟加拉文 | Bengali |
| 0A00-0A7F | 果鲁穆奇字母 | Gurmukhi |
| 0A80-0AFF | 古吉拉特文 | Gujarati |
| 0B00-0B7F | 奥里亚文 | Oriya |
| 0B80-0BFF | 泰米尔文 | Tamil |
| 0C00-0C7F | 泰卢固文 | Telugu |
| 0C80-0CFF | 卡纳达文 | Kannada |
| 0D00-0D7F | 马拉雅拉姆文 | Malayalam |
| 0D80-0DFF | 僧伽罗文 | Sinhala |
| 0E00-0E7F | 泰文 | Thai |
| 0E80-0EFF | 老挝文 | Lao |
| 0F00-0FFF | 藏文 | Tibetan |
| 1000-109F | 缅甸文 | Myanmar |
| 10A0-10FF | 格鲁吉亚字母 | Georgian |
| 1100-11FF | 諺文字母 | Hangul Jamo |
| 1200-137F | 埃塞俄比亚语 | Ethiopic |
| 1380-139F | 埃塞俄比亚语补充 | Ethiopic Supplement |
| 13A0-13FF | 切罗基字母 | Cherokee |
| 1400-167F | 统一加拿大土著语音节 | Unified Canadian Aboriginal Syllabics |
| 1680-169F | 欧甘字母 | Ogham |
| 16A0-16FF | 卢恩字母 | Runic |
| 1700-171F | 他加禄字母 | Tagalog |
| 1720-173F | 哈努诺文 | Hanunóo |
| 1740-175F | 布迪文 | Buhid |
| 1760-177F | 塔格巴努亚文 | Tagbanwa |
| 1780-17FF | 高棉文 | Khmer |
| 1800-18AF | 蒙古文 | Mongolian |
| 18B0-18FF | 加拿大原住民音節文字扩展 | Unified Canadian Aboriginal Syllabics Extended |
| 1900-194F | 林布文 | Limbu |
| 1950-197F | 德宏傣文 | Tai Le |
| 1980-19DF | 新傣仂文 | New Tai Lue |
| 19E0-19FF | 高棉文符号 | Khmer Symbols |
| 1A00-1A1F | 布吉文 | Buginese |
| 1A20-1AAF | 老傣文 | Tai Tham |
| 1AB0-1AFF | 待定 | |
| 1B00-1B7F | 巴厘字母 | Balinese |
| 1B80-1BBF | 巽他字母 | Sundanese |
| 1BC0-1BFF | 巴塔克文 | Batak |
| 1C00-1C4F | 雷布查字母 | Lepcha |
| 1C50-1C7F | Ol Chiki | |
| 1C80-1CBF | 待定 | |
| 1CC0-1CCF | 巽他字母补充 | Sudanese Supplement |
| 1CD0-1CFF | 吠陀梵文 | Vedic Extensions |
| 1D00-1D7F | 语音学扩展 | Phonetic Extensions |
| 1D80-1DBF | 语音学扩展补充 | Phonetic Extensions Supplement |
| 1DC0-1DFF | 结合附加符号补充 | Combining Diacritics Marks Supplement |
| 1E00-1EFF | 拉丁文扩展附加 | Latin Extended Additional |
| 1F00-1FFF | 希腊语扩展 | Greek Extended |
| 2000-206F | 常用标点 | General Punctuation |
| 2070-209F | 上标及下标 | Superscripts and Subscripts |
| 20A0-20CF | 货币符号 | Currency Symbols |
| 20D0-20FF | 组合用记号 | Combining Diacritics Marks for Symbols |
| 2100-214F | 字母式符号 | Letterlike Symbols |
| 2150-218F | 数字形式 | Number Form |
| 2190-21FF | 箭头 | Arrows |
| 2200-22FF | 数学运算符 | Mathematical Operator |
| 2300-23FF | 杂项工业符号 | Miscellaneous Technical |
| 2400-243F | 控制图片 | Control Pictures |
| 2440-245F | 光学识别符 | Optical Character Recognition |
| 2460-24FF | 封闭式字母数字 | Enclosed Alphanumerics |
| 2500-257F | 制表符 | Box Drawing |
| 2580-259F | 方块元素 | Block Element |
| 25A0-25FF | 几何图形 | Geometric Shapes |
| 2600-26FF | 杂项符号 | Miscellaneous Symbols |
| 2700-27BF | 印刷符号 | Dingbats |
| 27C0-27EF | 杂项数学符号-A | Miscellaneous Mathematical Symbols-A |
| 27F0-27FF | 追加箭头-A | Supplemental Arrows-A |
| 2800-28FF | 盲文点字模型 | Braille Patterns |
| 2900-297F | 追加箭头-B | Supplemental Arrows-B |
| 2980-29FF | 杂项数学符号-B | Miscellaneous Mathematical Symbols-B |
| 2A00-2AFF | 追加数学运算符 | Supplemental Mathematical Operator |
| 2B00-2BFF | 杂项符号和箭头 | Miscellaneous Symbols and Arrows |
| 2C00-2C5F | 格拉哥里字母 | Glagolitic |
| 2C60-2C7F | 拉丁文扩展-C | Latin Extended-C |
| 2C80-2CFF | 科普特字母 | Coptic |
| 2D00-2D2F | 格鲁吉亚字母补充 | Georgian Supplement |
| 2D30-2D7F | 提非纳文 | Tifinagh |
| 2D80-2DDF | 埃塞俄比亚语扩展 | Ethiopic Extended |
| 2E00-2E7F | 追加标点 | Supplemental Punctuation |
| 2E80-2EFF | 中日韩部首补充 | CJK Radicals Supplement |
| 2F00-2FDF | 康熙部首 | Kangxi Radicals |
| 2FF0-2FFF | 表意文字描述符 | Ideographic Description Characters |
| 3000-303F | 中日韩符号和标点 | CJK Symbols and Punctuation |
| 3040-309F | 日文平假名 | Hiragana |
| 30A0-30FF | 日文片假名 | Katakana |
| 3100-312F | 注音字母 | Bopomofo |
| 3130-318F | 谚文兼容字母 | Hangul Compatibility Jamo |
| 3190-319F | 象形字注释标志 | Kanbun |
| 31A0-31BF | 注音字母扩展 | Bopomofo Extended |
| 31C0-31EF | 中日韩笔画 | CJK Strokes |
| 31F0-31FF | 日文片假名语音扩展 | Katakana Phonetic Extensions |
| 3200-32FF | 带圈中日韩字母和月份 | Enclosed CJK Letters and Months |
| 3300-33FF | 中日韩兼容 | CJK Compatibility |
| 3400-4DBF | 中日韩统一表意文字扩展A | CJK Unified Ideographs Extension A |
| 4DC0-4DFF | 易经六十四卦符号 | Yijing Hexagrams Symbols |
| 4E00-9FFF | 中日韩统一表意文字 | CJK Unified Ideographs |
| A000-A48F | 彝文音节 | Yi Syllables |
| A490-A4CF | 彝文字根 | Yi Radicals |
| A4D0-A4FF | 老傈僳文 | Lisu |
| A500-A63F | 瓦伊语 | Vai |
| A640-A69F | 西里尔字母扩展-B | Cyrillic Extended-B |
| A6A0-A6FF | 巴姆穆语 | Bamum |
| A700-A71F | 声调修饰字母 | Modifier Tone Letters |
| A720-A7FF | 拉丁文扩展-D | Latin Extended-D |
| A800-A82F | 锡尔赫特文 | Syloti Nagri |
| A830-A83F | Ind. No. | |
| A840-A87F | 八思巴字 | Phags-pa |
| A880-A8DF | 索拉什特拉 | Saurashtra |
| A8E0-A8FF | Deva. Ext. | |
| A900-A92F | 克耶字母 | Kayah Li |
| A930-A95F | 勒姜语 | Rejang |
| A980-A9DF | 爪哇语 | Javanese |
| A9E0-A9FF | 待定 | |
| AA00-AA5F | 鞑靼文 | Cham |
| AA60-AA7F | 缅甸语扩展 | Myanmar ExtA |
| AA80-AADF | 越南傣文 | Tai Viet |
| AAE0-AAFF | 曼尼普尔文扩展 | Meetei Ext |
| AB00-AB2F | 埃塞俄比亚文 | Ethiopic Ext-A |
| AB30-ABBF | 待定 | |
| ABC0-ABFF | Meetei Mayek | |
| AC00-D7AF | 谚文音节 | Hangul Syllables |
| D7B0-D7FF | 谚文字母扩展-B | Hangul Jamo Extended-B |
| D800-DBFF | High-half zone of UTF-16 | |
| DC00-DFFF | Low-half zone of UTF-16 | |
| E000-F8FF | 自行使用區域 | Private Use Zone |
| F900-FAFF | 中日韩兼容表意文字 | CJK Compatibility Ideographs |
| FB00-FB4F | 字母表達形式(拉丁字母连字、亚美尼亚字母连字、希伯来文表现形式) | Alphabetic Presentation Forms |
| FB50-FDFF[3] | 阿拉伯文表達形式A | Arabic Presentation Forms A |
| FE00-FE0F | 異體字选择符 | Variation Selector |
| FE10-FE1F | 竖排形式 | Vertical Forms |
| FE20-FE2F | 组合用半符号 | Combining Half Marks |
| FE30-FE4F | 中日韩兼容形式 | CJK Compatibility Forms |
| FE50-FE6F | 小寫变体形式 | Small Form Variants |
| FE70-FEFF | 阿拉伯文表達形式B | Arabic Presentation Forms B |
| FF00-FFEF | 半形及全形 | Halfwidth and Fullwidth Forms |
| FFF0-FFFF | 特殊 | Specials |
第一輔助平面 [编辑]
第一輔助平面又稱多文種補充平面(Supplementary Multilingual Plane,縮寫SMP,或簡稱Plane 1),擺放拼音文字(主要為現時已不再使用的文字)和音符等符號。範圍在U+10000~U+1FFFD。计划分配如下。
| 编码范围 | 中文名称 | 英语名称 |
|---|---|---|
| 10000-100FF | 线形文字B | Linear B |
| 10100-101CF | 古代记数系统 | Ancient numeric systems |
| 101D0-107FF | 从左向右书写的音素和音节文字和符号集 | Alphabetic and syllabic LTR scripts and sets of symbols |
| 10800-10FFF | 从右向左书写的音素和音节文字 | Alphabetic and syllabic RTL scripts |
| 11000-11FFF | 婆罗米文字 | Brahmic scripts |
| 12000-12FFF | 楔形文字和其他古代文字 | Cuneiform and other ancient scripts |
| 13000-15BFF | 埃及和玛雅圣书体 | Egyptian and Maya hieroglyphs |
| 15C00-15FFF | 阿兹台克象形文字 | Aztec pictograms |
| 16000-16FFF | 新创文字 | Recently-devised scripts |
| 17000-1B5FF | 亚洲大文字 | Large Asian scripts |
| 1B600-1BFFF | 未分配 | unassigned |
| 1C000-1CDFF | 米格马赫圣书体 | Micmac hieroglyphs |
| 1CE00-1CFFF | 原始埃兰文字 | Proto-Elamite |
| 1D000-1DFFF | 记号系统 | Notational systems |
| 1E000-1E7FF | 未分配 | unassigned |
| 1E800-1EFFF | 从右向左书写的文字 | RTL scripts |
| 1F000-1F0FF | 游戏符号 | Game symbols |
| 1F100-1F2FF | 字母数字和表意字符集 | Alphanumeric and ideographic sets |
| 1F300-1F7FF | 象形字符集 | Pictographic sets |
| 1F800-1FFFD | 未分配 | unassigned |
以下是它們的編碼表。
第二輔助平面 [编辑]
第二輔助平面又稱為表意文字補充平面(Supplementary Ideographic Plane,縮寫SIP,或簡稱Plane 2),整個範圍在 U+20000~U+2FFFD。整個平面配置的都是一些罕用的汉字或地區的方言用字,如粵語用字及越南語的字喃。現時擺放了「中日韓統一表意文字擴展B區」(4萬3253個汉字)、「中日韓統一表意文字擴展C區」(4149個汉字)、「中日韓統一表意文字擴展D區」(222個汉字)以及中日韓兼容表意文字增補(CJK Compatibility Ideographs Supplement)。預計「中日韓統一表意文字擴展E區」也會使用此平面。
已分配和計劃分配的編碼區段為:
- U+20000-U+2A6DF:中日韓統一表意文字擴展B區
- U+2A700-U+2B73F:中日韓統一表意文字擴展C區
- U+2B740-U+2B81F:中日韓統一表意文字擴展D區
- U+2B820-U+2????:中日韓統一表意文字擴展E區
- 還在草擬階段。
- U+2F800-U+2FA1F:中日韓兼容表意文字增補
以下是其編碼表。
- 20000-20FFF - 21000-21FFF - 22000-22FFF - 23000-23FFF - 24000-24FFF - 25000-25FFF - 26000-26FFF - 27000-27FFF - 28000-28FFF - 29000-29FFF - 2A000-2AFFF - 2F000-2FFFF
第三至十三輔助平面 [编辑]
第三輔助平面尚未使用,但打算用來擺放甲骨文、金文、小篆、中國戰國時期文字等。 計劃分配的編碼區段為:
- U+30000-U+317FF:甲骨文
- U+32000-U+32FFF:金文
- U+34000-U+368FF:小篆
第四至第十三輔助平面並未計劃使用。
第十四輔助平面 [编辑]
第十四輔助平面又稱特別用途補充平面(Supplementary Special-purpose Plane,簡稱SSP),擺放「語言編碼標籤」和「字形變換選取器」,它們都是控制字符。範圍在U+E0000~U+E01FF。
編碼表詳見E0000-E0FFF。
第十五至十六輔助平面 [编辑]
第十五至十六輔助平面都是私人使用區。它們的範圍是U+F0000~U+FFFFD 及U+100000~U+10FFFD.
參見 [编辑]
注记 [编辑]
- ^ TIP Roadmap
- ^ 2.0 2.1 最初的「私人使用區」(Private Use Area, 簡稱 PUA)位於 U+E000 至 U+F8FF
- ^ 其中FDD0-FDEF段为“非字符”(Noncharacter)。
外部链接 [编辑]
| Unicode 相關條目 |
|---|
| Unicode字符列表 | Unicode聯盟 | Unicode技術委員會 | ISO 10646(通用字符集) | UTF-7 | UTF-8 | UTF-16 / UCS-2 | UTF-32 / UCS-4 |
| Unicode字符平面映射 | 中日韓越統一表意文字 | CJKV | 表意文字小組(IRG) | IICore | 完整Unicode編碼表 |