Unicode字符平面映射

维基百科,自由的百科全书
跳转至: 导航搜索

目前的Unicode字元分為17組編排,每組稱為平面(Plane),而每平面擁有65536(即216)個代碼點。然而目前只用了少數平面。

平面 始末字元值 中文名稱 英文名稱
0號平面 U+0000 - U+FFFF 基本多文種平面 Basic Multilingual Plane,簡稱BMP
1號平面 U+10000 - U+1FFFF 多文種補充平面 Supplementary Multilingual Plane,簡稱SMP
2號平面 U+20000 - U+2FFFF 表意文字補充平面 Supplementary Ideographic Plane,簡稱SIP
3號平面 U+30000 - U+3FFFF 表意文字第三平面(未正式使用[1] Tertiary Ideographic Plane,簡稱TIP
4號平面

13號平面
U+40000 - U+DFFFF (尚未使用)
14號平面 U+E0000 - U+EFFFF 特別用途補充平面 Supplementary Special-purpose Plane,簡稱SSP
15號平面 U+F0000 - U+FFFFF 保留作為私人使用區(A區)[2] Private Use Area-A,簡稱PUA-A
16號平面 U+100000 - U+10FFFF 保留作為私人使用區(B區)[2] Private Use Area-B,簡稱PUA-B

要有更詳細的描述,請參閱:基本多文種平面補充平面

基本多文种平面[编辑]

基本多文种平面(Basic Multilingual Plane, BMP),或称第零平面零號平面(Plane 0),是Unicode中的一个编码区段。编码从U+0000至U+FFFF。

Unicode基本多文種平面的示意圖。每個寫著數字的格子代表256個碼點。
Roadmap to Unicode BMP-zh.svg
状态

现版本为修订6.1.0版,2012年1月31日出版。已分配编码区段为:

编码范围 中文名称 英语名称
0000-001F C0控制符 C0 Controls
0020-007F 基本拉丁文 Basic Latin
0080-009F C1控制符 C1 Controls
00A0-00FF 拉丁文补充-1 Latin 1 Supplement
0100-017F 拉丁文扩展-A Latin Extended-A
0180-024F 拉丁文扩展-B Latin Extended-B
0250-02AF 国际音标扩展 IPA Extensions
02B0-02FF 占位修饰符号 Spacing Modifiers
0300-036F 结合附加符号 Combining Diacritics Marks
0370-03FF 希腊字母科普特字母 Greek and Coptic
0400-04FF 西里尔字母 Cyrillic
0500-052F 西里尔字母补充 Cyrillic Supplement
0530-058F 亚美尼亚字母 Armenian
0590-05FF 希伯来文 Hebrew
0600-06FF 阿拉伯文 Arabic
0700-074F 叙利亚文 Syriac
0750-077F 阿拉伯文补充 Arabic Supplement
0780-07BF 它拿字母 Thaana
07C0-07FF 西非書面語言 N'Ko
0800-083F 撒玛利亚字母 Samaritan
0840-085F 曼达语 Mandaic
0860-08FF 待定
0900-097F 天城文 Devanagari
0980-09FF 孟加拉文 Bengali
0A00-0A7F 果鲁穆奇字母 Gurmukhi
0A80-0AFF 古吉拉特文 Gujarati
0B00-0B7F 奥里亚文 Oriya
0B80-0BFF 泰米尔文 Tamil
0C00-0C7F 泰卢固文 Telugu
0C80-0CFF 卡纳达文 Kannada
0D00-0D7F 马拉雅拉姆文 Malayalam
0D80-0DFF 僧伽罗文 Sinhala
0E00-0E7F 泰文 Thai
0E80-0EFF 老挝文 Lao
0F00-0FFF 藏文 Tibetan
1000-109F 缅甸文 Myanmar
10A0-10FF 格鲁吉亚字母 Georgian
1100-11FF 諺文字母 Hangul Jamo
1200-137F 埃塞俄比亚语 Ethiopic
1380-139F 埃塞俄比亚语补充 Ethiopic Supplement
13A0-13FF 切罗基字母 Cherokee
1400-167F 统一加拿大土著语音节 Unified Canadian Aboriginal Syllabics
1680-169F 欧甘字母 Ogham
16A0-16FF 卢恩字母 Runic
1700-171F 他加禄字母 Tagalog
1720-173F 哈努诺文 Hanunóo
1740-175F 布迪文 Buhid
1760-177F 塔格巴努亚文 Tagbanwa
1780-17FF 高棉文 Khmer
1800-18AF 蒙古文 Mongolian
18B0-18FF 加拿大原住民音節文字扩展 Unified Canadian Aboriginal Syllabics Extended
1900-194F 林布文 Limbu
1950-197F 德宏傣文 Tai Le
1980-19DF 新傣仂文 New Tai Lue
19E0-19FF 高棉文符号 Khmer Symbols
1A00-1A1F 布吉文 Buginese
1A20-1AAF 老傣文 Tai Tham
1AB0-1AFF 待定
1B00-1B7F 巴厘字母 Balinese
1B80-1BBF 巽他字母 Sundanese
1BC0-1BFF 巴塔克文 Batak
1C00-1C4F 雷布查字母 Lepcha
1C50-1C7F 桑塔利文 Ol Chiki
1C80-1CBF 待定
1CC0-1CCF 巽他字母补充 Sudanese Supplement
1CD0-1CFF 吠陀梵文 Vedic Extensions
1D00-1D7F 语音学扩展 Phonetic Extensions
1D80-1DBF 语音学扩展补充 Phonetic Extensions Supplement
1DC0-1DFF 结合附加符号补充 Combining Diacritics Marks Supplement
1E00-1EFF 拉丁文扩展附加 Latin Extended Additional
1F00-1FFF 希腊语扩展 Greek Extended
2000-206F 常用标点 General Punctuation
2070-209F 上标及下标 Superscripts and Subscripts
20A0-20CF 货币符号 Currency Symbols
20D0-20FF 组合用记号 Combining Diacritics Marks for Symbols
2100-214F 字母式符号 Letterlike Symbols
2150-218F 数字形式 Number Form
2190-21FF 箭头 Arrows
2200-22FF 数学运算符 Mathematical Operator
2300-23FF 杂项工业符号 Miscellaneous Technical
2400-243F 控制图片 Control Pictures
2440-245F 光学识别符 Optical Character Recognition
2460-24FF 封闭式字母数字 Enclosed Alphanumerics
2500-257F 制表符 Box Drawing
2580-259F 方块元素 Block Element
25A0-25FF 几何图形 Geometric Shapes
2600-26FF 杂项符号 Miscellaneous Symbols
2700-27BF 印刷符号 Dingbats
27C0-27EF 杂项数学符号-A Miscellaneous Mathematical Symbols-A
27F0-27FF 追加箭头-A Supplemental Arrows-A
2800-28FF 盲文点字模型 Braille Patterns
2900-297F 追加箭头-B Supplemental Arrows-B
2980-29FF 杂项数学符号-B Miscellaneous Mathematical Symbols-B
2A00-2AFF 追加数学运算符 Supplemental Mathematical Operator
2B00-2BFF 杂项符号和箭头 Miscellaneous Symbols and Arrows
2C00-2C5F 格拉哥里字母 Glagolitic
2C60-2C7F 拉丁文扩展-C Latin Extended-C
2C80-2CFF 科普特字母 Coptic
2D00-2D2F 格鲁吉亚字母补充 Georgian Supplement
2D30-2D7F 提非纳文 Tifinagh
2D80-2DDF 埃塞俄比亚语扩展 Ethiopic Extended
2E00-2E7F 追加标点 Supplemental Punctuation
2E80-2EFF 中日韩部首补充 CJK Radicals Supplement
2F00-2FDF 康熙部首 Kangxi Radicals
2FF0-2FFF 表意文字描述符 Ideographic Description Characters
3000-303F 中日韩符号和标点 CJK Symbols and Punctuation
3040-309F 日文平假名 Hiragana
30A0-30FF 日文片假名 Katakana
3100-312F 注音字母 Bopomofo
3130-318F 谚文兼容字母 Hangul Compatibility Jamo
3190-319F 象形字注释标志 Kanbun
31A0-31BF 注音字母扩展 Bopomofo Extended
31C0-31EF 中日韩笔画 CJK Strokes
31F0-31FF 日文片假名语音扩展 Katakana Phonetic Extensions
3200-32FF 带圈中日韩字母和月份 Enclosed CJK Letters and Months
3300-33FF 中日韩兼容 CJK Compatibility
3400-4DBF 中日韩统一表意文字扩展A CJK Unified Ideographs Extension A
4DC0-4DFF 易经六十四卦符号 Yijing Hexagrams Symbols
4E00-9FFF 中日韩统一表意文字 CJK Unified Ideographs
A000-A48F 彝文音节 Yi Syllables
A490-A4CF 彝文字根 Yi Radicals
A4D0-A4FF 老傈僳文 Lisu
A500-A63F 瓦伊语 Vai
A640-A69F 西里尔字母扩展-B Cyrillic Extended-B
A6A0-A6FF 巴姆穆语 Bamum
A700-A71F 声调修饰字母 Modifier Tone Letters
A720-A7FF 拉丁文扩展-D Latin Extended-D
A800-A82F 锡尔赫特文 Syloti Nagri
A830-A83F Ind. No.
A840-A87F 八思巴字 Phags-pa
A880-A8DF 索拉什特拉 Saurashtra
A8E0-A8FF Deva. Ext.
A900-A92F 克耶字母 Kayah Li
A930-A95F 勒姜语 Rejang
A980-A9DF 爪哇语 Javanese
A9E0-A9FF 待定
AA00-AA5F 占语字母 Cham
AA60-AA7F 缅甸语扩展 Myanmar ExtA
AA80-AADF 越南傣文 Tai Viet
AAE0-AAFF 曼尼普尔文扩展 Meetei Ext
AB00-AB2F 埃塞俄比亚文 Ethiopic Ext-A
AB30-ABBF 待定
ABC0-ABFF Meetei Mayek
AC00-D7AF 谚文音节 Hangul Syllables
D7B0-D7FF 谚文字母扩展-B Hangul Jamo Extended-B
D800-DBFF High-half zone of UTF-16
DC00-DFFF Low-half zone of UTF-16
E000-F8FF 自行使用區域 Private Use Zone
F900-FAFF 中日韩兼容表意文字 CJK Compatibility Ideographs
FB00-FB4F 字母表達形式(拉丁字母连字亚美尼亚字母连字、希伯来文表现形式) Alphabetic Presentation Forms
FB50-FDFF[3] 阿拉伯文表達形式A Arabic Presentation Forms A
FE00-FE0F 異體字选择符 Variation Selector
FE10-FE1F 竖排形式 Vertical Forms
FE20-FE2F 组合用半符号 Combining Half Marks
FE30-FE4F 中日韩兼容形式 CJK Compatibility Forms
FE50-FE6F 小寫变体形式 Small Form Variants
FE70-FEFF 阿拉伯文表達形式B Arabic Presentation Forms B
FF00-FFEF 半形全形 Halfwidth and Fullwidth Forms
FFF0-FFFF 特殊 Specials

第一輔助平面[编辑]

第一輔助平面又稱多文種補充平面Supplementary Multilingual Plane,縮寫SMP,或簡稱Plane 1),擺放拼音文字(主要為現時已不再使用的古老文字)和音符等符號。用于学者的专业论文中使用这些古老或过时的语言书写符号。範圍在U+10000~U+1FFFD。计划分配如下。

编码范围 中文名称 英语名称
10000-100FF 线形文字B Linear B
10100-101CF 古代记数系统 Ancient numeric systems
101D0-107FF 从左向右书写的音素和音节文字和符号集 Alphabetic and syllabic LTR scripts and sets of symbols
10800-10FFF 从右向左书写的音素和音节文字 Alphabetic and syllabic RTL scripts
11000-11FFF 婆罗米文字 Brahmic scripts
12000-12FFF 楔形文字和其他古代文字 Cuneiform and other ancient scripts
13000-15BFF 埃及和玛雅圣书体 Egyptian and Maya hieroglyphs
15C00-15FFF 阿兹台克象形文字 Aztec pictograms
16000-16FFF 新创文字 Recently-devised scripts
17000-1B5FF 亚洲大文字 Large Asian scripts
1B600-1BFFF 未分配 unassigned
1C000-1CDFF 米格马赫圣书体 Micmac hieroglyphs
1CE00-1CFFF 原始埃兰文字 Proto-Elamite
1D000-1DFFF 记号系统 Notational systems
1E000-1E7FF 未分配 unassigned
1E800-1EFFF 从右向左书写的文字 RTL scripts
1F000-1F0FF 游戏符号 Game symbols
1F100-1F2FF 字母数字和表意字符集 Alphanumeric and ideographic sets
1F300-1F7FF 象形字符集 Pictographic sets
1F800-1FFFD 未分配 unassigned

以下是它們的編碼表。

第二輔助平面[编辑]

第二輔助平面又稱為表意文字補充平面Supplementary Ideographic Plane,縮寫SIP,或簡稱Plane 2),整個範圍在U+20000~U+2FFFD。整個平面配置的都是一些罕用的汉字或地區的方言用字,如粵語用字及越南語字喃。現時擺放了「中日韓統一表意文字擴展B區」(4萬3253個汉字)、「中日韓統一表意文字擴展C區」(4149個汉字)、「中日韓統一表意文字擴展D區」(222個汉字)以及中日韓兼容表意文字增補(CJK Compatibility Ideographs Supplement)。預計「中日韓統一表意文字擴展E區」也會使用此平面。

已分配和計劃分配的編碼區段為:

  • U+20000-U+2A6DF:中日韓統一表意文字擴展B區
  • U+2A700-U+2B73F:中日韓統一表意文字擴展C區
  • U+2B740-U+2B81F:中日韓統一表意文字擴展D區
  • U+2B820-U+2F7FF:中日韓統一表意文字擴展E區(還在草擬階段)
  • U+2F800-U+2FA1F:中日韓兼容表意文字增補

以下是其編碼表。

第三至十三輔助平面[编辑]

第三輔助平面尚未使用,但打算用來擺放甲骨文金文小篆中國戰國時期文字等。 計劃分配的編碼區段為:

  • U+30000-U+317FF:甲骨文
  • U+32000-U+32FFF:金文
  • U+34000-U+368FF:小篆

第四至第十三輔助平面並未計劃使用。

第十四輔助平面[编辑]

第十四輔助平面又稱特別用途補充平面Supplementary Special-purpose Plane,簡稱SSP),擺放「語言編碼標籤」和「字形變換選取器」,它們都是控制字符。範圍在U+E0000~U+E01FF。

編碼表詳見E0000-E0FFF

第十五至十六輔助平面[编辑]

第十五至十六輔助平面都是私人使用區。它們的範圍是U+F0000~U+FFFFD及U+100000~U+10FFFD.

參見[编辑]

注记[编辑]

  1. ^ TIP Roadmap
  2. ^ 2.0 2.1 最初的「私人使用區」(Private Use Area,簡稱PUA)位於U+E000至U+F8FF
  3. ^ 其中FDD0-FDEF段为“非字符”(Noncharacter)。

外部链接[编辑]