本页使用了标题或全文手工转换

Unicode字符平面映射

维基百科,自由的百科全书
跳转至: 导航搜索

目前的Unicode字元分為17組編排,每組稱為平面(Plane),而每平面擁有65536(即216)個代碼點。然而目前只用了少數平面。

平面 始末字元值 中文名稱 英文名稱
0號平面 U+0000 - U+FFFF 基本多文種平面 Basic Multilingual Plane,簡稱BMP
1號平面 U+10000 - U+1FFFF 多文種補充平面 Supplementary Multilingual Plane,簡稱SMP
2號平面 U+20000 - U+2FFFF 表意文字補充平面 Supplementary Ideographic Plane,簡稱SIP
3號平面 U+30000 - U+3FFFF 表意文字第三平面(未正式使用[1] Tertiary Ideographic Plane,簡稱TIP
4號平面

13號平面
U+40000 - U+DFFFF (尚未使用)
14號平面 U+E0000 - U+EFFFF 特別用途補充平面 Supplementary Special-purpose Plane,簡稱SSP
15號平面 U+F0000 - U+FFFFF 保留作為私人使用區(A區)[2] Private Use Area-A,簡稱PUA-A
16號平面 U+100000 - U+10FFFF 保留作為私人使用區(B區)[2] Private Use Area-B,簡稱PUA-B

要有更詳細的描述,請參閱:基本多文種平面補充平面

基本多文种平面[编辑]

基本多文种平面(Basic Multilingual Plane, BMP),或称第0平面0號平面(Plane 0),是Unicode中的一个编码区段。编码从U+0000至U+FFFF。

Unicode基本多文種平面的示意圖。每個寫著數字的格子代表256個碼點。
Roadmap to Unicode BMP-zh.svg
状态

现版本为修订7.0.0版,2014年6月16日出版。已分配编码区段为:

编码范围 中文名称 英语名称
0000-001F C0控制符 C0 Controls
0020-007F 基本拉丁文 Basic Latin
0080-009F C1控制符 C1 Controls
00A0-00FF 拉丁文补充-1 Latin-1 Supplement
0100-017F 拉丁文扩展-A Latin Extended-A
0180-024F 拉丁文扩展-B Latin Extended-B
0250-02AF 国际音标扩展 IPA Extensions
02B0-02FF 占位修饰符号 Spacing Modifier Letters
0300-036F 结合附加符号 Combining Diacritics Marks
0370-03FF 希腊字母科普特字母 Greek and Coptic
0400-04FF 西里尔字母 Cyrillic
0500-052F 西里尔字母补充 Cyrillic Supplement
0530-058F 亚美尼亚字母 Armenian
0590-05FF 希伯来文 Hebrew
0600-06FF 阿拉伯文 Arabic
0700-074F 叙利亚文 Syriac
0750-077F 阿拉伯文补充 Arabic Supplement
0780-07BF 它拿字母 Thaana
07C0-07FF 西非書面語言 N'Ko
0800-083F 撒玛利亚字母 Samaritan
0840-085F 曼达语 Mandaic
0860-08FF 阿拉伯文扩展-A Arabic Extended-A
0900-097F 天城文 Devanagari
0980-09FF 孟加拉文 Bengali
0A00-0A7F 果鲁穆奇字母 Gurmukhi
0A80-0AFF 古吉拉特文 Gujarati
0B00-0B7F 奥里亚文 Oriya
0B80-0BFF 泰米尔文 Tamil
0C00-0C7F 泰卢固文 Telugu
0C80-0CFF 卡纳达文 Kannada
0D00-0D7F 马拉雅拉姆文 Malayalam
0D80-0DFF 僧伽罗文 Sinhala
0E00-0E7F 泰文 Thai
0E80-0EFF 老挝文 Lao
0F00-0FFF 藏文 Tibetan
1000-109F 缅甸文 Myanmar
10A0-10FF 格鲁吉亚字母 Georgian
1100-11FF 諺文字母 Hangul Jamo
1200-137F 吉兹字母 Ethiopic
1380-139F 吉兹字母补充 Ethiopic Supplement
13A0-13FF 切罗基字母 Cherokee
1400-167F 统一加拿大原住民音節文字 Unified Canadian Aboriginal Syllabics
1680-169F 欧甘字母 Ogham
16A0-16FF 卢恩字母 Runic
1700-171F 他加禄字母 Tagalog
1720-173F 哈努诺文 Hanunóo
1740-175F 布希德文 Buhid
1760-177F 塔格巴努亚文 Tagbanwa
1780-17FF 高棉文 Khmer
1800-18AF 蒙古文 Mongolian
18B0-18FF 加拿大原住民音節文字扩展 Unified Canadian Aboriginal Syllabics Extended
1900-194F 林布文 Limbu
1950-197F 德宏傣文 Tai Le
1980-19DF 新傣仂文 New Tai Lue
19E0-19FF 高棉文符号 Khmer Symbols
1A00-1A1F 布吉文 Buginese
1A20-1AAF 老傣文 Tai Tham
1AB0-1AFF 组合变音标记扩展 Combining Diacritical Marks Extended
1B00-1B7F 巴厘字母 Balinese
1B80-1BBF 巽他字母 Sundanese
1BC0-1BFF 巴塔克文 Batak
1C00-1C4F 雷布查字母 Lepcha
1C50-1C7F 桑塔利文 Ol Chiki
1C80-1CBF 待定
1CC0-1CCF 巽他字母补充 Sudanese Supplement
1CD0-1CFF 梵文吠陀扩展 Vedic Extensions
1D00-1D7F 音标扩展 Phonetic Extensions
1D80-1DBF 音标扩展补充 Phonetic Extensions Supplement
1DC0-1DFF 结合附加符号补充 Combining Diacritics Marks Supplement
1E00-1EFF 拉丁文扩展附加 Latin Extended Additional
1F00-1FFF 希腊语扩展 Greek Extended
2000-206F 常用标点 General Punctuation
2070-209F 上标下标 Superscripts and Subscripts
20A0-20CF 货币符号 Currency Symbols
20D0-20FF 组合用记号 Combining Diacritics Marks for Symbols
2100-214F 字母式符号 Letterlike Symbols
2150-218F 数字形式 Number Forms
2190-21FF 箭头 Arrows
2200-22FF 数学运算符 Mathematical Operators
2300-23FF 杂项工业符号 Miscellaneous Technical
2400-243F 控制图片 Control Pictures
2440-245F 光学识别符 Optical Character Recognition
2460-24FF 封闭式字母和数字 Enclosed Alphanumerics
2500-257F 制表符 Box Drawing
2580-259F 方块元素 Block Elements
25A0-25FF 几何图形 Geometric Shapes
2600-26FF 杂项符号 Miscellaneous Symbols
2700-27BF 标志装饰符号 Dingbats
27C0-27EF 杂项数学符号-A Miscellaneous Mathematical Symbols-A
27F0-27FF 追加箭头-A Supplemental Arrows-A
2800-28FF 盲文点字模型 Braille Patterns
2900-297F 追加箭头-B Supplemental Arrows-B
2980-29FF 杂项数学符号-B Miscellaneous Mathematical Symbols-B
2A00-2AFF 追加数学运算符 Supplemental Mathematical Operator
2B00-2BFF 杂项符号和箭头 Miscellaneous Symbols and Arrows
2C00-2C5F 格拉哥里字母 Glagolitic
2C60-2C7F 拉丁文扩展-C Latin Extended-C
2C80-2CFF 科普特字母 Coptic
2D00-2D2F 格鲁吉亚字母补充 Georgian Supplement
2D30-2D7F 提非纳文 Tifinagh
2D80-2DDF 吉兹字母扩展 Ethiopic Extended
2DE0-2DFF 西里尔字母扩展-A Cyrillic Extended-A
2E00-2E7F 追加标点 Supplemental Punctuation
2E80-2EFF 中日韩汉字部首补充 CJK Radicals Supplement
2F00-2FDF 康熙部首 Kangxi Radicals
2FF0-2FFF 表意符号说明 Ideographic Description Characters
3000-303F 中日韩符号和标点 CJK Symbols and Punctuation
3040-309F 日文平假名 Hiragana
30A0-30FF 日文片假名 Katakana
3100-312F 注音字母 Bopomofo
3130-318F 谚文兼容字母 Hangul Compatibility Jamo
3190-319F 汉文注释标志 Kanbun
31A0-31BF 注音字母扩展 Bopomofo Extended
31C0-31EF 中日韩笔画 CJK Strokes
31F0-31FF 日文片假名拼音扩展 Katakana Phonetic Extensions
3200-32FF 封闭式中日韩字母和月份 Enclosed CJK Letters and Months
3300-33FF 中日韩兼容字符 CJK Compatibility
3400-4DBF 中日韩统一表意文字扩展A CJK Unified Ideographs Extension A
4DC0-4DFF 易经六十四卦符号 Yijing Hexagrams Symbols
4E00-9FFF 中日韩统一表意文字 CJK Unified Ideographs
A000-A48F 彝文音节 Yi Syllables
A490-A4CF 彝文字根 Yi Radicals
A4D0-A4FF 老傈僳文 Lisu
A500-A63F 瓦伊语 Vai
A640-A69F 西里尔字母扩展-B Cyrillic Extended-B
A6A0-A6FF 巴姆穆语 Bamum
A700-A71F 修饰用声调符号 Modifier Tone Letters
A720-A7FF 拉丁文扩展-D Latin Extended-D
A800-A82F 锡尔赫特文 Syloti Nagri
A830-A83F 通用印度数字格式 Common Indic Number Forms
A840-A87F 八思巴文字 Phags-pa
A880-A8DF 索拉什特拉文 Saurashtra
A8E0-A8FF 天城文扩展 Devanagari Extended
A900-A92F 克耶里字母 Kayah Li
A930-A95F 勒姜字母 Rejang
A960-A97F 谚文扩展-A Hangul Jamo Extended-A
A980-A9DF 爪哇字母 Javanese
A9E0-A9FF 缅甸文扩展-B Myanmar Extended-B
AA00-AA5F 占语字母 Cham
AA60-AA7F 缅甸文扩展-A Myanmar Extended-A
AA80-AADF 越南傣文 Tai Viet
AAE0-AAFF 曼尼普尔文扩展 Meetei Mayek Extensions
AB00-AB2F 吉兹字母扩展-A Ethiopic Extended-A
AB30-AB6F 拉丁文扩展-E Latin Extended-E
ABC0-ABFF 曼尼普尔文 Meetei Mayek
AC00-D7AF 谚文音节 Hangul Syllables
D7B0-D7FF 谚文字母扩展-B Hangul Jamo Extended-B
D800-DBFF UTF-16的高半区 High-half zone of UTF-16
DC00-DFFF UTF-16的低半区 Low-half zone of UTF-16
E000-F8FF 专用区 Private Use Area
F900-FAFF 中日韩兼容表意文字 CJK Compatibility Ideographs
FB00-FB4F 字母表達形式(拉丁字母连字亚美尼亚字母连字、希伯来文表现形式) Alphabetic Presentation Forms
FB50-FDFF[3] 阿拉伯字母表達形式-A Arabic Presentation Forms A
FE00-FE0F 異體字选择符 Variation Selector
FE10-FE1F 竖排形式 Vertical Forms
FE20-FE2F 组合用半符号 Combining Half Marks
FE30-FE4F 中日韩兼容形式 CJK Compatibility Forms
FE50-FE6F 小寫变体形式 Small Form Variants
FE70-FEFF 阿拉伯文表達形式-B Arabic Presentation Forms B
FF00-FFEF 半形全形字符 Halfwidth and Fullwidth Forms
FFF0-FFFF 特殊 Specials

第一輔助平面[编辑]

第一輔助平面又稱多文種補充平面Supplementary Multilingual Plane,縮寫SMP,或簡稱Plane 1),擺放拼音文字(主要為現時已不再使用的古老文字)、手写文字和音符等符號。用于学者的专业论文中使用这些古老或过时的语言书写符号。範圍在U+10000~U+1FFFD。计划分配如下。

编码范围 中文名称 英语名称
10000-1007F 线形文字B音节文字 Linear B Syllabary
10080-100FF 线形文字B表意文字 Linear B Ideograms
10100-1013F 爱琴海数字 Aegean Numbers
10140-1018F 古希腊数字 Ancient Greek Numbers
10190-101CF 古代记数系统 Ancient Symbols
101D0-101FF 费斯托斯圆盘 Phaistos Disc
10280-1029F 吕基亚字母 Lycian
102A0-102DF 卡利亚字母 Carian
102E0-102FF 科普特闰余数字 Coptic Epact Numbers
10300-1032F 古意大利字母 Old Italic
10330-1034F 哥特字母 Gothic
10350-1037F 古彼尔姆字母 Old Permic
10380-1039F 乌加里特字母 Ugaritic
103A0-103DF 古波斯文 Old Persian
10400-1044F 德赛莱特字母 Deseret
10450-1047F 萧伯纳字母 Shavian
10480-104AF 奥斯曼亚字母 Osmanya
10500-1052F 艾尔巴桑字母 Elbasan
10530-1056F 高加索阿尔巴尼亚文 Caucasian Albanian
10600-1077F 线形文字A Linear A
10800-1083F 塞浦路斯音节文字 Cypriot Syllabary
10840-1085F 帝国亚兰文字 Imperial Aramaic
10860-1087F 帕尔迈拉字母 Palmyrene
10880-108AF 纳巴泰文 Nabataean
10900-1091F 腓尼基字母 Phoenician
10920-1093F 吕底亚字母 Lydian
10980-1099F 麦罗埃文 Meroitic Hieroglyphs
109A0-109FF 麦罗埃文草书 Meroitic Cursive
10A00-10A5F 佉卢文 Kharoshthi
10A60-10A7F 古南阿拉伯字母 Old South Arabian
10A80-10A9F 古北阿拉伯字母 Old North Arabian
10AC0-10AFF 摩尼教文 Manichaean
10B00-10B3F 阿维斯陀文字 Avestan
10B40-10B5F 碑刻帕提亚文 Inscriptional Parthian
10B60-10B7F 碑刻巴列维文 Inscriptional Pahlavi
10B80-10BAF 诗篇巴列维文 Psalter Pahlavi
10C00-10C4F 古突厥文 Old Turkic
10E60-10E7F 卢米文数字 Rumi Numeral Symbols
11000-1107F 婆罗米文字 Brahmi
11080-110CF 凯提文 Kaithi
110D0-110FF 索拉桑朋文 Sora Sompeng
11100-1114F 查克马文 Chakma
11150-1117F 马哈佳尼文 Mahajani
11180-111DF 夏拉达文 Sharada
111E0-111FF 古僧伽罗文数字 Sinhala Archaic Numbers
11200-1124F 可吉文 Khojki
112B0-112FF 库达瓦迪文 Khudawadi
11300-1137F 帕拉瓦文 Grantha
11480-114DF Tirhuta
11580-115FF 悉昙文字 Siddham
11600-1165F 莫迪文 Modi
11680-116CF 塔克里字母 Takri
118A0-118FF 瓦兰齐地文 Warang Citi
11AC0-11AFF Pau Cin Hau
12000-123FF 楔形文字 Cuneiform
12400-1247F 楔形文字数字和标点符号 Cuneiform Numbers and Punctuation
13000-1342F 埃及圣书体 Egyptian Hieroglyphs
16800-16A3F 巴姆穆文字补充 Bamum Supplement
16A40-16A6F Mro
16AD0-16AFF 巴萨哇文字 Bassa Vah
16B00-16B8F Pahawh苗文 Pahawh Hmong
16F00-16F9F 柏格理苗文 Miao
1B000-1B0FF 日文假名补充 Kana Supplement
1BC00-1BC9F 杜普雷速记 Duployan
1BCA0-1BCAF 速记格式控制符 Shorthand Format Controls
1D000-1D0FF 拜占庭音乐符号 Byzantine Musical Symbols
1D100-1D1FF 音乐符号 Musical Symbols
1D200-1D24F 古希腊音乐记号 Ancient Greek Musical Notation
1D300-1D35F 太玄经符号 Tai Xuan Jing Symbols
1D360-1D37F 算筹 Counting Rod Numerals
1D400-1D7FF 字母和数字符号 Mathematical Alphanumeric Symbols
1E800-1E8DF Mende Kikakui
1EE00-1EEFF 阿拉伯字母数字符号 Arabic Mathematical Alphanumeric Symbols
1F000-1F02F 麻将牌 Mahjong Tiles
1F030-1F09F 多米诺骨牌 Domino Tiles
1F0A0-1F0FF 扑克牌 Playing Cards
1F100-1F1FF 封闭式字母数字补充 Enclosed Alphanumeric Supplement
1F200-1F2FF 封闭式表意文字补充 Enclosed Ideographic Supplement
1F300-1F5FF 杂项符号象形文字 Miscellaneous Symbols And Pictographs
1F600-1F64F 表情符号 Emotions
1F650-1F67F 装饰符号 Ornamental Dingbats
1F680-1F6FF 交通和地图符号 Transport And Map Symbols
1F700-1F77F 炼金术符号 Alchemical Symbols
1F780-1F7FF 几何图形扩展 Geometric Shapes Extended
1F800-1F8FF 追加箭头-C Supplemental Arrows-C

以下是它們的編碼表。

第二輔助平面[编辑]

第二輔助平面又稱為表意文字補充平面Supplementary Ideographic Plane,縮寫SIP,或簡稱Plane 2),整個範圍在U+20000~U+2FFFD。整個平面配置的都是一些罕用的汉字或地區的方言用字,如粵語用字及越南語字喃。現時擺放了「中日韓統一表意文字擴展B區」(4萬3253個汉字)、「中日韓統一表意文字擴展C區」(4149個汉字)、「中日韓統一表意文字擴展D區」(222個汉字)以及中日韓兼容表意文字增補(CJK Compatibility Ideographs Supplement)。預計「中日韓統一表意文字擴展E區」也會使用此平面。

已分配和計劃分配的編碼區段為:

  • U+20000-U+2A6DF:中日韓統一表意文字擴展B區
  • U+2A700-U+2B73F:中日韓統一表意文字擴展C區
  • U+2B740-U+2B81F:中日韓統一表意文字擴展D區
  • U+2B820-U+2F7FF:中日韓統一表意文字擴展E區(還在草擬階段)
  • U+2F800-U+2FA1F:中日韓兼容表意文字增補

以下是其編碼表。

第三至十三輔助平面[编辑]

第三輔助平面尚未使用,但打算用來擺放甲骨文金文小篆中國戰國時期文字等。 計劃分配的編碼區段為:

  • U+30000-U+317FF:甲骨文
  • U+32000-U+32FFF:金文
  • U+34000-U+368FF:小篆

第四至第十三輔助平面並未計劃使用。

第十四輔助平面[编辑]

第十四輔助平面又稱特別用途補充平面Supplementary Special-purpose Plane,簡稱SSP),擺放「語言編碼標籤」和「字形變換選取器」,它們都是控制字符。範圍在U+E0000~U+E01FF。

编码范围 中文名称 英语名称
E0000-E007F 标签 Tags
E0100-E01EF 选择器变化补充 Variation Selectors Supplement

編碼表詳見E0000-E0FFF

第十五至十六輔助平面[编辑]

第十五至十六輔助平面都是私人使用區。它們的範圍是U+F0000~U+FFFFD及U+100000~U+10FFFD.

參見[编辑]

注记[编辑]

  1. ^ TIP Roadmap
  2. ^ 2.0 2.1 最初的「私人使用區」(Private Use Area,簡稱PUA)位於U+E000至U+F8FF
  3. ^ 其中FDD0-FDEF段为“非字符”(Noncharacter)。

外部链接[编辑]