組合字符

维基百科,自由的百科全书
跳转至: 导航搜索

字體排印學中,組合字符Combining character)是用來改變其它字符所用的字符。在拉丁文字中,最常見的組合字符為附加符號(包含重音號)。

統一碼也包含許多預組字符(en:precomposed character,即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先運行Unicode正規化[1]

在統一碼中,用於歐洲語言和國際音標的組合用附加符號為U+0300–U+036F。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。

OpenType[编辑]

OpenType則有ccmp區塊,以定義字形是由其它組合字符所組合出來或可分解之。

統一碼範圍[编辑]

  • 組合用附加符號(Combining Diacritical Marks,0300–036F),由版本1.0始,陸續修改到4.1。
  • 組合用附加符號增補集(Combining Diacritical Marks Supplement,1DC0–1DFF),版本4.1到5.2。
  • 符號之組合用附加符號(Combining Diacritical Marks for Symbols,20D0–20FF),由版本1.0開始,陸續修改到5.1。
  • 組合用半形符號(Combining Half Marks,FE20–FE2F),由版本1.0開始,在5.2中修正。
組合用附加符號
Combining Diacritical Marks
[1]
Unicode.org chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x  ̀  ́  ̂  ̃  ̄  ̅  ̆  ̇  ̈  ̉  ̊  ̋  ̌  ̍  ̎  ̏
U+031x  ̐  ̑  ̒  ̓  ̔  ̕  ̖  ̗  ̘  ̙  ̚  ̛  ̜  ̝  ̞  ̟
U+032x  ̠  ̡  ̢  ̣  ̤  ̥  ̦  ̧  ̨  ̩  ̪  ̫  ̬  ̭  ̮  ̯
U+033x  ̰  ̱  ̲  ̳  ̴  ̵  ̶  ̷  ̸  ̹  ̺  ̻  ̼  ̽  ̾  ̿
U+034x  ̀  ́  ͂  ̓  ̈́  ͅ  ͆  ͇  ͈  ͉  ͊  ͋  ͌  ͍  ͎  ͏
U+035x  ͐  ͑  ͒  ͓  ͔  ͕  ͖  ͗  ͘  ͙  ͚  ͛  ͜  ͝  ͞  ͟
U+036x  ͠  ͡  ͢  ͣ  ͤ  ͥ  ͦ  ͧ  ͨ  ͩ  ͪ  ͫ  ͬ  ͭ  ͮ  ͯ
注解
1.^ 来自Unicode version 6.3

碼點U+0346–034A為國際音標符號

碼點U+034B–034E為用於言語障礙的國際音標附加符號

  • U+034B  ͋ :鼻腔洩氣
  • U+034C  ͌ :齶咽擦音
  • U+034D  ͍ :唇部伸展
  • U+034E  ͎ :哨音
組合用附加符號增補集
Combining Diacritical Marks Supplement
[1]
Unicode.org chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCx  ᷀  ᷁  ᷂  ᷃  ᷄  ᷅  ᷆  ᷇  ᷈  ᷉  ᷊  ᷋  ᷌  ᷍  ᷎  ᷏
U+1DDx  ᷐  ᷑  ᷒  ᷓ  ᷔ  ᷕ  ᷖ  ᷗ  ᷘ  ᷙ  ᷚ  ᷛ  ᷜ  ᷝ  ᷞ  ᷟ
U+1DEx  ᷠ  ᷡ  ᷢ  ᷣ  ᷤ  ᷥ  ᷦ
U+1DFx  ᷼  ᷽  ᷾  ᷿
注解
1.^ 来自Unicode version 6.3
符號之組合用附加符號
Combining Diacritical Marks for Symbols
[1]
Unicode.org chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20Dx  ⃐  ⃑  ⃒  ⃓  ⃔  ⃕  ⃖  ⃗  ⃘  ⃙  ⃚  ⃛  ⃜  ⃝  ⃞  ⃟
U+20Ex  ⃠  ⃡  ⃢  ⃣  ⃤  ⃥  ⃦  ⃧  ⃨  ⃩  ⃪  ⃫  ⃬  ⃭  ⃮  ⃯
U+20Fx  ⃰
注解
1.^ 来自Unicode 6.3
組合用半形符號
Combining Half Marks
[1]
Unicode.org chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FE2x  ︠  ︡  ︢  ︣  ︤  ︥  ︦
注解
1.^ 来自Unicode 6.3

註記[编辑]

  1. ^ 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。

另見[编辑]

外部連結[编辑]