組合字符

维基百科,自由的百科全书
跳转至: 导航搜索

字體排印學中,組合字符Combining character)是用來改變其它字符所用的字符。在拉丁文字中,最常見的組合字符為附加符號(包含重音號)。

統一碼也包含許多預組字符,即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先運行統一碼等價性[1]

在統一碼中,用於歐洲語言和國際音標的組合用附加符號為 U+0300–U+036F。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。

目录

OpenType [编辑]

OpenType則有ccmp區塊,以定義字形是由其它組合字符所組合出來或可分解之。

統一碼範圍 [编辑]

  • 組合用附加符號(Combining Diacritical Marks) (0300–036F),由版本 1.0 始,陸續修改到 4.1。
  • 組合用附加符號補集(Combining Diacritical Marks Supplement) (1DC0–1DFF),版本 4.1 到 5.2。
  • 符號之組合用附加符號(Combining Diacritical Marks for Symbols) (20D0–20FF),由版本 1.0 開始,陸續修改到 5.1。
  • 組合用半形符號(Combining Half Marks) (FE20–FE2F),由版本 1.0 開始,在 5.2 中修正。

Template:Unicode chart Combining Diacritical Marks

碼點U+0346–034A 為國際音標符號

碼點 U+034B–034E 為用於disordered speech的國際音標附加符號

  • U+034B  ͋  : nasal escape;
  • U+034C  ͌  : velopharyngeal friction;
  • U+034D  ͍  : labial spreading;
  • U+034E  ͎  : whistled articulation;

註記 [编辑]

  1. ^ 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。

另見 [编辑]

外部連結 [编辑]

Unicode 相關條目
Unicode字符列表 | Unicode聯盟 | Unicode技術委員會 | ISO 10646(通用字符集) | UTF-7 | UTF-8 | UTF-16 / UCS-2 | UTF-32 / UCS-4
Unicode字符平面映射 | 中日韓越統一表意文字 | CJKV | 表意文字小組(IRG) | IICore | 完整Unicode編碼表