組合字符
维基百科,自由的百科全书
在字體排印學中,組合字符(Combining character)是用來改變其它字符所用的字符。在拉丁文字中,最常見的組合字符為附加符號(包含重音號)。
統一碼也包含許多預組字符,即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先運行統一碼等價性。[1]
在統一碼中,用於歐洲語言和國際音標的組合用附加符號為 U+0300–U+036F。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。
目录 |
OpenType [编辑]
OpenType則有ccmp區塊,以定義字形是由其它組合字符所組合出來或可分解之。
統一碼範圍 [编辑]
- 組合用附加符號(Combining Diacritical Marks) (0300–036F),由版本 1.0 始,陸續修改到 4.1。
- 組合用附加符號補集(Combining Diacritical Marks Supplement) (1DC0–1DFF),版本 4.1 到 5.2。
- 符號之組合用附加符號(Combining Diacritical Marks for Symbols) (20D0–20FF),由版本 1.0 開始,陸續修改到 5.1。
- 組合用半形符號(Combining Half Marks) (FE20–FE2F),由版本 1.0 開始,在 5.2 中修正。
Template:Unicode chart Combining Diacritical Marks
碼點U+0346–034A 為國際音標符號
- U+0346 ͆ : dentolabial;
- U+0347 ͇ : 齒齦音;
- U+0348 ͈ : 強 articulation;
- U+0349 ͉ : 弱 articulation;
- U+034A ͊ : denasal;
碼點 U+034B–034E 為用於disordered speech的國際音標附加符號
- U+034B ͋ : nasal escape;
- U+034C ͌ : velopharyngeal friction;
- U+034D ͍ : labial spreading;
- U+034E ͎ : whistled articulation;
註記 [编辑]
- ^ 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。
另見 [编辑]
外部連結 [编辑]
- Combining diacritics chart (in Adobe PDF format)
- Combining diacritics supplement chart (in Adobe PDF format)
- Combining marks test page facing combined and precomposed letters
- Alan Wood’s Unicode Resources
- DecodeUnicode.org combining diacritical marks reference
| Unicode 相關條目 |
|---|
| Unicode字符列表 | Unicode聯盟 | Unicode技術委員會 | ISO 10646(通用字符集) | UTF-7 | UTF-8 | UTF-16 / UCS-2 | UTF-32 / UCS-4 |
| Unicode字符平面映射 | 中日韓越統一表意文字 | CJKV | 表意文字小組(IRG) | IICore | 完整Unicode編碼表 |