本页使用了标题或全文手工转换

表意文字描述字符

维基百科,自由的百科全书
跳到导航 跳到搜索
注意:本页面含有Unihan新版用字:「𠀬𠁢𠂊𠂗𠋑𠚤𢧌𣏃𤆯𥘶𧆬𧓉」。有关字符可能會错误显示,詳见Unicode扩展汉字
表意文字描述字符
Ideographic Description Characters
范围 U+2FF0–U+2FFF
(16個碼位)
平面 基本多文種平面BMP
字符 通用英语Script (Unicode)#Special script property values
分配 12个码位
未分配 4个保留码位
來源標準 GB 2312-80
Unicode版本歷史
3.0 12 (+12)
注:[1][2]

表意文字描述字符(英:Ideographic Description Character,IDC),是Unicode自 3.0 後對漢字所做的一種支援。

目前大部的編碼包含Unicode,對於漢字編碼的處理大致為先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以搜集到所有漢字,所以用這樣的字符來描述某一個「字」是如何被更基本的部件組合起來。

編碼方式[编辑]

表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode Consortium官方代码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FFx
注解
1.^ 依据Unicode 8.0
2.^ 灰色区域指示未被分配的码点

另有表意文字指示符(Ideographic Variation Indicator)「〾」收錄在U+303E,用來表示形似但不相等的字。

表意文字描述序列[编辑]

表意文字描述序列(英:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,一個IDS是由IDC與特定字元(主要為漢字)組合而成,表示一個漢字的抽象結構。

Unicode定義了12種組合字符:

編碼 字符 意義 例字 序列 例字 序列
U+2FF0 兩個部件由左至右組成 ⿰木目 𠁢 ⿰丨㇍
U+2FF1 兩個部件由上至下組成 ⿱木口 𠚤 ⿱𠂊丶
U+2FF2 三個部件由左至右組成 ⿲彳氵亍 𠂗 ⿲丿夕乚
U+2FF3 三個部件由上至下組成 ⿳亠口小 𠋑 ⿳亼目口
U+2FF4 兩個部件由外而內組成 ⿴囗口 𠀬 ⿴㐁人
U+2FF5 三面包圍,下方開口 ⿵几皇 𧓉 ⿵齊虫
U+2FF6 三面包圍,上方開口 ⿶凵㐅 ⿶乂丶
U+2FF7 三面包圍,右方開口 ⿷匚斤 𧆬 ⿷虎九
U+2FF8 兩面包圍,兩個部件由左上至右下組成 ⿸疒丙 𤆯 ⿸耂火
U+2FF9 兩面包圍,兩個部件由右上至左下組成 ⿹戈廾 𢧌 ⿹或壬
U+2FFA 兩面包圍,兩個部件由左下至右上組成 ⿺走召 𥘶 ⿺礼分
U+2FFB 兩個部件重疊 ⿻工从 𣏃 ⿻木⿻コ一

IDS的運算方式是前綴表示法,即運算子在前,對應數量的運算元在後。這種方式不須使用括號等字元輔助即可無歧義地表示運算順序。

Unicode標準中,表意文字描述序列之定義如下:[3]

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3

按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0..U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。

限制[编辑]

  • Unicode尚未定義漢字的唯一表述方式,依現行提案一個漢字可用多種IDS表達,例如「巫」可以表示為「⿻工从」或「⿻工⿰人人」。
  • IDS主要目的在於表達漢字的抽象結構,而不是像組合字符一樣用於動態組字。實務上組合漢字的字形繪製有許多複雜要素須考量,光用IDS尚不足以繪出符合一般要求的合成字。例如,組合漢字上下、左右比例往往並非1:1,而是按二部件的實際外形調整;左上-右下、三方包圍等組合字的比例計算則更複雜;上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀,例如「⿻工从」是將兩個「人」放到「工」的左右兩個開口裡,而非簡單地將「工」和「从」上下疊合。

另見[编辑]

參考文獻[编辑]

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. 
  3. ^ The Unicode StandardVersion 6.0 – Core Specification (PDF). 

外部連結[编辑]