中文標準交換碼

维基百科,自由的百科全书
跳转至: 导航搜索

中文標準交換碼,編號CNS 11643,舊名國家標準中文交換碼,是中華民國政府為資訊交換而制定的標準字元編碼方案,與CCCII同屬於中文交換碼

1980年9月,行政院國家科學委員會集合編碼專家、學者在溪頭舉行會議並達成初步原則,並據此請行政院核定國家中文資訊標準交換碼編碼原則。經過多次會商,在1986年8月4日由經濟部中央標準局公佈,取名「通用漢字標準交換碼」,簡稱「通用碼」。當時的內容包括第一字面、第二字面共13,051字。

經過多年的使用意見及反映,於1992年擴編至第七字面,共48,027字,並改稱「中文標準交換碼」(CSIC, Chinese Standard Interchange Code)。此後陸續充實內容,1992年版一共十六字面,使用至第七字面;2004年版一共八十字面,使用至第十五字面。

1980年代萬碼奔騰,業界使用各種不同的內碼,如王安碼IBM 5550碼電信碼等。藉由此國家標準交換碼的公布與使用,做為各種不同內碼間的橋梁,使得不同的內碼也可以互相溝通和交換,資料可共享。

版本[编辑]

年份 標準名稱 更改
1983 CNS11643-1983 試用版(13,053字)
1986 CNS11643-1986 通用漢字標準交換碼(13,051字)
1988 CNS11643-1986 增加第十四字面使用者加字區交換碼(6,148字)
1988 CNS11643-1986 再增加第十四字面使用者加字區交換碼(157字)
1992 CNS11643-1992 中文標準交換碼(48,027字)
2004 CNS11643-2004 編碼架構擴充至八十字面

最終字元[编辑]

依據ISO 2375之規定,各國的國家標準若要成為國際間之中文資訊交換標準,必須向國際標準組織申請註冊,並由國際標準組織正式公佈,如此全球各國即可依國際標準公佈之最終字元進行資料交換。

CNS 11643-1992所包括的七個字面,每個字面均分別向ISO秘書處 ECMA(European Computer Manufacturers Association)申請相對應之最終字元。經由資訊工業策進會之協助申請,1993年2月1日CNS 11643第一、第二字面正式獲得最終字元: 4/7和4/8,1994年3月25日CNS 11643第三至第七字面也正式獲得最終字元: 4/9 - 4/13。

年份 標準名稱 更改
CNS字面 CNS暫用最終字元 ISO正式最終字元
第一字面 3/0 4/7
第二字面 3/1 4/8
第三字面 3/2 4/9
第四字面 3/3 4/10
第五字面 3/4 4/11
第六字面 3/5 4/12
第七字面 3/6 4/13

最新版本[编辑]

2004年版CNS 11643字面配置如下:

  • 第一字面:字碼區間2121h至4243h為符號區(4242h 新增歐元符號€,4243h 新增國字);字碼區間4421h至7D4Bh,共編入中文字5,401個;字集來源除教育部常用國字標準字體表」所列4,808字外,並優先收編國中國小教科書常用字587字及異體字6字。另外在2009年,在字碼4244h至4254h,增補閩南語用拉丁符號17個[1]
  • 第二字面:字碼區間由2121h至7244h,故編入中文字7,650個;字集來源除教育部「次常用國字標準字體表」所列6,330字外,並篩選編入教育部「罕用國字標準字體表」表中使用頻率較高之1,320字。
  • 第三字面:字碼區間2121h至6246h,共編入中文字6,148個;字集來源為1988年6月行政院主計處電子處理資料中心暫編之使用者加字區第14字面前段;字碼區間6448h至672Ah為247個美國香港提報字。
  • 第四字面:字碼區間2121h至6E5Ch,共編入中文字7,298個;字集來源除1988年6月行政院主計處電子處理資料中心暫編之使用者加字區第14字面後段171字外,並加入戶役政及其他使用單位、ISO/IEC 10646-2:2001 漢字集、資訊業次常用字7,127字。
  • 第五字面:字碼區間2121h至7C51h,目前編入中文字8,603個字;字集來源為未編入前4個字面之教育部罕用字
  • 第六字面:字碼區間2121h至647Ah,共編入中文字6,388個;字集來源為未編入前5個字面,且筆畫在14畫(含)以下之教育部異體字。
  • 第七字面:字碼區間2121h至6655h,共編入中文字6,539個;字集來源為未編入前6個字面,且筆畫在15畫(含)以上之教育部異體字。
  • 第八至第九字面:ISO/IEC 10646:2003 基本多文種平面中,未收錄到原 CNS 11643 版本中的非漢字。
  • 第十字面:ISO/IEC 10646:2003 未收錄到原 CNS 11643 版本中的 CJK Extension B 漢字。
  • 第十一字面:ISO/IEC 10646:2003 未收錄到原 CNS 11643 版本中的 CJK Extension B, C, D 漢字與地政字閩南語母語用字。
  • 第十二至十四字面:為戶政字,另第十二和第十四字面含未收錄到原 CNS 11643 版本中的 CJK Extension C 漢字。
  • 第十五字面:字碼區間2121h至6D39h,共編入中文字6,831個戶政、役政用字。另含未收錄到原 CNS 11643 版本中的 CJK, CJK Extension A 及 C 漢字。
  • 第十六字面:私人造字區。
  • 第17~第80字面保留供未來使用。

參看[编辑]

外部連結[编辑]