KS X 1001

维基百科,自由的百科全书
跳转至: 导航搜索

KS X 1001韓國用於書寫的諺文漢字字元編碼規格。以前稱作KS C 5601,現在則稱作這名稱較多。也有只稱作KS編碼的。

類似於JIS X 0208的94×94文字集合,包含諺文2350字、漢字4888字、英文字母數字假名合計8226字。諺文設計成一文字為由字母組合成一音節的並非所有可能的組成符號都有,存在許多無法表現的音節,因此有許多批評聲音。百事可樂的韓國法人因 KS X 1001 不含「」,1992年改為 KS X 1001 中存在的諺文表示「」。[1]

漢字則是照讀音順序來配置的。韓國語原則上一字一音,但也有破音字的存在。這個規格的一大特徵是對這樣的漢字的每個讀音位置都重複編碼。

雖然也有不一樣的,使用頭音法則,即轉成最先遇到的那個讀音,但如「」和「」如此常用的字也有別的讀音和重複編碼。最多的是有4個重複編碼的「」。這個方式的好處是、字的讀音利於機械的判定,但卻也遭受批評違反字符編碼的大原則。此外,這樣重複編碼的漢字在統一碼通用字符集中因互換性的關係,中日韓統一表意文字只收錄一個、其它的則收錄於中日韓兼容漢字

KS X 1001在EUC的編碼稱作韓國語EUCEUC-KR)。實際上,KS X 1001 是完全沒有被用於其它編碼方法(ISO-2022-KR完全沒有被使用),單獨的 KS C 5601 通常意味 EUC-KR 。

一些電腦系統對此標準編了許多版本。但他們並非都使用同樣方法,如將典型放在 0x5C 的反斜線改成韓圓(₩)。有些系統則使用非常規方法來擴充此標準。KS X 1001 可編碼EUC-KRWindows-949(EUC-KR 的超集)、ISO-2022-KR 和「雙位元組合型符號」(Johab)。但後二個很少使用。

朝鮮則使用另一規格KPS 9566

歷史[编辑]

  • 1974年9月27日 - 制訂 KS C 5601 為 7 位元諺文編碼。當時的配置為30個諺文子音字母(頭子音和終子音的集合)在 0x41-0x5E ,21個母音字母散佈在 0x62 - 0x7C 。這種系統無法區別頭子音和終子音。
  • 1982年6月14日 - 修訂 KS C 5601。增加「十六位元符號」附錄。「十六位元符號」為初聲、中聲、終聲各5 位元的表示。最高位元為 1 的編碼。
  • 1987年3月1日 - KS C 5601再次修訂,7 位元諺文碼和「十六位元符號」移動到附錄。本文定為94×94文字集合,含有2350個諺文字符、4888個漢字、986個其他文字。
  • 1992年10月15日 - 修訂 KS C 5601。附錄中「16位元符號」變更為「雙位元組合型符號」。表示的碼點和初聲、中聲、終聲一樣,位元型式則完全不同。
  • 1997年8月20日 - 伴隨新的情報部門(X)的設立,KS C 5601 改為 KS X 1001 。
  • 1998年12月31日 - 修改 KS X 1001,增加歐元符號(€)和註冊商標符號(®)。

參考[编辑]

另見[编辑]