本页使用了标题或全文手工转换

KS X 1001

维基百科,自由的百科全书
跳到导航 跳到搜索

KS X 1001韩国用于书写的谚文汉字字符编码规格。以前称作KS C 5601,现在多称作KS X 1001,有时也简称为KS编码。

其与JIS X 0208的94×94字集类似,包含谚文2350字、汉字4888字、英文字母数字假名共8226字。谚文是由字母组合成一个音节的,但在这种编码中用一个字符表示一整个音节,难以包括所有可能的组成符号,存在许多无法表示的音节,受到许多批评。百事可乐的韩国法人因 KS X 1001 不含“”,在1992年改用 KS X 1001 中存在的谚文“”表示。[1]

汉字则是照读音顺序来配置的。朝鲜语原则上一字一音,但也存在破音字,KS X 1001对这样的汉字在不同的读音位置重复编码。

虽然也有不一样的,使用头音法则,即转成最先遇到的那个读音,但如“”和“”如此常用的字也有别的读音和重复编码。最多的是有4个重复编码的“”。这个方式的好处是、字的读音利于机械的判定,但却也被批评违反字符编码的大原则。此外,这样重复编码的汉字在统一码通用字符集中因互换性的关系,中日韩统一表意文字只收录一个、其它的则收录于中日韩兼容汉字

KS X 1001在EUC的编码称作韩文EUCEUC-KR)。实际上,KS X 1001 完全没有被用于其它编码(ISO-2022-KR完全没有被使用),单独的 KS C 5601 通常意指 EUC-KR 。

一些计算机系统将此标准改编成诸多版本。但他们并非完全一致,如将原标准中放在 0x5C 的反斜线改成韩圆(₩)。有些系统则使用非常规方法来扩展此标准。KS X 1001 可编码EUC-KRWindows-949(EUC-KR 的超集)、ISO-2022-KR 和“双字节合型符号”(Johab)。但后二个很少使用。

朝鲜则使用另一规格KPS 9566

历史[编辑]

  • 1974年9月27日 - 制订 KS C 5601 为 7 比特谚文编码。当时的配置为30个谚文子音字母(头子音和终子音的集合)在 0x41-0x5E ,21个母音字母散布在 0x62 - 0x7C 。这种系统无法区别头子音和终子音。
  • 1982年6月14日 - 修订 KS C 5601。增加“十六比特符号”附录。“十六比特符号”为初声、中声、终声各5 比特的表示。最高比特为 1 的编码。
  • 1987年3月1日 - KS C 5601再次修订,7 比特谚文码和“十六比特符号”移动到附录。本文定为94×94文字集合,含有2350个谚文字符、4888个汉字、986个其他文字。
  • 1992年10月15日 - 修订 KS C 5601。附录中“16位符号”变更为“双字节合型符号”。表示的码点和初声、中声、终声一样,比特型式则完全不同。
  • 1997年8月20日 - 伴随新的情报部门(X)的设立,KS C 5601 改为 KS X 1001 。
  • 1998年12月31日 - 修改 KS X 1001,增加欧元符号(€)和注册商标符号(®)。

参考[编辑]

另见[编辑]