Z-变体

维基百科,自由的百科全书
跳到导航 跳到搜索

Unicode中,如果两个字形共享相同的词源(etymology),但外观和Unicode字符编码稍有不同,则两个字形互为Z-变体(通常拼写为zVariants)。例如,Unicode字符U+8AAA “說” 和U+8AAC “説” 互为Z-变体。Z-变体的概念只适用于“CJKV 文字” (中文,日语,韩语和越南语)。

Z轴上的区别[编辑]

CJK 的 unicode 编码的分配通过三个""来组织。 X轴表示语义上的差异;例如,拉丁大写字母A(U+0041A)和希腊字母α的大写字母(U+0391A)在Unicode中由两个不同的编码表示,称为“X-变体”(尽管这个术语并不常见)。Y轴表示外观上的显著差异,语义上差异不大;例如,繁体字“貓”(u+8c93)和简体字“猫”(u+732b)互为Y-变体。[1]

Z轴表示较小的印刷差异。 例如,中文字符(U+838A“莊”)和(U+8358“荘”)是Z-变体, (U+8AAA“說”) 和 (U+8AAC“説”) 也同样是Z-变体。Unicode.org[1] 的术语表中,将“Z-变体”定义为“两个具有相同语义和统一形状的CJK统一表意文字”,或者是在CJKV统一表意文字中。

可以这样讲,如果CJK统一表意文字是完美“统一”的,Z-变体也不会出现。它的出现是为了帮助文本在Unicode和其他CJK编码——比如 Big5CCCII——之间"往返"。例如,字符 “莊” 的CCCII编码为 21552D,同时其Z-变体 “荘” 则有CCCII编码 2D552D。这两个变体分别被赋予了不同的Unicode码,因此可以无损的将文本在CCCII编码和Unicode码之间转换。

问题[编辑]

关于"Z-变体"确切的定义, 还存在一些疑惑。例如,在2002年的一项 互联网草案 ( [rfc:3743 RFC3743]),[2]  (U+4E0D 不) 和 (U+F967 不) 被定义为“字形变体(font variants,Y-variant)”,而普通话中的 (U+5154 兔) 和日语中的(U+514E 兎) ——语义都是“兔子”——则都被 Unicode Consortium的统汉字数据库 [3] 认为是Z-变体。

其他[编辑]

参考文献[编辑]