讨论:中日韩统一表意文字

页面内容不支持其他语言。
维基百科,自由的百科全书
          本条目页属于下列维基专题范畴:
汉字文化圈专题 (获评未知重要度
中日韩统一表意文字”是汉字文化圈专题的一部分,一个主要对(即汉字文化圈,或称“东亚文化圈”“儒家文化圈”等)为主题的文章作编辑、收集、整理、完善的专题。如果您愿意参与,可以编辑这篇文章,或者访问本专题页面了解专题的工作,并欢迎参与讨论
 未评级未评  根据专题质量评级标准,本条目页尚未接受评级。
 未知  根据专题重要度评级标准,本条目尚未接受评级。

条目名称问题[编辑]

改"中日韩汉字统一"至此,理由:

  1. 此词来自英字"Han Unification",本无"中日韩"之义.
  2. Unicode 汉字现已加入越南汉字.202.64.84.251 07:35 2005年6月14日 (UTC)

Unicode里有两个用语,一叫"Han Unification",另一叫"CJK Ideograph"(中日韩表意文字)。应否把此条目移到中日韩表意文字? -Hello World! 06:10 2005年6月15日 (UTC)

"Han Unification"是指统一的过程和规范。"CJK Ideograph"指的是表意文字,可以说即是汉字,只不过各地的写法不同。202.64.84.251 09:29 2005年6月15日 (UTC)
  1. 你实行之前,应先行好好学习维基的习惯和各命令的用途。
  2. Han unification 应该叫统汉码。不过先前有其他用户改了这么一个名称,无谓搞对抗。现在可以统一采用正名。
  3. 任何改动都应该尽可能保留旧有条目,而不是另行开立新条目,而把别人的心血搬进自己的条目去。
  4. 很多指令是要注册后才可以使用,例如:把条目移往新的名称去。

--202.75.78.240 02:21 2005年6月16日 (UTC)

我没有查到Han Unification被翻译成汉字统一,实际上,Han Unification目前基本上还没有对应的中文译名-百無一用是書生 () 02:27 2005年6月16日 (UTC)

这是因为此类文献中文版本少之又少--Hello World! 02:38 2005年6月16日 (UTC)
Han Unification翻译成“汉字统一”其实挺奇怪的。看不出来是将电脑中的汉字集中到一个编码中。Unicode一般翻译成“统一码”,所以是不是可以改用“汉字统码化”?--Kren 02:57 2005年6月18日 (UTC)
"Unification"原来的意思就是统一,不是“将之统一码(Unicode)化”或“将之统一编码”。汉字统一的概念其实已存在很久,有不少大陆学者(1949年后)都曾倡议汉字简化时要和日本的简化汉字看齐,如“国”、“变”等字,以利沟通。因为原来ISO 10646的构想就是将编码空间切开,让中日韩分别置入自己的字元(如中国的“一”和日本汉字的“一”可能就要分开编码)。统一就是将同源的字(如大家的“一”的都是源自中国古代,意思也相同)统一,只编一个码。就像英文的a和法文的a,读音可能不同,但大家都源自拉丁字母。202.64.84.251 04:55 2005年6月18日 (UTC)
让中日韩分别置入自己的字元,是日本一方的看法;此看法并非ISO 10646的构想,更遑论被接纳 --Hello World! 09:55 2005年6月20日 (UTC)

建议把名称改为“汉语表意文字统一计划”之类的。 dbslikacheung 16:21 2006年8月16日 (UTC)

第二平面字元[编辑]

Unicode 里并没有“第二平面字元”这东西。只有“表意文字补充平面”(SIP)和Extension B.202.64.84.251 01:34 2005年6月17日 (UTC)

“表意文字补充平面”(SIP)=“第二辅助平面” -Hello World! 02:23 2005年8月11日 (UTC)
但“第二平面字元”≠“第二辅助平面”。--水水 09:27 2005年10月20日 (UTC)
“第二平面字元”∈“第二辅助平面”,但“第二辅助平面”只有“第二平面字元”--Hello World! 09:53 2005年10月20日 (UTC)
为何不直接说Extension B?--水水 01:29 2005年10月21日 (UTC)
已把本来第二平面字元的条目,合并到中日韩统一表意文字和辅助平面。--利用者:Sl 09:38 2007年2月3日 (UTC)

字源分离原则[编辑]

我所列的全部都是在ISO/IEC JTC1/SC2/WG2的字源分离原则文件之中有的字(请勿在表中加添或删减任何字。)。请留意在内地被视为简化字的字,在其他地方并不视作简化字,只视作异体,而且,汉字不只是中文或中国在用。

举例来说,并不是的简化字,的简化字是也并非的简化字。的简化字是字,与字的编码并不相同。--Hello World! 08:56 2005年6月28日 (UTC)

想问问: 那一份官方文件有没有超链接?可不可以更改?--石添小草 14:48 2005年7月5日 (UTC)
ISO/IEC 10646 Annex S,可在IRG网站找到 --Hello World! 02:27 2005年7月6日 (UTC)

以下的字应该也不是繁简分别,而是字形的分别:狰(猙)、睁(睜)、决(決)、况(況)、凄(淒)、凉(涼)、减(減)、凑(湊)、羡(羨)、蹰(躕)、㛟(𡞵)、唤(喚)、奂(奐)、换(換)、涣(渙)、焕(煥)、痪(瘓)、荆(荊) --Hello World! (谁抢劫了我的乳酪) 2008年12月12日 (五) 07:33 (UTC)[回复]

以下字是利用“字源分离表”中的构件组成的字。似乎这些字都应该符合该表的定义。

Unicode Unicode Unicode
U+20775 𠝵 U+524F U+5259
U+6EDE U+6EEF
U+6F5F U+6F99
U+72F0 U+7319
U+7741 U+775C
U+8780 U+87BF
U+8E97 U+8E9B
U+69E9 U+3BA3
U+504B U+20338 𠌸
U+50B3 U+2B74A 𫝊
U+5BC3 U+21A18 𡨘
U+5D88 U+21E83 𡺃
U+5E85 U+221DD 𢇝
U+6158 U+2280A 𢠊
U+6164 U+22871 𢡱
U+61E1 U+228D7 𢣗
U+6226 U+229D0 𢧐
U+646A U+2BF63 𫽣
U+64E3 U+22DEC 𢷬
U+6A69 U+23727 𣜧
U+6BF5 U+23B9F 𣮟
U+71FD U+2442D 𤐭
U+7361 U+2486F 𤡯
U+78D9 U+25566 𥕦
U+7AB4 U+259D1 𥧑
U+8158 U+266E2 𦛢
U+83DF U+2B7CF 𫟏
U+8412 U+26CC6 𦳆
U+8E61 U+2C9C0 𬧀
U+902F U+284FB 𨓻
U+93D8 U+28A99 𨪙
U+93F8 U+28ACD 𨫍
U+348C U+203BD 𠎽
U+3912 U+3913
U+3B36 㬶(月部) U+266E9 𦛩
U+3B43 U+233C8 𣏈
U+3E91 U+24859 𤡙
U+20195 𠆕 U+221A3 𢆣
U+22A7B 𢩻 U+22A7C 𢩼
U+23368 𣍨(月部) U+26673 𦙳
U+24C4F 𤱏 U+2C3C2 𬏂
U+25CA4 𥲤 U+25CC1 𥳁
U+26637 𦘷 U+2C072 𬁲(月部)
U+26671 𦙱 U+2667D 𦙽
U+2688B 𦢋 U+268CD 𦣍
U+26A33 𦨳 U+26A3C 𦨼
U+26EBA 𦺺 U+26F53 𦽓
U+279BD 𧦽 U+279C2 𧧂
U+27A71 𧩱 U+27AEE 𧫮
U+2837D 𨍽 U+2838A 𨎊
U+28599 𨖙 U+285BC 𨖼
U+29149 𩅉 U+29167 𩅧
U+29451 𩑑 U+29457 𩑗
U+2A14F 𪅏 U+2A1AA 𪆪

-Hello World! 2015年9月24日 (四) 10:05 (UTC)[回复]

Han Unification[编辑]

“Han Unification”即“CJK Unified Ideographs”,Microsoft译为“中日韩统一表意文字”,我认为这个名称比较恰当就移动了。“汉字统一”看字面,还以为是汉字文化圈各国要统一汉字写法呢。Koika 18:56 2005年11月5日 (UTC)

“Han Unification”是一个过程,“CJK Unified Ideographs”是一个结果。我认为还是应该把两者分开来比较好。--minghong 01:43 2005年11月11日 (UTC)
“中日韩相容表意文字”区怎可能只有12个字?前往[1],然后再选取以“CJK Compatibility Ideographs”标题的PDF档案,就可看出此区最多可以有512个字!158.182.31.158 11:57 2006年7月24日 (UTC)
该区意思是,有12个字被错放到“表意文字兼容区”(当然表意文字兼容区不只有12个字) --Hello World!13:10 2006年10月7日 (UTC)
该十二个字没有放到正字区中是因为它们虽然有独立的形音义,但不是来自官方字集(即 G-, T-, J- 和 K-source)。--水水 09:48 2006年11月12日 (UTC)

以下五对汉字,其实一点儿分别也没有:

  • U+34A8 㒨 = U+20457 𠑗
  • U+3DB7 㶷 = U+2420E 𤈎
  • U+8641 虁 = U+27144 𧅄
  • U+204F2 𠓲 = U+23515 𣔕
  • U+249BC 𤦼 = U+249E9 𤧩

资料来源:http://babelstone.blogspot.com/2007/06/brief-history-of-cjk-c.html --Hello World! 2008年2月16日 (六) 11:35 (UTC)[回复]

U+4695 ←→ CNS 5-7A38 ←→ U+2F9CB,不知是哪里出了错。 --Hello World! 2008年2月14日 (四) 04:38 (UTC)[回复]

其他东亚象形文字[编辑]

之前有人提过把西夏文并入中日韩越统一表意文字之内,但现时看Unicode的roadmaps,发觉西夏文、契丹文、女真文,同被写到了U+17xxx的范围里。这似乎解释不到为何喃字会与CJK合并,而西夏文则不会。--利用者:Sl 09:51 2007年2月3日 (UTC)

其实李元昊自己也说过,西夏文字是独自的创立,可能字形有些相似,但不是依从既有汉字而创立的。所以,我认为不应与CJKV合并。--石添小草 2007年7月22日 (日) 17:14 (UTC)[回复]
N3297 西夏文 U+17000–U+18715 共 5910 个 -Hello World! 2007年8月27日 (一) 15:41 (UTC)[回复]
方块壮字如何?--Hello World! (谁抢劫了我的乳酪) 2008年12月12日 (五) 07:33 (UTC)[回复]

首先,你所说的这些都不是象形文字,其次,看过西夏文、契丹文、女真文的人都会知道,它们与汉字差别甚大(当然,它们的创立受到了汉字的影响,基本遵从方块的特点),而喃字、壮字等字,与汉字类似,很多都是采用汉字已有的部件所组成,甚至不少字本身就是汉字。因此Unicode如此区分是完全正确的。Dreamer in Utopia留言2018年6月3日 (日) 10:04 (UTC)[回复]

Untitled[编辑]

To use "CKJ" is meaningless. The term "CJK" is well-known for years. It's base on the alphabetic order, so we called it CJK. I don't think it good to use "CKJ" or even some of the people use KJC.—以上未签名的留言由Arithmandar对话贡献)于2008年3月31日 (一) 05:54 (UTC)加入。[回复]

虽说本人对日本不怀好感,但却也同意中日韩(朝)越的顺序,除了因为拉丁字母的次序以及和“中日韩表意字”的译名连贯外,还可以从使用汉字(或类似汉字文字)的数量来看,中国排行第一,日本次之,朝韩两地差不多日常写作不用,越南早已完全放弃。 朝韩两地差不多不再用汉字,怎么反倒可以放在第一位?日本比它更常用汉字,怎么会排在它之后? 朱仁一月 (留言) 2009年6月29日 (一) 09:27 (UTC)[回复]

扩展B区兼容汉字[编辑]

【原张贴在 Talk:香港增补字符集】 以下6个扩展B区兼容汉字是来自HKSCS的:

  • 2F840 HKSCS A047
  • 2F894 HKSCS FC48
  • 2F8CD HKSCS 9C52
  • 2F994 HKSCS 8EFD
  • 2F9B2 HKSCS 8FA8
  • 2F9D4 HKSCS 8FF0

不知为什么,Unicode竟声称整个区段为 CNS 11643 兼容汉字。CNS 11643 并没有这6个字。--Hello World! 2008年2月14日 (四) 04:43 (UTC)[回复]

建议分割[编辑]

建议把过程和批评部分分割至"统一汉字",而统一的结果留于本条目。--Emphrase💬📝 2016年8月11日 (四) 09:48 (UTC)[回复]

个人认为,叫“汉字统一”较好,因英语叫 Han Unification, “统一”是动名词。--Hello World! 2017年1月2日 (一) 02:53 (UTC)[回复]

这里列出了不少相同的字[编辑]

https://github.com/cjkvi/cjkvi-variants/blob/master/duplicate-chars.txt --維基小霸王留言2016年10月22日 (六) 10:26 (UTC)[回复]

国标源的G7真的是“现代汉语通用字表”吗?[编辑]

Unicode里国标源G7的汉字,基本都没有在所谓的“现代汉语通用字表”中找到。可否有相关人士提供一下这个说法的来源?非常怀疑这种说法。
--Ming Fan 617留言2017年3月11日 (六) 10:15 (UTC)[回复]

官方文件写的是“General Purpose Hanzi List for Modern Chinese Language, and General List of Simplified Hanzi”。它的中译是什么?--Hello World! 2017年3月12日 (日) 14:52 (UTC)[回复]
@Sl抱歉这么久了,把这事忘了。GB13000-2010的第25页(本链接第30页)显示为“现代汉语通用字表,简化字总表”,但这些字多半在这两个表中找不到。--Ming Fan 617留言2017年8月24日 (四) 06:02 (UTC)[回复]

澳门资讯系统字集/澳门增补字符集[编辑]

官方文件中提及的“Macao Supplementary Character Set”(简称 MSCS),应该对应为“澳门增补字符集”,葡文是“Colectânea de Caracteres Chineses de Macau – Novos e Complementares”[2][3][4]

而“澳门资讯系统字集”,其实是另一项东西,至今尚未诞生。它的英文是“Macao Information System Character Set”(简称 MISCS)、葡文是“Colectânea dos Caracteres Chineses dos Sistemas Informáticos de Macau”[5]。第一版将叫 MISCS-2016[6]。它除了包含“澳门增补字符集”字外,还包括 Big-5 码字和香港字。而负责此项目的“资讯系统中文编码工作小组”,英文是“The Computer Chinese Characters Encoding Workgroup”、葡文是“Grupo de Trabalho para a Codificação dos Caracteres Chineses dos Sistemas Informáticos”。

一项尚未诞生的东西,我不知道怎样能成为 CJKV 字符的来源。要么是 IRG 出错,要么就是澳门政府自己也搞乱了,又或者某日把“Macao Information System Character Set”这个名字挪用了。--Hello World! 2017年3月12日 (日) 15:19 (UTC)[回复]

“Macao Information System Character Set”,在2016年的几个网页,又被改成“Macao SAR Information Systems Character Set”,多了 SAR、System 后面加了一个 s。-Hello World! 2017年9月2日 (六) 18:31 (UTC)[回复]

条目名称:CJK 还是 CJKV?[编辑]

本条目已在“中日韩统一表意文字”和“中日韩越统一表意文字”之间数次移动。当前的条目名称为“中日韩统一表意文字”,但条目的首节中又有“旧称中日韩(CJK)统一表意文字,后来,此计划加入了越南文的喃字,所以合称中日韩越(CJKV)统一表意文字”的记述。是否应当将条目名称统一为“中日韩越统一表意文字”?——Arnie97留言2017年5月30日 (二) 04:11 (UTC)[回复]

个人认为"CJK"只是一种常见的泛称,并没有正式定义说一定只能包括Chinese Japanese和Korean文字,(唯一接近定义的只有在Unicode中,而且用的也是“CJK”而非“CJKV”)。所以虽然CJK确实包含喃字不假,仍然应该选用CJK其来作为标题名。但是与此同时,首节那段应该稍加修改(譬如,真的有“CJK计划”这种东西吗?难道不只是Unicode计划的一部分吗)减少歧义。-小烈 (找我?) 2017年5月31日 (三) 19:26 (UTC)[回复]
旧称中日韩(CJK)统一表意文字这样的说法,是很明显有误的。首先中日韩统一表意文字,是一个Unicode当中的概念。而参考CJK Unified Ideographs的官方说明,“Historically, Vietnam used Chinese ideographs too, so sometimes the abbreviation «CJKV» is used.”,且全文从未提及过CJKV可以作为其正式名称而出现。此外Unicode的名称原则上是一经确认,无法更改的,即便是命名错误也是如此。比如一个典型的错误示例:苏州码子,它的Unicode名称是Hangzhou Numeral。这是一个明显的错误,但一经发布,只能将错就错,无法修正,只能通过说明信息的方式补充纠正这个问题。至于没有错误的编码名称就更不会予以修改了。比如名为蒙古文(Mongolian)的编码,实质上同时用于表示蒙古文,满文和锡伯文。(Mongolian is a Unicode block containing characters for dialects of Mongolian, Manchu, and Sibe languages)但绝不会因为这样的原因就将编码名称进行修改并加入满文和锡伯文字样。目前中日韩统一表意文字从始至终都是Unicode里的标准说法,即便在说明信息当中也是如此,并没有被废除和更换,反而使用CJKV才是不符合Unicode标准和实际情况的。--Popcorner留言2018年7月19日 (四) 08:52 (UTC)[回复]

外部链接已修改[编辑]

各位维基人:

我刚刚修改了中日韩统一表意文字中的3个外部链接,请大家仔细检查我的编辑。如果您有疑问,或者需要让机器人忽略某个链接甚至整个页面,请访问这个简单的FAQ获取更多信息。我进行了以下修改:

有关机器人修正错误的详情请参阅FAQ。

祝编安。—InternetArchiveBot (报告软件缺陷) 2018年6月30日 (六) 05:16 (UTC)[回复]

外部链接已修改[编辑]

各位维基人:

我刚刚修改了中日韩统一表意文字中的2个外部链接,请大家仔细检查我的编辑。如果您有疑问,或者需要让机器人忽略某个链接甚至整个页面,请访问这个简单的FAQ获取更多信息。我进行了以下修改:

有关机器人修正错误的详情请参阅FAQ。

祝编安。—InternetArchiveBot (报告软件缺陷) 2018年7月30日 (一) 13:08 (UTC)[回复]

令和[编辑]

Unicode 12.1 加的“U+32FF,㋿”位于中日韩围绕字元及月份,真算是汉字吗?--水水留言2019年7月10日 (三) 06:18 (UTC)[回复]

旧的日本年号位于中日韩相容字元--水水留言2019年7月10日 (三) 06:20 (UTC)[回复]
中日韩相容字元区早已填满,所以迫不得已加到其他区段而已。由3000-33FF 之间,现在只有 3040 & 3097 & 3098 (平假名)、3100-3104 (注音符号)、3130 & 318F (谚文兼容字母)、31E4-31EF (CJK笔划)、321F (围绕字元及月份区段之中的谚文小段) 还未使用。(31BB-31BF 已有5个注音符号在13.0版填上。)--Hello World! 2019年8月19日 (一) 18:04 (UTC)[回复]

Unicode 13.0 新增字 (2020年3月)[编辑]

一批条目名翻译有误,能否批量修改/重定向[编辑]


下列模板通向9个条目名需要修改。

“中日韩统一表意文字扩展区A”到“I”,其原文是“CJK Unified Ideographs Extension A~I”,属于Unicode区段,而“区”的原文是“block”。Extension不译作“扩展区”,正如“Georgian Extended block”不译作“格鲁吉亚扩充区区段”,同时它的范围已定也不再“展开”了,因此译作“扩充”为宜。同时请注意“Georgian Supplement”即“格鲁吉亚补充”是另一个不同的区段,维基百科内翻译最好统一。

参照“Unicode Standard 译介尝试”等资料,这9个条目名应直译为并重定向到:“中日韩统一表意扩充A”到“I”(补充:Unicode划定的区段不意味着里面是文字,尤其“CJK Unified Ideographs Extension”里经查有形似而非汉字的东西,因此直译反而更好),或意译“中日韩统一表意文字扩充A”到“I”

--观赏植物留言2023年12月10日 (日) 18:28 (UTC)[回复]

除了Github,有无其他来源支持?--及时雨 留言 2023年12月11日 (一) 08:33 (UTC)[回复]
如我解释,这个不是“有无其他来源支持”的问题,是对与错的问题,维基目前是错的,甚至Unicode区段列举的除CJK Unified Ideographs以外对“Extension”都不译作“扩展区”,换言之维基自己翻译都不统一,可能有必要建立类似这样的翻译对照表。观赏植物留言2023年12月13日 (三) 13:32 (UTC)[回复]
“扩展”这个名字已经约定俗成了,要改就成原创研究了。“区”不要也可以,感觉“扩展A区”、“扩A区”的说法见的多些,可以把“区”排除出专名,当普通名词处理。--DvXg 📬 2023年12月12日 (二) 07:38 (UTC)[回复]
恕我直言,维基的译名本身已经是违背原称的原创研究,如有哪些语言学术语翻译得并不恰当? - 知乎所述,维基目前许多Unicode区段名称翻译完全是“原创研究”的,例如不统一,有的是“文”有的是“字母”有的是“文字”,甚至有“阿拉伯文字母”这种错误译名,而且Unicode划定的区段内从来都不全是“字母”或“文字”,比如第一个区段就有几十个非字母,不应译作“基本拉丁字母”(原名“Basic Latin”也不是这个意思)。又例如Old South Arabian与“阿拉伯字母”无关,Arabian不是Arabic(阿拉伯),不译作“古南阿拉伯字母”……私以为维基有必要建立类似这样的翻译对照表,以批量修改,如果不方便,至少建立重定向。观赏植物留言2023年12月13日 (三) 13:32 (UTC)[回复]
不是方不方便的问题,维基向来就是要收权威的二手资料,而不是自身创作。如果要创建类似WP:外语译音表的文字译名表、Unicode词汇对照表也可以,但是仍然需要有来源。现在的状态是一直没有靠谱来源、长期消极地容忍原创译名的结果。像现在提出来要改革了,那么这种潜在的容忍就被破坏了,so, ...--DvXg 📬 2023年12月25日 (一) 15:56 (UTC)[回复]
可能属于Wikipedia:可靠来源#采用在线或者作者自行发表的来源?如果能找到在相关技术或者学术上符合我们项目的可靠来源要求作为依据的话,或者可以考虑重新确定译名的问题?——Sakamotosan路过围观 | 避免做作,免敬 2023年12月14日 (四) 01:33 (UTC)[回复]
没理解你的意思。你仿佛在说维基的翻译是正确的(即便同一个页面上同一词的译文都没统一),而我请求的是“在线或者作者自行发表的来源”?可事实上也许刚好相反,至少维基这一块不正确、缺乏来源显然是无需赘述的吧。还是维基这一块编辑者过于业余,也是Unicode字符平面映射这页的Makasar“望加锡”,维基谁译作“玛卡莎”这么搞笑的译文放了几年都没人指出,还是我修正的,要让我提供来源,我只能回复“请问玛卡莎的来源”观赏植物留言2023年12月19日 (二) 06:44 (UTC)[回复]
意思是您可以指出条目中的内容有误或缺乏来源,以及建议改成什么,但您给出的依据仍然是非可靠来源,其他人可以据此再改成别的、用其他博客来源为据。WP:NRSNVNA是一种观点。维基数据没删[7]diff--YFdyh000留言2023年12月19日 (二) 07:10 (UTC)[回复]
是不是应该去条目版讨论?--落花有意12138 2023年12月16日 (六) 11:55 (UTC)[回复]
注意到 GB 18030GB/T 13000 均译作 “CJK统一汉字扩充A”到“CJK统一汉字扩充G”,此标准性文件当可认为非原创研究,且 GB/T 13000 实则可以理解为 Unicode / ISO/IEC10646 的官方翻译。
扩充与扩展的区分似不应过分强调,两可。或可考虑到称为“扩展X区”已是约定俗成,而取扩展一词。
现有翻译将“Extension”翻译为“扩展区”,将标号后置,实则确属问题。Block本身译作“区”、“块”、“区块”、“区段”,Block名称中实则不应当包含“区”字。即使为了交流的便利而添加,也应当作为后缀置于最末。--Kero9sene留言2023年12月24日 (日) 07:08 (UTC)[回复]
扩展x区确实是约定俗成了,可以理解为从CJK(狭义)区扩展出去。 ——魔琴 留言 贡献 新手2023计划 ] 2023年12月25日 (一) 09:59 (UTC)[回复]