汉字基因

汉字基因是朱邦复提出的一套理论。汉字构造蕴含古人的概念认知，他认为可以整理归纳成概念分类和常识分类，以此深入探求汉字背后的精微意义；并且能应用于电脑系统，使电脑能够有效地处理汉字。朱邦复等人并根据此理论创造出仓颉系统，由于技术特殊且功能强大，受到不少人关注；但由于朱邦复并非专业的文字学研究者，因此他的理论也受到一些人的质疑。

概述[编辑]

朱邦复认为汉字有六大要素和功能：字形、字音、字义、字码、字序、字辨，前三者为汉字本有，而后三者是在资讯时代为处理需要，必须发展、整理出来的要素。而对汉字进行分析，以得出基因的工作，即称为“汉字基因工程”。

因子（要素）: 汉字的六个静态属性。
功能: 汉字的六个静态属性能发挥的动态效果。
基因: 即“基本因子”。六因子分析至不能再分割者，即为汉字在六种层次上的“基因”。

因子	功能	技术应用
字码	用于汉字的编码	使用仓颉检字法可根据字形得出一个字的字码
字序	用于汉字的检索、排序	以仓颉码为内码。由于仓颉码具有固定序列，可用作排序
字形	即汉字的形体，可被人类视觉感受	字形产生器可根据仓颉码产生字形
字辨	感受汉字的形体而得知其含义的抽象、动态过程	仓颉系统可根据扫描的文字点阵图，搜寻其中的仓颉字根，转换成相应的仓颉码
字音	即汉字的读音，人类可发出和感受者	仓颉系统可根据仓颉码推断大致读音，但因古今音变剧烈，须做较多例外处理
字义	即汉字可供人认知的意义	对汉字进行“概念分类”和定义，可供电脑的“理解系统”根据仓颉码（内码）理解字义，再加以组合，即可令电脑理解人类的自然语言与思想，甚至可和人类沟通。^[1]

码序形辨的分析方法，即是早期朱邦复开发仓颉输入法的过程^[2]。而关于字义的分析方法，朱邦复认为，透过人类感官，对事物作“绝对分类”（二分法），求出最小的概念象征因子，即是字义基因；由于汉字是中文的最小组成因子，因此字义基因也是“中文概念基因”^[3]。

字易[编辑]

《字易》是朱邦复根据汉字基因理论，和网友合作写出的开放文学著作。他认为汉字由于合乎人类的思维原理，因此非常易学，其中也谈及他认为的汉字的“正确学习方法”。

朱邦复认为，汉字的创造和其字义的由来，主要系“约定俗成”，即“视讯之图形基因供约定，而由使用者是否易于接受为俗成”。由于人类的感官类似，因此对同样的视觉图像能产生类似的感受，此即“约定”。数千年以降，读书人若能轻易接受、沿用，即为“俗成”。历史上短暂出现的“死字”，皆系无法“俗成”而放弃者。

他分析了几个巨大的汉字字集，认为其中约六、七千个常用汉字都是由这样的“约定俗成”产生。这些字都有类似的组成逻辑，其中绝大多数可拆分为字首和字身，根据字首（常识分类）和字身（细部定义），就可以联想推理出汉字所表达的“主观思想概念”。而拆分到最后不能再拆的字形，即为最小的概念单位，也就是“汉字基因”中的“字义”因子。

据此，汉字学习极易，只要学习者掌握了正确的方法，对常识加以联想，就可以“触类旁通”而无须“强迫记忆”。而所谓“正确”，即符合“约定俗成之规律”，并且能正确解释古今用法的字义。

要正确地学习汉字，应先习会独体字（含字首及字身），次学组合字。此两者总共约七百馀字，却可组合常用之六、七千字。也就是说，只要熟识了七百个字形，即可掌握常用汉字八成的认知。

但同时他也发现，六万字的字集中，仍有约九成的汉字无法用汉字基因理论解释，这些字大部份是名称用字，是“纯粹的形声字”，这种字的创造与理解无干，只能视为一个符号，自然也无法用汉字基因理论解释；其他如“古用字”、“异体字”、“错讹字”亦同^[4]。学习这类“符号”的唯一方法是死记硬背，就像大部分无法拆解的英文单字一样。

字义解释[编辑]

这本书除理论以外，并以常见的字身为纲，用统一的方式解释许多类似字的字义，例如：

　　生　　　指事，會意－甲骨文
　　　　　　草木長出，活著，起始，不熟。人稱。

　　　　與〔日〕組合為〔星〕
　　　　　　日所生者，萬物之精也，在夜空為發光的天體。
　　　　與〔金〕組合為〔鉎〕
　　　　　　金所生，鐵衣，鏽也。
　　　　與〔水〕組合為〔泩〕
　　　　　　水生，水漲也。
　　　　與〔竹〕組合為〔笙〕
　　　　　　竹生，管可生音的吹奏樂器。
　　　　與〔心〕組合為〔性〕
　　　　　　人所認知之起始，事物之本質。
　　　　與〔女〕組合為〔姓〕
　　　　　　古代從母稱姓，從男稱氏，家族的代表也。
　　　　與〔貝〕組合為〔貹〕
　　　　　　財生，財富也。
　　　　與〔生〕組合為〔甡〕
　　　　　　生之再生，眾多狀。
　　　　與〔牛〕組合為〔牲〕
　　　　　　牛之生，家中生養的動物。
　　　　與〔更〕組合為〔甦〕
　　　　　　再生，死而復活。
　　　　與〔文厂〕組合為〔產〕
　　　　　　因文明而生、有價值之物品﹔製造，出生。

朱邦复认为很多当今所谓的形声字，其“声部”亦代表了一定的概念，因此实际上是“形意字”（形声兼会意字），并据此解释字义，与北宋王圣美右文说主张相同。

汉字基因字典[编辑]

《汉字基因字典》^[5]是朱邦复按汉字基因理论编纂的一部字典，特点是以汉字的字首字身解释字义，去除后来的“错讹字义”，达到“正本溯源”的目的。

他认为，汉字是世界独有的概念文字，其中蕴涵的微言大义，是古人思维的结晶，数千年来行文乃至思考的根本，因此古文能够言简意赅，含意深远。但由于白话文运动鼓吹以“词”取代“字”，现在的辞典仅解释词义而不谈及该词义的由来；而现代的字典则多以词为基准，将汉字分成一条一条解释，违反汉字本质，令汉字看似费解且难以学习。汉字“本义”被人忘却，现代人中文水平低落，正因不能辨明字义所致。为了揭示字义，消除现今辞典的弊病，故此编写这部字典。^[6]

这部字典仅取汉字的“本义”，参照《康熙字典》和《形音义综合大字典》，并根据汉字基因理论，把组合字分为字首、字身解释，字首为常识分类，字身为细部定义。从字首字身的“体用”关系联想来说明字义。再按“体用因果”组合为词，均以汉字的本义解释。如此每个字、词不再是一条一条独立的解释，而是由一个简短的概念延伸、演化而来，有源有本。

这样的编写方式是因每个汉字都表示一概念，词则是把概念加以组合联想而来。以字首字身解释汉字本义，能加深了解其中的概念，阐明汉字的微言大义。也说明只需明了字首字身和组合规律，就能掌握汉字理解的要诀，证明汉字的合理易学，是简化字和其他文字所比不上的。

汉字排序采用第五代仓颉码，是汉字基因中的“字序”因子。

这部字典由朱邦复独力编写，尚未出版。他把初稿放在其网站作参考用，收六千多字。^[7]

字例[编辑]

<闌>
連
＠【連】 (倉)卜交方交 ㄌㄧㄢˊ Lianˊ
字首〔辵〕：(用)乍行乍止，行為。
字身〔車〕：(體)有輪子的交通工具。
會意，形聲－金文
(體)道上之車，一輛接著一輛，陸軍的編制。
(用)相互接續。
組合字：鏈槤漣褳慩嗹蓮轋璉鰱蹥翴縺僆摙謰
(體)：連長：一連之長，軍隊編制。
(用)：連日：日子相接。
　　　連鎖：鎖相接。
　　　連枝：枝相接。
　　　連營：營相接。
　　　連城：城相接。
　　　連載：接續登載。
　　　連襟：接續衣襟，指姐妹之夫。
　　　連袂：接續衣袂，同行。
　　　連理：接續之理，指夫婦相愛。
　　　連環：環相接。
　　　連任：任相接。
　　　連合：接合。
　　　連坐：接坐，指有罪同坐。
　　　連忙：忙接忙。
　　　連手：手接手。
　　　連綴：接綴。
　　　連結：接結。
　　　連綿：接如棉。
　　　連線：相互接線。
　　　連絡：相互聯絡。
　　　連姻：相互聯姻。
　　　連署：接續署。

对汉字基因字典的批评[编辑]

由于朱邦复不是专业的语文研究者，有人认为他提出的“汉字基因”理论只是“拆字”，不是“释字”。其中有些内容符合汉字学的原理，但有更多不符合汉语的发展和规律。因此运用朱邦复的“汉字基因字典”必须十分谨慎，阅读常带批判角度，用以启发思考不妨，但是不能作为教学和研究的基础。

其中，“汉字基因字典”的一大特色是把大多数的汉字视作表意字，即象形、指事或会意，特别是把很多简单形声字都看成会意。有人认为，这样“把汉字看成与词汇无关的直接表达概念的符号”，是完全错误的汉字观念，是一种附会和向壁虚构。^[8]

仓颉码的应用[编辑]

尽管仓颉码并不见得受到汉字研究学者的全面接受，但是在实务上却足以作为汉字字形辨识的基础。将汉字拆解为字首与字身，或者进一步将字身细分为次字首和次字身。可以将汉字分解为基本的成分，作为计算机软体分析汉字的相似度的基础^[9]^[10]，并且建立有用的汉字学习软件的基础^[11]。

仓颉系统[编辑]

仓颉系统是朱邦复先生及沈红莲女士根据“汉字基因”理论设计的电脑系统，目的是解决汉字在数位化、资讯化上的一切困难，如缺字、编码、储存、排序、输入。

将其进一步发展，仓颉系统还可做到汉字理解（理解系统），以及将文字转为动画（图文系统）等功能。

注释[编辑]

^ 朱邦复认为，输入一段文句，令电脑解释、输出。如果输出的结果符合人类的认知，即是“理解”，是“人工智能”的表现。
^ 参考《第五代仓颉输入法手册互联网档案馆的存档，存档日期2008-09-14.》，朱邦复、沈红莲著，博硕文化出版，2006年10月初版，ISBN 978-957-527-952-3。（线上版（页面存档备份，存于互联网档案馆））。
^ 漢字基因十節課(一). [2008-09-13]. （原始内容存档于2016-07-12）.
^ 漢字基因十節課（二）. [2008-09-14]. （原始内容存档于2016-06-09）.
^ 汉字基因字典（页面存档备份，存于互联网档案馆）（繁体中文）
^ 漢字基因十節課（九）. [2008-09-14]. （原始内容存档于2016-08-15）.
^ 朱邦复工作室留言问答（页面存档备份，存于互联网档案馆）（繁体中文），第3438、5173、6014等篇。
^ http://web.hku.hk/~jwilam/chinese/chubf.htm （页面存档备份，存于互联网档案馆）（繁体中文）
^ 上海交通大学汉字编码组. 上海汉语拼音文字研究组 , 编. 漢字信息字典. 北京市科学出版社. 1988.
^ 宋柔，林民，葛诗利。. 漢字字形計算及其在校對系統中的應用. 小型微型计算机系统. 2008, 第29卷 (第10期): 第1964至1968页.
^ Chao-Lin Liu(刘昭麟), Min-Hua Lai(赖敏华), Kan-Wen Tien(田侃文), Yi-Hsuan Chuang(庄怡轩), Shih-Hung Wu(吴世弘), and Chia-Ying Lee(李佳颖). Visually and phonologically similar characters in incorrect Chinese words: Analyses, identification, and applications.. ACM Transactions on Asian Language Information Processing (USA: Association for Computing Machinery). June 2011, 10 (2): 1–39. doi:10.1145/1967293.1967297 （英语）.

参看[编辑]

外部链接[编辑]

朱邦复工作室（繁体中文）
- 汉字基因工程（页面存档备份，存于互联网档案馆）（繁体中文）
- 汉字基因字典（页面存档备份，存于互联网档案馆）（繁体中文）
  - 2017汉字基因字典（页面存档备份，存于互联网档案馆）（繁体中文）：由文化传信(厦门)有限公司整理发布。
字易（繁体中文）：朱邦复据汉字基因理论提出的汉字学习法。
汉文库典（繁体中文）：朱邦复据仓颉系统设计的线上汉典，内含汉字基因字典。
中文近形字之计算（繁体中文）

介绍及评论文章：

[1] 朱邦复认为，输入一段文句，令电脑解释、输出。如果输出的结果符合人类的认知，即是“理解”，是“人工智能”的表现。

[2] 参考《第五代仓颉输入法手册互联网档案馆的存档，存档日期2008-09-14.》，朱邦复、沈红莲著，博硕文化出版，2006年10月初版，ISBN 978-957-527-952-3。（线上版（页面存档备份，存于互联网档案馆））。

[3] 漢字基因十節課(一). [2008-09-13]. （原始内容存档于2016-07-12）.

[4] 漢字基因十節課（二）. [2008-09-14]. （原始内容存档于2016-06-09）.

[5] 汉字基因字典（页面存档备份，存于互联网档案馆）（繁体中文）

[6] 漢字基因十節課（九）. [2008-09-14]. （原始内容存档于2016-08-15）.

[7] 朱邦复工作室留言问答（页面存档备份，存于互联网档案馆）（繁体中文），第3438、5173、6014等篇。

[8] ttp://web.hku.hk/~jwilam/chinese/chubf.htm （页面存档备份，存于互联网档案馆）（繁体中文）

[9] 上海交通大学汉字编码组. 上海汉语拼音文字研究组 , 编. 漢字信息字典. 北京市科学出版社. 1988.

[10] 宋柔，林民，葛诗利。. 漢字字形計算及其在校對系統中的應用. 小型微型计算机系统. 2008, 第29卷 (第10期): 第1964至1968页.

[11] Chao-Lin Liu(刘昭麟), Min-Hua Lai(赖敏华), Kan-Wen Tien(田侃文), Yi-Hsuan Chuang(庄怡轩), Shih-Hung Wu(吴世弘), and Chia-Ying Lee(李佳颖). Visually and phonologically similar characters in incorrect Chinese words: Analyses, identification, and applications.. ACM Transactions on Asian Language Information Processing (USA: Association for Computing Machinery). June 2011, 10 (2): 1–39. doi:10.1145/1967293.1967297 （英语）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]