中文输入法

维基百科,自由的百科全书
跳转至: 导航搜索
汉字
字体风格
古文 · 陶文 · 甲骨文 · 金文
籀文 · 石鼓文 · 鸟虫书
篆书大篆 · 小篆
隶书 · 楷书 · 行书 · 草书 · 书法
印刷字体风格(雕版 · 活字
仿宋体 · 宋体 · 黑体
字形
构成要素
笔画 · 笔顺 · 偏旁 · 六书 · 部首
汉字结构
合体 · 独体
汉字规范
本字 · 石经 · 康熙字典体(旧字形)
新字形 · 通用规范汉字表
国字标准字体 · 常用字字形表
汉字文化圈
中国 ·  ·  ·  ·  · 朝韩 ·  · 琉球
方言字
吴语字 · 粤语字 · 台闽字 · 四川方言字
中文汉字简化争论 · 简繁转换
繁体字 · 简化字 · 汉字简化方案  · 二简字
简笔字 · 异体字
日本国语国字问题
旧字体 · 新字体 · 扩张新字体
当用汉字 · 常用汉字 · 同音汉字书写规则
派生文字
则天文字 · 喃字 · 口诀 · 吏读 · 乡札

假名万叶 ·  ·  · 注音符号
合文 · 女书 · 古壮字 · 僰文
方块侗字 · 岱喃字 · 傈僳竹书
契丹文大字 · 小字
女真文大字 · 小字 · 西夏文

信息技术
统一码 · 中文输入技术 · 中文输入法
多音字 · 通假字 · 隶定字 · 古今字 · 生僻字 · 错别字 · 提笔忘字 · 废除汉字 · 汉字复活
查‎·论‎·
注意:本条目可能有部分字符无法显示,若遇此情况请参看Wikipedia:Unicode扩展汉字

中文输入法是指为了将汉字输入计算机手机等电子设备而采用的编码方法,是中文信息处理的重要技术。

中文输入法从1980年代发展起来的,中间为几个阶段:单字输入、词语输入、整句输入。对于中文输入法的要求是以单字输入为基础达到全面覆盖;以词语输入为主干达到快速易用;整句输入还处于发展之中。

历史[编辑]

台湾国立交通大学的一套试验汉字键盘。

由于汉字数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编输入码(检索出汉字的代码),用数个键来输入一个汉字。此外,虽然使用特殊键盘输入,可达每分600字以上的速度[1][2][3][4],但由于电脑键盘之普及,普通日常使用仍以电脑键盘为主。

中文输入法的发展过程,是“万码奔腾”的过程,在20年间出现了上千种编码方法。汉字的单字输入分为几类:音码、形码、形音码、音形码、无理码等。注意输入法编码,与汉字内码区分,内码以GB 2312-80、GB18030-2005为基础。

因为使用汉字简繁的不同,汉字计算机软件市场经常被分成两个不同的市场:简体字用户(中国大陆)和繁体字用户()。大陆计算机用户一般都会汉语拼音,所以拼音起源的输入法在大陆很普遍。在台湾,注音输入法比较流行,但市场上也有很多其他种类的输入法,如仓颉行列,香港等粤语地区也流行粤语拼音输入法。

随着地理环境交流的发展,中文输入法不断扩充字符集(或包含汉字数),以达到繁体字简体字生僻字通用的目的。主流形码输入法为了解决字符数扩充导致重码数增加的问题,大都推出了新版字根布局系统(如98五笔郑码仓颉输入法六代等),取码方式及拆字方法没有变化或变化不大。其中字根布局系统为了解决字根过多易产生重码的问题而向字根双编码(如郑码)及用已有字根组合新字根(如仓颉码)两个方向发展;取码方式及拆字方法则希望可以更多取到字形的整体结构而非仅开头部分。

简体中文键盘输入法[编辑]

简体中文输入法大部分可以分为三类:拼音输入法形码输入法(如:五笔郑码)和音形码输入法(如:二笔自然码)。绝大部分的输入法软件都采用上述的汉字编码方法。见中文输入法列表

汉语拼音输入法[编辑]

汉语拼音输入法是利用汉字读音汉语拼音)进行输入的一类汉字输入法。拼音输入法有几种输入方案包括全拼双拼。市场上有许多用拼音作基础的输入软件。多数中文操作系统均附带汉语拼音输入法,如内建于Windows的智能ABC微软拼音。此外紫光拼音拼音加加拼音之星智能狂拼黑马神拼以及近年来互联网门户公司开发的搜狗拼音谷歌拼音QQ拼音等输入法使用也较为广泛。

其中用于手机的汉语拼音输入法较常见的有:谷歌拼音输入法搜狗手机输入法A4手机输入法(现为腾讯手机输入法)、点讯输入法(现为百度手机输入法[5])、聪明打字输入法U9输入法

速打粤语拼音输入法[编辑]

速打粤语输入法是一种利用粤语拼音打字的输入法,打字速度快,简单易用。

五笔字型输入法[编辑]

五笔字型输入法王永民在1983年8月发明的一种汉字输入法。

汉字编码的方案很多,但基本依据都是汉字的读音和字形两种属性。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的“形码”。五笔字型输入法在使用简体中文的地区较广泛,是这些地区最常用的形码输入法。

郑码输入法[编辑]

郑码输入法是一套字形输入法,其发明人是中国著名文字学家、《英华大词典》主编郑易里教授及其女儿郑珑郑码设计之初便考量繁体、简体字统一编码的需要,在使用同一编码规则情况下,可以输入10万以上繁体、简体汉字。

现今大部份操作系统皆附有郑码输入法。它是简体中文使用地区最常见的形码输入法之一。为了解决繁体字简体字通用的问题,郑码采用字根双编码方式减少字根重码,因采用按特征检索基根和区码方式以及大多采用标准的偏旁部首记忆量增加不大较为易学。

二笔输入法[编辑]

二笔输入法陈劲松于1992年发明的汉字输入法,分为音形码和全角码两种,其中音形码得到较广泛使用。

二笔输入法将汉字按字形结构分为独体字和合体字;按码长分为一码字(一级简码)、二码字(含简码和全码)、三码字(含简码和全码)和四码字。输入汉字时,第一码取汉字拼音首字母,从第二码起取笔画,每二笔算一码,最多取四码,不足四码应全取,不能取双笔画时就取单笔画。二笔输入法具有规范、易学、快速的特点,也是目前唯一通过中国教育部评审的可以进入中小学教材的汉字输入法。

音形码输入法[编辑]

音形码输入法是编码方式以拼音(通常为拼音首字母或双拼)加上汉字笔画(偏旁或字根)辅助的输入法,因易学、智能且接近形码的少重码体验等特点而受到部分用户的欢迎,较好的平衡了拼音输入法重码多、输入效率低,而形码输入法学习较困难的情况。

代表输入法有二笔输入法(音形版)、自然码、拼音之星谭码、小鹤音形[6] 等。

繁体中文键盘输入法[编辑]

常见的繁体中文键盘,印有注音、仓颉 和大易码

繁体中文输入法的历史可溯及自1976年由朱邦复发明之仓颉输入法开始。目前繁体中文输入法主要有:注音输入法粤语拼音输入法仓颉输入法行列输入法呒虾米输入法大易输入法部首输入法笔划输入法郑码输入法

源自台湾[编辑]

注音输入法[编辑]

注音是采用符号或记号来标注文字的发音方式及语调,亦可称为音标、标音符号或注音符号。标音符号主要有两类,一类是以拉丁字母为基础的标音符号如国际音标汉语拼音通用拼音,这一类通常称为拼音;另一类注音符号是由北洋政府教育部于1918年11月23日所公布,目前盛行于台湾,名为“国语注音符号第一式”。

注音输入法则在此基础下,藉以利用台湾注音符号汉语拼音的注音来达到输入中文的效果,此输入法易于使用,只需用户懂得注音和拼音就可以输入中文,虽然有高选字率的缺点,仍是最常为一般台湾人使用的中文输入法。

仓颉输入法[编辑]

Ubuntu之下,以Gedit利用仓五输入中文

仓颉输入法,是由台湾人朱邦复于1976年所创制的中文输入法,最初只有繁体中文版本,原名“形意检字法”,用以解决电脑输入汉字的问题。1978年由前国防部长蒋纬国将军重新定名为“仓颉输入法”。

朱邦复公开仓颉输入法,不收分文,使电脑汉化得到很大的进展。现今大部份操作系统皆附有仓颉输入法。它是繁体中文使用地区最常用的形码输入法。

香港, 仓颉输入法与速成输入法是最常用的中文输入法[7]。由于香港回归以前,香港的教育体系并不会教习汉语拼音,因此很多香港人都不懂以拼音输入汉字,仓颉和速成遂成为香港人最常用的中文输入法。

大新仓颉输入法[编辑]

商业软件,特色是简化整体拆码规则、最大码长简为4码、增加六段简码、多种容错码、重复字优化编排等,是目前中打比赛纪绿中最快的中文输入法[8]

行列输入法[编辑]

发明者为台湾人廖明德,他曾任职发展倚天中文系统的倚天信息,行列输入法免费授权给海峡两岸的中文电脑厂商,附在各系统中,让用户可以免费使用。

行列输入法的设计和其他拆字体输入法有着很大的不同,像是一种将文字编码的方法。和早年使用来做为字典索引的四角号码一样,行列输入法也是类似这样用数字来为中文字编码。

除了将文字编码之外功能,行列输入法还将这个编码后的数字键盘互相对应,也是这样的一个映射关系,让用户省去背诵字根的力气。

大易输入法[编辑]

发明者为台湾人王赞杰

呒虾米输入法[编辑]

发明者为台湾人刘重次,以低重码率、可输入文字广泛著称的字根式输入法。呒虾米以形音义将英文字母与字根结合,所以只要可以输入英文的键盘皆可使用。

自然输入法[编辑]

自然输入法为中央研究院信息科学研究所特聘研究员许闻廉教授在1990年所发明。

汉音输入法[编辑]

汉音输入法是于1985年由松下电器技术开发公司周峻慧开发,是第一个拼音/注音兼具的智能型输入法。由于学习容易及变换率高,推出时曾造成相当震撼。惟当时台湾市场规模不大,日本松下逐渐缩小开发投资。现已无贩售与维护。

源自香港[编辑]

形笔输入法[编辑]

将中文字以形象化的字符(形笔字母)来拼砌中文字"见字打字"。

粤语拼音输入法[编辑]

利用粤语拼音来输入汉字。粤语没有像汉语拼音那样统一、通行的拼音系统,故输入法有基于不同拼音方案的系统。

快码输入法[编辑]

快码输入法是由香港九方科技控股有限公司发明的一种中文字形输入法,其把汉字归类为可横向分区字和不可横向分区字,然后再按照其输入汉字的法则把汉字编码。

九方输入法[编辑]

九方输入法同样是由香港九方科技控股有限公司发明的一种中文字形输入法。其特点是只需要使用键盘右方的数字键位置,即可输入汉字。该种输入法仅使用9个字码拆字,每个字只需输入3个字码即可选择,被认为是一种简易快捷的输入法。

纵横输入法[编辑]

纵横输入法是由香港周忠继于1993年发明的一种中文字形输入法。其特点是只需要使用键盘右方的0-9数字键位置,即可输入汉字。

六码笔画输入法[编辑]

六码笔画输入法是由香港布礼文于2007年开发的“笔画输入法”加强版,支持Windows、OS X、Android;“六码笔画”(简称G6),它除了支持“全码”笔画输入模式,更提供“六码”输入模式,其基本理念与“速成输入法”类似。 G6=diGit-6 即六码的意思,因为这种输入模式以汉字的5种基本笔画类型:横(一)、竖(丨)、撇(丿)、点(丶) 和 折(フ), 再以“头三尾三”的选码规则而编出最长为六码的汉字码或词组码。

六码笔画的主要优点是接口简洁、易学易用,因为只要懂得汉字笔顺及头三尾三的编码规则,就能轻松输入中文单字、二字词、三字词及多字词。 六码键盘是经过精心的人机界面设计,无论在柯蒂键盘或数字键盘都能以最灵活的食指、中指和无名指进行输入。用户亦能以[Y]或[/]键作六码及全码笔画输入的转换,这样就可以大大提升六码笔画的实用性。

会说普通话的输入法[编辑]

会说普通话的输入法是由香港李祥于2004年开发的一种打字时,能听到普通话同步发声,又能同步显示带声调的汉语拼音的中文输入法。输入法幕后程序上的创新达到功能上的突破:实现输入法用非拼音输入码(仓颉、速成、英文等)打词组时,也能听到和看到其轻声、儿化音及变调的效果。既是输入汉字的工具,又是香港人学习普通话的工具。开源输入法平台gcin也能提供类似的发音功能。

源自中国大陆[编辑]

汉语拼音输入法[编辑]

中国大陆市场上许多汉语拼音输入法内置了繁体中文输入功能,单击这些输入法状态栏的“简繁切换”按钮或在设置中切换为繁体模式即可以汉语拼音输入繁体字,但不少汉语拼音输入法经常出现简繁转换错误。

内嵌输入法[编辑]

  • VimIM —— Vim 中文输入法

其他输入法[编辑]

除了上述常见输入法还有些边缘输入法,使用人数不是很多,流行范围较小,但些许功能更加优秀。

联想输入法[编辑]

联想输入法是一种以键盘输入区为数字键小键盘区的输入法,曾经主要使用于银行及特殊工作行业内使用过,但现今很少有发现使用。

声韵输入法[编辑]

声韵输入法用鼠标输入中文。先点击声母,再点击韵母;或先点击韵母,再点击声母,就出现全部同声同韵的字以供选择。声母韵母均用近音字提示,不必记忆。近音检字法和粤音检字法,是声韵输入法的代表。参看外部链接。

手写输入法[编辑]

手写输入法是一种对笔迹进行智能识别以选取汉字的输入法,可以辅助输入一些生僻字。主流的汉语拼音输入法可以通过其官方站点获得手写输入法扩展,也有如“开心逍遥笔”之类独立运行的输入法。

专利与著作权[编辑]

中文输入法的拆字方法与原则若其符合专利法条件可受到专利权的保护。但是任何人依据同一套拆字方法或原则派生出的编码表是唯一的、都一模一样,所以此编码表不受著作权法保护。[9][10]

功能及质量[编辑]

中州韵输入法引擎的Windows发行版——小狼毫输入法的用户界面
商业化、内置与否

通常系统内置的输入法最方便、最泛用。而需要额外安装者次之。除下载或携带安装程序的不便以外,有些系统会限制用户不得安装软件。商业化的输入法除了需要付费,许多地方可能没有安装而造成使用不便;更甚有因公司倒闭而使输入法绝灭,用户只好重新学习新的输入法。目前有少量开源输入法,比如中州韵输入法引擎

易学

通常初学者会考量一个输入法是否易学,以下是一些影响易学性的变量:

  • 字根数目:通常字根数越多,记忆量便增加
  • 编码的合理性:编码较合理,能方便记忆,加快学习速度
  • 口诀:有些编码虽不甚合理,但附有特殊口诀,而容易记忆
  • 取码规则的繁复与否
速度
  • 重码率:重码率越低,免却选字的疑虑,输入速度越快
  • 编码长度:编码越短,输入时间越低。但另一方面,编码长度太短,又会增加重码率。因此好的输入法须取得平衡。
  • 简码:简码可大幅增加常用字的输入速度,但必须额外背诵。因此是否要背简码、简码是否好背,也是考量要点。
容错性
  • 有些输入法可一字多拆,避免一些字体由于主观认知上的差异而拆不出的困扰
  • 有些输入法支持模糊输入,如,如此一来,不会拆字时,便可用模糊的输入方式拆出
符号输入

标点符号在中文文章中相当重要,因此标点符号是否容易输入也至关紧要。 有些输入法除常用标点符号以外,尚可输入较少用的符号,如注音、希腊符号、数学符号、等等。

自由性

有些输入法可自定编码或自定词库,以词定字、以句定词、优化词库,增加灵活性。输入法的学习、记忆功能亦会影响到输入速率及体验,故不少输入法都有动态字频、动态词频。

字库大小

一些输入法只针对常用字编码,导致生僻字不是无法输入,就是难以输入。

人工智能

无论音码、形码、形音码、音形码、无理码输入法在出现重码时期望可以通过人工智能辅助选字。这方面音码因为重码较多,比较迫切,因此做得较好;相比下形码因为重码较少,支持人工智能选字的形码输入法较少,有较大发展空间。

参考资料[编辑]

  1. ^ 中华人民共和国全国首届速录信息处理大赛,来自上海的专业速录人员刘凤鸣以每分钟打出 648 个汉字的成绩打破了第 47 届国际速联大会上的国际速录比赛汉字看打最高纪录。全国首届速录大赛汉字快打速度破国际速录比赛纪录
  2. ^ 首届全国速录信息处理大赛现场(组图)
  3. ^ YouTube - 实拍+难以置信的打字速度
  4. ^ YouTube - CCTV-1_朝闻天下 速录师
  5. ^ 百度首次证实收购点讯输入法
  6. ^ 何海峰. 小鹤双拼输入法. [2014-03-31]. 
  7. ^ 在香港的文职招聘广告中,经常会要求求职者懂得仓颉及(或)速成输入法。
  8. ^ 中华民国电脑技能基金会的“TQC中打认证”中,目前最高记录为彰化成功国中黄莉晴同学的【238】字/分;行列输入法最快记录为215.5字/分,呒虾米输入法为209字/分
  9. ^ 专利期间已届满之中文输入法能以著作权保护字码表吗?
  10. ^ 字库侵权,输入法不侵权

参见[编辑]

外部链接[编辑]

中文输入法[编辑]

新闻[编辑]

在线中文输入系统[编辑]

指南[编辑]

应用商店提供的中文输入法[编辑]