日文输入法

维基百科,自由的百科全书
跳转至: 导航搜索

日文输入法日语日本語入力システム),是指为了将日语输入电脑移动电话等设备而采用的编码方法。在电脑中,英语等语言的输入只需要像打字机时代那样直接敲键盘就可以了,但是像日语这样常用文字的数目达到数千的语言,输入时不可能给每一个文字都分配一个按键,因此需要通过各种方式将文字编码为能够用简便输入。这样的编码系统就是日文输入法。

日文输入法在DOS时代都是通过前端处理程序(Front End Processor)实现的,因此当时往往被称作日语输入前端处理器(日本語入力FEP,乃至于简称为FEP)。在Windows普及后则往往被称作IME(Input Method Editor)。

在日语中,IME既可以泛指一切输入法,也可能专指微软日语输入法Microsoft IME,但本文中不用IME专指微软日语输入法。而“入力”则泛指一切的输入形式,如:输入功率等。

另外,日语中专指文字输入法的用语是“言語入力”。

键盘布局[编辑]

标准QWERTY式[编辑]

使用为美式英语设计的标准的QWERTY键盘就可以输入日语。由于QWERTY键盘上并没有铭刻假名,所以其使用者往往使用罗马字输入法。JIS键盘有而QWERTY键盘没有的按钮,可以通过按下其他组合键来模拟(例如:Ctrl+Caps Lock切换为平假名,Alt+Caps Lock切换为片假名)。

一般来说,由于只要掌握了日语罗马字的拼法就可以使用罗马字输入法,而直接输入假名则需要记忆假名在键盘上的位置;尽管许多日语的输入法提供罗马字与直接按假名这两种输入方法,尽管许多人使用附有假名的日语键盘,但大多数人(无论是否日本人)仍是靠输入罗马字的方式来输入日语,只有小部分人使用直接按键盘上的假名的方法来输入。但此输入法的罗马字与一般的有所不同,例如习惯上平文式罗马字的“ぢ”及“じ”均为ji,而输入法的前者则为di;输入“でぃ”时默认需输入dhi。输入法的“ん”需输入nn;输入小字时,在其前加上 l 或 x ,如 la 和 xa 可显示“ぁ”,xtu, xtsu, ltu, ltsu 可显示“っ”。

JIS假名式[编辑]

KB Japanese.svg

日本工业规格(JIS)有对日文键盘上的假名的排放位置有作规定。在日本销售的键盘,大部分都是QWERTY键盘或者JIS键盘。Q W E R T Y在日文键盘对应着以下假名:た て い す か ん(Ta Te I Su Ka N')

注意:标准的QWERTY键盘和JIS键盘的标点符号按键不同。例如QWERTY键盘上Shift+2是“@”,JIS键盘上却是“"”。

标记着假名的日文键盘在日本以外的市场颇为罕见,但直接输入平假名并没有任何的硬件限制。通常只需要直接切换到日文键盘序列并切换到假名模式即可直接输入平假名(也可以基于这个键盘序列通过输入法转换某些词语到日语汉字),大部分新型的操作系统都有支援这个功能。

因为日语输入是基于平假名的,输入完整的日语还需要转换汉字片假名以及普通的英语字符、标点符号,所以日文键盘上会多几个特殊按钮,使空白键短了许多,令初学者需要一定时间才能习惯。

拇指上档式[编辑]

2010年登场的遵循NICOLA规格标准的小型拇指上档键盘。双手四指放置于asdfjkl;上时,大拇指自然就处于两个上档键上。这两个上档键同时也可作为“变换键”和“无变换键”使用。

拇指上档式親指シフト)是直接输入假名的键盘布局。后来做过一些更改后又称作NICOLA(ニコラ)式。两者统称为拇指上档键盘。

JIS键盘最大的不同在于把QWERTY键盘放置空格的地方改为了两个“拇指上档键”,而空格自身变成了一个和Alt/Ctrl差不多大小的按键。这样做使得可以很容易地按上档键切换假名,而日语输入不像英语那样需要用空格隔开单词,不会因为空格难按影响输入。拇指上档式把输入假名的按键控制在3栏,而非JIS键盘的4栏。

21世纪以来,JIS键盘成了日语输入时最常使用的键盘,拇指上档键盘相比于JIS键盘处于完全不利的地位。但是由于使用者可以使用模拟程序在JIS键盘上实现拇指上档键盘的效果,拇指上档键盘的销量不能直接反映使用拇指上档式键盘布局的人数。[1]

五十音顺式[编辑]

在公共设施和银行ATM、自动导航仪上可以看到的键盘布局。将假名按照五十音图的顺序排列在键盘上。

在个人文字处理器刚刚出现的时代,许多公司发售过以50音顺排列的打字机。

手提电话[编辑]

日本的手提电话的键盘布局

手提电话的按键较电脑少,所以必须另外研发出一套完全不同的输入方法。

手提电话中的日语输入基于手提电话上的数字按钮。如图中的键盘,每个数字都对应一行假名,例4键对应行假名,这行假名包括有た ち つ て と っ,重复按4可选取想要的字。0除了对应行假名,还用作处理浊音和半浊音( ゙ ゚符号)以及拨音。小写假名以及促音与普通假名的输入方法相同(重复按键)。假名输入完毕按屏幕上提示操作以将某些字转换成想要的词语。

智能机除了使用普通手机键盘的方式输入之外,还能使用触控输入(フリック入力)。首先,各行あ段假名排成一个类似电脑键盘最右侧数字键的布局,其他4段假名按十字形或者扇形排列あ段周围。在按下某个あ段假名后手指不放并向对应方向移动,则可输入相应的假名。

编码方案及转换[编辑]

日文输入法可分为汉字直接输入漢字直接入力)和假名汉字转换かな漢字変換)两大类。其中汉字直接输入又可分为联想式和非联想式,假名汉字转换又可分为通过输入罗马字来转换成平假名或直接输入平假名。假名汉字转换是在1978年9月26日发售的东芝JW-10中最初实现的。

绝大多数日语使用者使用的都是假名汉字转换输入法。由于在假名汉字转换输入法中,直接输入平假名需要先记忆平假名的键盘分布,所以罗马字输入法也不乏使用者。也有部分软件采用GUI选字方式甚至支援手写模式作为辅助。

汉字直接输入[编辑]

汉字直接输入日语漢字直接入力,在日本往往被简称作“汉直”。由于汉直不是靠先输入日语的读音再由机器转换为对应的汉字,而是直接输入汉字或假名、符号对应的代码,因而可以做到一字一码,不会产生假名汉字转换所出现的选词选错导致的错别字。熟练者可以做到不看屏幕盲打。但是,打字者无法输入自己不知道编码的汉字。

在被称作Mainframe的大型机刚刚能够处理日语的时候(1970~1980年代早期),电脑还没有假名汉字转换的功能,内存容量也很少(那个时代即使是超大型机也只有256MB内存、几十GB的硬盘),因此曾使用过巨型键盘直接输入汉字(在一个键上分配数个汉字)、用数字键输入汉字的机内码或者JIS区位码的汉字直接输入法。

现在的汉字直接输入可分为联想式和非联想式,不论那种都是一字一码。

联想式[编辑]

编码和所输入的汉字有关。

  • 基于汉字偏旁部首的:NIK-Code、にこにこ等。
  • 基于文字意思、读音等联想的:ラインプット、カンテック、KIS、LTWORD等。

非联想式[编辑]

编码和所输入的汉字无关。

  • 基于区位码等编码的:Mac OS 的 Unicode Hex Input
  • 由文字读音指定:及其兼容FEP。

假名汉字转换[编辑]

Windows系统下的ATOK输入法正在执行转换
Windows系统下的微软日语输入法(Microsoft IME)正在执行转换

假名汉字转换的典型动作方式如下:首先,用户将想输入的文字的读音通过输入装置输入。使用键盘输入时有假名输入和罗马字输入的区别。假名汉字转换系统读取读音,通过语素解析(Text segmentation)和“读音与汉字的对照表”(也就是所谓的辞典[2])转换为汉字假名混写文

直接输入假名[编辑]

通过敲击键盘,输入键盘上所铭刻的文字中的日文的那一部分所对应的假名。例如日本常见的JIS键盘,按键后输入键的右侧铭刻的假名。假名输入(かな入力)存在不同的键盘布局。有些键盘布局只有特定的输入法才能使用,例如anthy可以使用拇指上档式输入(即使不是拇指上档式键盘也可用其他键模拟),而Google的mozc则不可。[3]另外,在GNU/Linux中键盘布局与输入法分离,如果不使用JIS键盘布局而使用直接输入假名的输入法,就会发现一部分按键顺序与Windows输入法不同。

标准罗马字[编辑]

日本工业规格JIS X 4063:2000(仮名漢字変換システムのための英字キー入力から仮名への変換方式,中译:为汉字假名转换系统而设的英语输入转换为假名的转换方式)曾经是一个日语罗马字输入(ローマ字入力)的标准,但是该标准已于2010年1月20日废止。

将和读音对应的罗马字输入后,罗马字会被转换为假名显示在屏幕上。之后进行的假名汉字转换通常与本阶段分离,成为另一个阶段。

增强型罗马字[编辑]

增强型罗马字方案类似汉语拼音输入法的双拼方案。都是使用键盘上的辅音和其他按键来代表元音组合,从而达到节省按键次数的方法。

一个增强型罗马字方案(类似汉语拼音的双拼)

这里用一个例子解释。这个键盘上除了aeiou和y以外,每个按键下都写有对应的“韵母(?)”。像chuuka即可拆分为“c+yuu k+a”,而yuu对应c,也就编码成了“ccka”。jinmin拆分为为“j+in m+in”,in对应n,所以编码成了“jnmn”。而像“央(ou)”字这样的零“声母(?)”则使用“l”代表声母,因为日语没有l开头的发音。[4]

「中華人民共和国中央人民政府、今日成立しました」这句话的标准罗马字输入(类似全拼)需要60次按键。[5]使用增强型罗马字(类似双拼)则只需要42次按键。[6]直接输入假名如果是JIS键盘,则是41次按键外加6次上档键。[7]但是这个例子中为了实现双拼,「ん」「っ」就无法再用标准罗马字输入了,而是使用“q”输入「ん」,“;”输入「っ」

M式键盘[8]是森田正典于1980年代所提出的增强型罗马字方案。[9]该键盘布局使用了和拇指上档键盘类似的拇指上档键。虽然得到了许多专业人士的极高评价,但是并未得到大的普及。[10]以后的许多增强型罗马字输入方案的思考方式都可以说类似于M式键盘的处理模式。

日语维基百科上有许多增强型罗马字方案,例如:AZIKKm式ローマ字配列チーズタイピング

不同假名输入方式的比较[编辑]

富士通[11]的网站做了一个不同输入方式速度的比较。输入700字左右的朝日新闻的“天声人语”文章,结果如下[12]

输入方式 按键总计 文字键 浊音键 上档键 假名记号键 其他 按键数/汉字假名混写文的字数 输入耗时
拇指上档 1001 994 0 0 0 7 1.03 06.04min
JIS 1211 994 100 0 100 17 1.56 07.81min
新JIS 1309 994 100 203 0 12 1.69 07.38min
标准罗马字输入 1773 1713 0 - 55 5 2.29 10.02min

看来尽管标准罗马字输入的按键量是JIS假名输入按键的近1.5倍,但是JIS假名输入的效率才是标准罗马字输入的近1.3倍。

日文输入法软件的主要功能[编辑]

输入·转换[编辑]

用户直接或间接输入假名序列(未转换文字列),按下“変換”键之后输入法开始判断进行分词,并开始汉字转换。许多输入法软件拥有包括熟语在内横跨多个文节的用例数据库,能够根据前后文节不同将读音转换成合适的汉字。一部分输入法中,未转换文字列积攒了很多假名之后会自动开始转换,或者是在输入了标点符号后自动转换标点之前的内容。

转换结果符合要求,则直接按确定键将结果转交给其他应用程序。当转换结果不是预期的转换结果时,用户可分别选择每一文节的转换结果,或者改变文节间的切分。当然,如果不用进行选字,默认的转换结果就是对的,那当然是最好的了。转换精度的优劣是决定输入法性能的决定性因素之一。

辞典[编辑]

mozc自带的辞典解释同音词止める”“辞める”“病める”意义的区别。

各输入法收入有假名汉字转换用的词汇数据库(日语称之为“系统辞典”,和“用户辞典”相对)。在汉字之外也收录有符号/特殊文字英语单词表情符号方言词汇、网络语言等等,有的输入法利用转换系统,实现了邮政编码转换为地名、翻译、计算等功能。

在许多输入法中,用户可以将自己需要的词汇加入到用户辞典里去。输入法自动学习功能强大、系统自带辞典丰富的话,可以减少自定义词汇的工作量。有的输入法可以把某个不需要却常常出现在转换结果候选的里的词通过设置屏蔽。

自动学习[编辑]

通过用户的转换、选字的结果增加未来的转换精度。通过自动学习,输入法可以更加切合个人的需要,但是有时错误的选字结果也被学习了,下次选字时就会出现在前面给人带来麻烦。ATOK等等可以直接编辑转换历史记录删除不要的转换结果。

有时学习数量过多,反而降低了转换精度,或使得学习功能异常(参见Microsoft IME)。此时需要重新初始化输入法的学习结果。

输入辅助功能[编辑]

减少输入字数的输入预测(入力予測)功能,在和电脑相比输入速度慢的手机系统上得到了发展。之后,在2000年代后期,ATOKGoogle日文输入法等电脑用的输入法中也加入了输入预测功能。Google日文输入法的预测功能使用的是从Google搜索系统中得来的数据,和手机系统的输入预测的工作方式不同。

有的输入法为帮助用户正确选择同音词,会在选字时出现解说同音词意思、用法的弹出窗口。

有的能够打字很快的用户会觉得,如果使用输入预测,则需要在预测列表中一一选择自己需要的词,反而降低了打字速度,因此辅助功能对他们是多余的。此外选字时弹出的解说词义窗口有时会影响程序的反应速度。因此许多输入法中的输入辅助功能是可以选择不使用的。

知名日文输入法软件[编辑]

微软的日语输入法输入过程展示。
微软的日语输入法的GUI选字接口。
ibus-mozc在gedit中输入的界面。
ibus-anthy在gedit中输入的界面。
名称 开发者 附注
Anthy 京都大学Project Heke 自由软件LGPL)。基本上只处理汉字转换。输入使用uimibusfcitx或者附属的anthy.el等等。名称来自少女革命的姬宫安希。ibus-anthy支持模拟拇指上档键盘。主页
ATOK JustSystems 专有软件。有GNU/Linux版本。有Mac版本。
Baidu IME 百度 专有软件,目前仅有Windows版。该输入法主要面向喜爱流行文化的年轻人,内置大量文化词汇和流行语,以及2ch常用的颜文字ASCII Art。并以二次元系角色作为其代言人[13],一度在中文御宅族中成为话题[14]。曾经在EULA中写明了“会自动将用户输入的信息加密送至百度的服务器”[15],后来该功能被改为默认不启用[16]
Canna NEC 原由NEC开发。后成为自由软件MIT许可证)。只有汉字转换。最新版Canna 3.7p3(2004/05/20)。
EGBRIDGE エルゴソフト Mac用。2008年结束销售。
FIXER シティソフト
FSKAREN 富士ソフト 嵌入式。针对AndroidWindows Mobile
Google日文输入法 Google 免费专有软件(Windows、Mac用)。自由软件版为Mozc(三段BSD)。
Microsoft IME 微软 微软Windows和Office附带。Office附带的比Windows附带的功能更多。[来源请求]
Japanist(OAK) 富士通 Windows Only。OAK是Japanist的前身。Japanist的最新版是Japanist 03。支持模拟拇指上档键盘。
Katana アイフォー 初期曾由大冢商会开发
NECAI NEC PC-9800系列用。
PRIME[失效链接] 只有汉字转换。自由软件GPLv2)。
sj3 SONY 原为索尼开发,后成为自由软件三段BSD)。只有汉字转换。
SKK SKK Openlab[失效链接] 最早由佐藤雅彦使用Emacs Lisp开发。自由软件(GPLv2+)。ibus-skk elisp skk
Social IME 奥野阳 Windows Only。可以将自定义词汇上传到服务器上。通过用户登录词汇扩充词库。转换汉字时必须总在线。
T-Code[失效链接] 自由软件
Tegaki 自由软件。手写。
TUT-Code 大岩 元,高嶋孝明
VJE バックス DOS时代的产品。2006年开发中止。2008年为雅虎假名汉字转换提供API。[17]
Wnn オムロン 针对嵌入式。具备网络透明性。原本为工作站开发。有自由软件的FreeWnn(主页)和专有软件Wnn8 for Ubuntu等。
WXG エー・アイ・ソフト DOS版、Windows3.x~NT版、Mac OS8/9版、OS/2版。WXG for Linux/FreeBSD 1.0β作为自由软件推出,取得了很大反响;但是正式版还没出现,公司就被吞并了。
松茸 管理工学研究所 DOS用。电脑普及初期曾和JustSystems一太郎分庭抗礼。后因不支持Windows而失去了半壁江山。
ことえり Apple Mac OSMac OS X自带。名字来自于《源氏物语》“文を書けど、おほどかに言選りをし”。
书院IME 夏普 也存在名为Power书院的文字处理器
演算星组 现为共享软件
かわせみ 物书堂 Mac用。专有软件

参考[编辑]

  1. ^ 亲指シフト on Linux
  2. ^ 汉语输入法常称作词库。不过日语输入法辞典往往储存了释义并在选字时会把释义用弹出窗口提示用户。
  3. ^ Linux 日本语环境设定のトラブル
  4. ^ 当然,日语里面是没有“声母”“韵母”这样的概念的,这里只是借用一下汉语拼音的概念来说明。
  5. ^ “chuukajinminkyouwakokuchuuoujinminseihu,kyouseiritusimasita.”
  6. ^ “cckajnmnkdwak,cclbjnmnszhu,kdszr6simasita.”
  7. ^ 「ちゅうかし゛んみんきょうわこくちゅうおうし゛んみんせいふ、きょうせいりつしました。」每个小字和“、”“。”需要一次SHIFT。
  8. ^ 日本语に最适なキーボード入力方式“M式”
  9. ^ 参见其“最適な日本語入力を追求したM式入力方式”部分
  10. ^ [1] 学識経験者には高く評価されましたが、大衆には周知されず、残念ながら広く普及するに至りませんでした。
  11. ^ 不言忘了它是拇指上档式键盘的销售厂商
  12. ^ キーボードを科学する。(5/6) 打鍵数と入力速度の関係 (日文). 
  13. ^ 愛美のIME体験レポート Baidu IMEで、ブログ書くのがもっと楽しくなっちゃった! (日文). 
  14. ^ 百度が日本で公式萌えキャラを出したと中国オタクの間で話題に (日文). 
  15. ^ “Baidu Type”利用ガイドライン
  16. ^ 【Baidu Type】ログ情报の送信设定を“オフ”に変更しました
  17. ^ かな汉字変换プログラム“VJE”がWebで复活、ヤフーがAPIで无偿提供

参见[编辑]

外部链接[编辑]