倉頡輸入法
维基百科,自由的百科全书
| 中文輸入法 倉頡輸入法 |
|
| 發明人 | 朱邦復 |
| 發明年份 | 1976年 |
| 類別 | 字形 |
倉頡輸入法是一種常用的中文輸入法,由有「中文電腦之父」稱譽的台灣人朱邦復先生於1976年創製。初期只有正體中文版本,原名「形意檢字法」,用以解決電腦處理漢字的問題,包括漢字輸入、字形輸出、內碼儲存、漢字排序等。朱邦復發明此輸入法時正值他為三軍大學發展中文通訊系統之際,時任三軍大學校長的蔣緯國將軍為紀念上古時期倉頡造字之精神,乃於1978年將此輸入法重新定名為「倉頡輸入法」。
倉頡輸入法適用於多種平臺,主流作業系統和大部分電子辭典均有內嵌。一些線上漢字字典也採用倉頡編碼作為檢索工具。
目录 |
[编辑] 源流與簡介
1980年代初期,朱邦復在個人電腦上設計中文系統,以倉頡碼為其根本,收字數萬,效率甚高。
1982年,朱邦復登報公開放棄倉頡輸入法專利權,並且極力推動電腦之中文化。現今大部分作業系統,甚至一些電子辭典皆附有倉頡輸入法,為正體中文世界最普及的形碼輸入法。[1]。
朱邦復本來想根據其「漢字基因」理論,建立一套「倉頡系統」,用倉頡碼統一處理漢字的形、音、義、碼、序、辨等六大問題。其中倉頡碼的原始目的是漢字檢索及排序,其取碼具有字首及字身的概念,以字首做為分類,字身做為補充,如此便可讓電腦「理解」漢字,進而達到組字、字義理解,甚至與人溝通的功能。
由於本以漢字檢索為目的,倉頡取碼依據視覺辨識原理,能反映漢字的細微特徵,幾乎所有不同字形或異體字,都有不同的編碼,因此重碼率為當今中文輸入法最低者。倉頡輸入法亦為一般系統中支援字庫最大者,幾乎所有系統可見的漢字,皆可用倉頡輸入法鍵入,因此也成為漢字文化工作者選用的主要輸入法。然而,當今主流電腦系統只提供倉頡輸入法,沒有採用整套倉頡系統,因此許多原先的設計理念,如倉頡內碼、字型產生器與極大字庫等,都沒有實現。
倉頡輸入法雖然具備以上優點,但也受到許多批評,例如為顧及檢索,編碼規則繁複、無容錯編碼[2]、字體問題[3]、版本混亂問題[4],導致規則略顯混亂、取碼時有問題,因而被一些人視為畏途。另外倉頡輸入法並未為常用字之快速輸入設計簡快碼,標點符號之輸入也略嫌不便,因此沒有成為最快速的中文輸入法。[5]
目前倉頡輸入法最新的公開版本是第五代,最常使用版本是第三代。待公開的第六代(又稱蒼頡檢字法),由朱邦復的多年助手沈紅蓮設計,應用於他們開發的蒼頡系統上,該系統字庫完整收錄了歷代文獻用字十萬以上,以倉頡碼作為內碼,重碼率低於5%。因設計符合漢字特性,獲國學大師錢鍾書讚賞,並指定用來進行古籍電子化。[6]第六代現僅提供部分文史專家學者使用。蒼頡檢字法不是為了支援統一碼;朱邦復批評統一碼處理漢字方法愚昧、收字不全、字序混亂、碼長不等,因此不能採用。
[编辑] 版本與適用平臺
[编辑] 版本演進
- 1977年,朱邦復在台灣發表第一代倉頡,根據一萬二千字的《國語辭典》所設計。
- 1980年,發表第二代倉頡,僅將第一代倉頡略作調整。
- 1982年,發表第三代倉頡,是以《康熙字典》為範圍,選取其中四萬字,將第二代加以改良的結果。
- 1985年,在美國發表第四代倉頡。
- 1987年,返中國深圳科技園,任兩儀文化科技公司總經理,發表聚珍大字庫、第五代倉頡輸入法。第五代將正、簡體字統一處理,共收集了約六萬字,同時增加一些輔助字形及修正了少許的取碼。在朱邦復工作室網站上的《第五代倉頡輸入法手冊》一書中提供了第三代、第五代改碼字的對照表。
- 1990年,與台灣資策會合作開發微軟中文視窗系統3.0,採用倉頡系統的概念。後來朱邦復與微軟的合作關係破裂,之後Windows系統改採其他的漢字編碼系統,並自行更新第三代倉頡輸入法(修改了一些異體字及加入了部分香港字,但有錯碼),成為目前所見的主流版本。目前一般所稱的「三代倉頡」多指此版。
- 2002年,朱邦復在其論壇提及:「倉頡輸入法最後一版本——第六代已完成,並據之設計中文CPU」。因為朱邦復已不理輸入法之事,轉交沈紅蓮女士照料。第六代倉頡輸入法改名為「蒼頡檢字法」,至2008年止未曾公開,僅供與「朱邦復工作室」有工作關係之專家學者使用。
由「面」、「非」兩字即可辨別是第三代或第五代倉頡:
- 三代:「面」字取碼 MWYL(一田卜中);「非」字取碼 LMYYY(中一卜卜卜)
- 五代:「面」字取碼 MWSL(一田尸中);「非」字取碼 LMSY(中一尸卜)
[编辑] 軟體支援
- Windows 95/98/NT/ME/2000/XP 等作業系統中內建的倉頡輸入法是第三代的修改版;Windows Vista/7 內建的倉頡輸入法則兼容第三代和第五代(預設情況下,僅支援第三代;設定使用CNS11643國家標準中文交換碼字根後,可同時支援第三代和第五代)。
- Mac OS X 10.4 內附的為第五代。
- 其他
- 電子辭典等平台,中文全字庫、漢字構形資料庫等漢字資料庫檢索系統,皆採用第三代。而朱邦復推廣的漢文庫典,則採用第五代。
- 此外網路上還有許多自製的倉頡輸入法(見#從倉頡衍生的輸入法一節),三代和五代皆有,例如馬來西亞。倉頡之友所製作的倉頡第五代通用版、國際版與香港版等,採用了五代倉頡。
[编辑] 取碼方法
[编辑] 倉頡鍵盤
倉頡字母(中文輸入法中通稱為「字碼」、「字根」)分為四大類,共24個,另有2個特殊鍵。這些鍵與26個英文字母一一對應(以下括號內的中文字為字母之特殊含義):
- 哲理類:日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)
- 筆劃類:竹(H,斜)、戈(I,點)、十(J,交)、大(K,叉)、中(L,縱)、一(M,橫)、弓(N,鉤)
- 人體類:人(O)、心(P)、手(Q)、口(R)
- 字型類:尸(S,側)、廿(T,並)、山(U,仰)、女(V,紐)、田(W,方)、卜(Y)
- 特殊鍵:難(X),用於特殊的「難字」,包括:臼(HX)、卍(NX)等;重(Z),第三代開始作為輸入標點符號,或被一些自製倉頡當作特殊鍵,寫法不一,有作「重」、「片」、「符」、「標」等等。
前24個倉頡字母還可再變化、衍生出「輔助字形」(輔助字根、輔根)來辨別所有的中文字。
例如「水」衍生出「氵」、「又」;「中」(縱)衍生出「丨」;「弓」(鉤)衍生出「亅」等等。
[编辑] 取碼概要
憑視覺(非字義或筆順)把漢字分割為字首及字身,字首為最左、最上、最外部份,剩餘部份為字身。若字身可以再分,則分為次字首和次字身。各部份再分拆為有限個字碼(中間部分省略),以不破壞字形特徵和視覺容易辨識為準。
字首最多取二碼,字身最多取三碼;無法明確分割為字首、字身者(如「東」),則全取。一個漢字最少用一碼輸入,最長則為五碼。取碼以後再按下空白鍵(組字鍵),即可輸出字元(字形)。
例如:
- 「出」 →(分割)→ 出 →(4取碼)→ 山山 →(按鍵)→ UU
- 「理」 →(分割)→ 王、里 →(23取碼)→ 一土、田土 →(按鍵)→ MGWG
- 「菇」 →(分割)→ 艹、女、古 →(212取碼)→ 廿、女、十口 →(按鍵)→ TVJR
- 「語」 →(分割)→ 言、五、口 →(221取碼)→ 卜口、一一、口 →(按鍵)→ YRMMR
(以上數字為取碼規則之類別。基本上,只要將字形一分為二,最左、最上、最外的字首部份,依輔助字形取首、尾二碼;其餘的字身部份,依一定的規則取三碼,則可拆解所有漢字)
[编辑] 從倉頡衍生的輸入法
[编辑] 簡易/速成輸入法
簡易輸入法(DOS時代的稱呼),或稱速成輸入法(中文Windows的稱呼),又簡稱作簡易或速成,為倉頡輸入法之簡化版本。只取倉頡碼的首尾兩碼,所以一字最長只有兩碼。此取碼法比較簡單,所以較受初學者歡迎。由於輸入組合只有600個左右(「重」以外的25個倉頡字母相互組合,最多可組成25x25=625種組合),所以使用者要從大量重碼字中選擇需要的字,輸入速度因此變慢。不過一些人已將數字選擇的部分死記下來,使輸入速度提升,可是此法只能應付常用字。由於此輸入法早期已內建在倚天中文和Windows作業系統內,不需另行安裝,所以有不少使用者。近來微軟已推出「新速成輸入法」,以大量詞庫及智慧選字為基礎,自動為使用者選字,減輕使用者背下候選字的負擔。Windows XP/Vista/7 都有內建新速成輸入法。
[编辑] 新倉頡輸入法
新倉頡輸入法大約在Windows 2000推出的時間一同推出。它免除選字的麻煩,對於一個熟練的打字員,可以在完全不用看螢幕的情況下盲打,而讓系統自動分詞選字。不過由於不少人並不習慣新倉頡的盲打模式及沒有關連字的提供,他們都對新倉頡輸入法非常抗拒,甚至千方百計要找回舊有的倉頡輸入法來重新安裝。為此,微軟在後來的Windows XP裡仍保留舊有的倉頡輸入法。
[编辑] 自由倉頡輸入法
由香港華通軟件開發,免費供中港臺地區人士使用。特點如下:
- 免費公益軟件(支援Windows Vista)
- 依據Windows第三代倉頡為基礎
- 支援及更正統一碼字根的編碼
- 含有詞組輸入,大幅提高輸入速度
香港華通另設一「自由速成輸入法」,取倉頡碼的首尾兩碼,兼有以上的特點。
[编辑] 快速倉頡輸入法
快速倉頡輸入法,簡稱快倉,是麥志洪先生自1987年改良第三代倉頡輸入法而成的。 它的特點有:採用「一字多碼」的編碼策略、擁有容錯碼、改良標點符號編碼等等。
目前,「快速倉頡輸入法」已發展至第七代,又名「快倉2000中文輸入法系統」。
[编辑] 全方位倉頡輸入法
全方位倉頡輸入法(簡稱全倉)是一種由倉頡輸入法改良而成的中文輸入法。根據科學化的統計,全倉使用者的打字速度比倉頡使用者高最少百分之三十。全倉輸入法由「全倉研發小組」於2001年開始研究,同年推出正式版供用家下載,並擁有這輸入法的版權。
[编辑] 亂倉打鳥輸入法
亂倉打鳥輸入法融合了倉頡三代及大新倉頡的優點,支援常用詞及日文字母及各種符號的輸入,提供一個更快速、更簡單好用的輸入環境,同時適合入門新手以及已使用倉三、快倉、✕✕倉等的老手們來使用。
「亂倉打鳥」名字的來源,是因為此輸入法包含倉頡三代、大新倉頡以及一些自創的規則。「這樣一個『亂』七八糟的『倉』頡要『打』個什麼『鳥』啊?」,這一句說話便是本輸入法命名的原則。這個輸入法最大的優點,是提供了將近七萬個詞供輸入,且依詞頻排序過,有助增加輸入的效率。
[编辑] 易頡輸入法
- 採用Microsoft新一代的進階文字服務來制作,支援32Bit和64Bit Windows Vista
- 基本上兼容倉頡第五代和速成。打兩個碼便是速成,打足全部碼數便是倉頡,打不足全部倉頡碼時,易頡便會根據人工智能來尋找最合適的中文字。例如想輸入討論的「討」字,只須輸入「卜口戈」便可,所得出的候選字效率一定比速成高,因為使用者比使用速成時提供了多一個碼,電腦便有更多的資訊去找出更適合的字出來。
易頡的口號就是「將知道的倉頡碼盡量打出來」。簡單來說,將一個字知道的倉頡碼盡量順序打出來,不知道或不確定的倉頡碼就不用打出來,最後交給易頡的人工智能來找出最合適的字。非常適合一些會倉頡但不精通的用家。詳細的說明請看易頡教學。 - 自動學習所打過的中文字和中文詞組,增加自動選擇的候選字的準確率,每個使用者都有為自已優化的資料庫
[编辑] 大新倉頡輸入法
大新倉頡輸入法,打破TQC全球華人中文輸入法新記錄──227字的輸入法,比行列輸入法的最快記錄每分鐘215.5字和嘸蝦米輸入法的一分鐘209字最高記錄還快。特色是整體減少取碼數、增加六段簡碼、多種容錯碼、重覆字最佳化編排。為一商業軟體。
[编辑] 輕鬆輸入法
輕鬆輸入法雖由倉頡衍生(字根多半沿用),卻大有不同。輕鬆輸入法的宗旨是易學、方便,將字根減至75個,取碼只取頭尾,有些類似速成。
面對選字過多的問題,輕鬆輸入法採用超大詞庫、五碼定字、詞音定字等方式,不但減少選字選詞,也增加了輸入速度。
採用免費 GPL 授權,人人可以免費取得,以及自由的使用,是第一個開放源碼的輸入法系統。
[编辑] 第五代倉頡輸入法
倉頡之友 。馬來西亞推出的輸入法,支援七萬多個漢字,組字字根全採第五代拆碼原則,並為第二個重碼字(依使用頻率排序)增加以「難(X)」為開頭的組字字根,如「知」、「佑」為重碼字,「知」較「佑」常用,以「人大口(OKR)」組字時,「知」為第一個候選字(連續輸入時可以省略按1)、「佑」為第二個候選字;「佑」可用「難人大口(XOKR)」組字後直接出字。此輸入法程式有Windows及Linux版本,為一免費軟體,其介面與Windows XP簡體中文版內建的輸入法程式較接近。
[编辑] 中標倉頡輸入法
中華民國行政院主計處為「CNS全字庫」製作的輸入法表格(又稱為「對照表」或「參考檔」),目前OpenDesktop的「OXIM 輸入法 1.2.2」裡提供的「中標倉頡」即採用主計處在2006年2月22日修訂的參考檔。「中標」為「中文標準交換碼」的簡稱。此參考檔支援字數超過七萬字,採用第三代倉頡拆碼原則。中標倉頡的組字字根與微軟倉頡的組字字根較近似,另外亦提供中華民國教育部頒布之國字標準字體的組字字根(如「今」字的「人」下面應為「一」而非「、」,但微軟倉頡只能拆「人戈弓」,中標倉頡拆「人戈弓」或「人一弓」皆可)。
[编辑] 泰瑞倉頡輸入法對照表
整合「倉頡之友 。馬來西亞」的第五代倉頡輸入法組字字根及中標倉頡輸入法的組字字根(第三代),並確認中日韓統一表意文字及其擴展A、B區合計的70,195個漢字都被編入對照表裡。另外引用了亂倉打鳥輸入法的符號組字字根,並做適度的修改,使得符號輸入方式更加便捷。目前已提供TXT檔(for Windows「通用輸入法編輯工具」)及CIN檔(for「Yahoo! 奇摩輸入法」、「OpenVanilla 輸入法」、Linux平台輸入法)兩種格式的對照表,優點為具備高度之彈性,可配合個人喜好編修對照表,來產生適合自己使用的輸入法程式。
[编辑] 蒼頡檢字法(第六代倉頡輸入法)
詳見主條目蒼頡檢字法。
[编辑] 與其他形碼輸入法的比較
倉頡輸入法有下列特色:
- 是最早發明(在電腦上使用)的形碼輸入法(倉頡:1976年;五筆:1983年;大易:1988年;嘸蝦米:1989年;行列:1992年)
- 是輔助字根最少的形碼輸入法(倉頡:計入「難」對應的字根後,約為140個;五筆:約200個;大易:約250個;嘸蝦米:超過300個;行列:約250個)。
- 是重碼率最低的形碼輸入法:以Big5碼的5,401個「常用字」來看的話,重碼率為:
- 大易3碼:2,115/5,401≒39.16%
- 大易4碼:613/5,401≒11.35%
- 行列30:1,064/5,401≒19.70%
- 倉頡第三代:434/5,401≒8.04%
- 嘸蝦米:2,515/5,401≒46.57%
(參見:原始驗證檔案)
[编辑] 附註
- ^ 注音、新酷音輸入法…等歸屬音碼輸入法;簡體中文世界最普及的形碼輸入法則為五筆輸入法。
- ^ 在朱邦復設計的「倉頡系統」中,倉頡碼作為內碼使用,所以字元和倉頡碼只能是一對一的關係,不能有一對多的情況,這是朱邦復不設容錯碼的原因。但正體中文Windows系統係以Big5或Unicode作為內碼,因此此種一對一的限制非屬必要,所以衍生的倉頡輸入法,常出現容錯碼。
- ^ 參見維基教科書之字體問題。
- ^ 參見維基教科書之三代與五代編碼差異、微軟三代倉頡的編碼訛誤。
- ^ 然而,由倉頡輸入法改良而成的大新倉頡輸入法則為目前最快速的中文輸入法,它的特色是設置簡碼、最大碼長改為4碼。其最快速度為廖于萱小姐在中華民國電腦技能基金會的「TQC中打認證」上所締造的每分鐘220字紀錄。近年來,在專業認證機構或各種公開比賽的紀錄裡,大新倉頡創下的佳績已領先嘸蝦米、行列等輸入法(參見:http://www.eztyping.com.tw/prize.htm、http://www.tqc.org.tw/news/tatc/index.htm)。
- ^ 詳見同文-漢文史考證文庫介紹。
[编辑] 參見
[编辑] 外部連結
- (中文)朱邦復工作室:發明人朱邦復的網站。
- (中文)倉頡之友。馬來西亞:第五代倉頡輸入法下載、編碼表等。
- (中文)倉頡之友。香港:第三代和第五代倉頡輸入法介紹、教學、練習程式等。
- (中文)香港中文大學教育學院倉頡輸入法:快速學成倉頡輸入法的教學網站。
- (中文)快倉2000:快倉2000中文輸入法。
- (中文)【鯨魚】、【我的倉頡】輸入法:提供各種輸入法的重碼字表、學習倉頡的電子書,並比較各種中文輸入法的優缺點。
- (中文)泰瑞的世界:研究輸入法的部落格。
- Online Cangjie Input Method 網上倉頡輸入法 :提供沒有安裝倉頡輸入法的電腦直接在 Web 上用倉頡輸入法打出文章,兼容第三代和第五代。
- (英文)Cangjie 倉頡輸入法:提供大量相關連結。
[编辑] 參考書籍
- 《第五代倉頡輸入法手冊》,朱邦復、沈紅蓮著,博碩文化出版,2006年10月初版,ISBN 957-527-952-2。(影印版)(線上版)