倉頡輸入法

維基百科,自由的百科全書
跳到: 導覽搜尋
倉頡輸入法
中文輸入法
倉頡輸入法五字拆碼.svg
倉頡輸入法繁體中文取碼
發明人 朱邦復
發明年份 1976年
類別 字形輸入法

倉頡輸入法是一種常用的中文輸入法,由有「中文電腦之父」美譽的朱邦復先生於1976年創製。初期只有繁體中文版本,原名「形意檢字法」,用以解決電腦處理漢字的問題,包括漢字輸入、字形輸出、內碼儲存、漢字排序等。朱邦復發明此輸入法時正值他為三軍大學發展中文通訊系統之際,時任三軍大學校長的蔣緯國為紀念上古時期倉頡造字之精神,乃於1978年將此輸入法重新定名為「倉頡輸入法」。

1982年,朱邦復登報公開放棄倉頡輸入法專利權,並且極力推動電腦之中文化。現今大部分作業系統,甚至一些電子辭典皆附有倉頡輸入法,繁體中文鍵盤也大多印有倉頡輸入法的字根。在繁體中文世界裏,倉頡輸入法是最為普及的形碼輸入法之一。

倉頡輸入法適用於多種平台,主流的中文作業系統和大部分電子辭典均有內建。一些字典辭典或線上中文字典亦採用倉頡編碼作為檢索工具。

根據2011年波仕特的調查報告指出,台灣使用倉頡輸入法的比例為9.9%。其他則是注音輸入法70%、嘸蝦米輸入法10.7%。[1]

香港人絕大多數使用速成輸入法(從倉頡輸入法演變出來),其次為九方輸入法,而筆劃輸入法則常見於手機文字輸入上。[2]

歷史[編輯]

倉頡系統中,倉頡碼不僅用來輸入原生字,也可以組合、輸出字形,甚至呈現虛構字

1980年代初期,朱邦復在個人電腦上設計中文系統,以倉頡碼為其根本,收字數萬,效率甚高。

1982年,朱邦復登報公開放棄倉頡輸入法專利權,並且極力推動電腦中文化。現今大部分作業系統,甚至一些電子辭典皆附有倉頡輸入法,為繁體中文世界最普及的形碼輸入法[3]

朱邦復本來想根據其「漢字基因」理論,建立一套「倉頡系統」,用倉頡碼統一處理漢字的形、音、義、碼、序、辨等六大問題。其中倉頡碼的原始目的是漢字檢索及排序,其取碼具有字首字身的概念,以字首做為分類,字身做為補充,如此便可讓電腦「理解」漢字,進而達到組字、字義理解,甚至與人溝通的功能。

由於本以漢字檢索為目的,倉頡取碼依據視覺辨識原理,能反映漢字的細微特徵,幾乎所有不同字形異體字,都有不同的編碼,因此重碼率為當今中文輸入法最低者[4]。倉頡輸入法亦為一般系統中支援字庫最大者,幾乎所有系統可見的漢字,皆可用倉頡輸入法(系統)鍵入,因此也成為漢字文化工作者選用的主要輸入法。然而,當今主流電腦系統只提供倉頡輸入法,沒有採用整套倉頡系統,因此許多原先的設計理念,如倉頡內碼、字型產生器與極大字庫等,都沒有實現。[5]

優缺點[編輯]

由於開發甚早,又無版權,倉頡輸入法的普及度在中文電腦系統中十分高,號稱「只要有中文系統,就必定有倉頡輸入法的存在」,所以人們學習了倉頡後,理論上是不用擔心無法使用它的。此外倉頡的重碼率很低,這就讓使用者只需要看着稿子或鍵盤就能打字,不需要緊盯着螢光幕來選字。

倉頡輸入法雖然具備以上優點,但也受到許多批評,例如為顧及檢索,編碼規則繁複、無容錯編碼[6]字體問題[7]、版本混亂問題[8],導致規則略顯混亂、取碼時有問題,因而被一些人視為畏途。另外倉頡輸入法並未為常用字之快速輸入設計簡快碼,沒有類似於五筆的詞組輸入方法,標點符號之輸入也略嫌不便,因此沒有成為最快速的中文輸入法。

最新版本[編輯]

目前倉頡輸入法最新的公開版本是第五代,最常使用版本是第三代。待公開的第六代(又稱蒼頡檢字法),由朱邦復的多年助手沈紅蓮設計,應用於他們開發的蒼頡系統上,該系統字庫完整收錄了歷代文獻用字十萬以上,以倉頡碼作為內碼,重碼率低於5%。因設計符合漢字特性,獲國學大師錢鍾書讚賞,並指定用來進行古籍電子化[9]第六代現僅提供部分文史專家學者使用。蒼頡檢字法不是為了支援統一碼;朱邦復批評統一碼處理漢字方法愚昧、收字不全、字序混亂、碼長不等,因此不能採用。

輸入介面[編輯]

Microsoft Windows
Ubuntu之下,以Gedit利用倉五輸入中文

使用倉頡時並沒有任何特別介面,只會出現

維基百 

這樣的小框於文字旁邊。


用戶亦可使用「*」(Shift + 8)來代表不知道的碼︰

廿  


結果會與速成輸入法出來的結果一樣。

OS X

OS X,Z鍵是「重」,每個「重」代表一個未知的碼︰

維基百竹重重十
維基百科

版本與平台[編輯]

版本演進[編輯]

  • 1977年,朱邦復在台灣發表第一代倉頡,根據一萬二千字的《國語辭典》所設計。
  • 1980年,發表第二代倉頡,僅將第一代倉頡略作調整。
  • 1982年,發表第三代倉頡,是以《康熙字典》為範圍,選取其中四萬字,將第二代加以改良的結果。
  • 1985年,在美國發表第四代倉頡。
  • 1987年,返中國深圳科技園,任兩儀文化科技公司總經理,發表聚珍大字庫、第五代倉頡輸入法。第五代將正、簡體字統一處理,共收集了約六萬字,同時增加一些輔助字形及修正了少許的取碼。在朱邦復工作室網站上的《第五代倉頡輸入法手冊》一書中提供了第三代、第五代改碼字的對照表。
  • 1990年,與台灣資策會合作開發微軟中文視窗系統3.0,採用倉頡系統的概念。後來朱邦復與微軟的合作關係破裂,之後Windows系統改採其他的漢字編碼系統,並自行更新第三代倉頡輸入法(修改了一些異體字及加入了部分香港字,但有錯碼),成為目前所見的主流版本。目前一般所稱的「三代倉頡」多指此版。
  • 2002年,朱邦復在其論壇提及:「倉頡輸入法最後一版本 —— 第六代已完成,並據之設計中文CPU」。因為朱邦復已不理輸入法之事,轉交沈紅蓮女士負責。第六代倉頡輸入法改名為「蒼頡檢字法」,至2011年止未曾公開,僅供與「朱邦復工作室」有工作關係之專家學者使用。
由「面」、「非」兩字即可辨別是第三代、第五代倉頡或者第六代蒼頡:
  • 三代:「面」字取碼MWYL( );「非」字取碼LMYYY(
  • 五代:「面」字取碼MWSL( );「非」字取碼LMSY( 
  • 六代:「面」字取碼MWS(  );「非」字取碼LSY(  

軟件支援[編輯]

Windows 95/98/NT/ME/2000/XP作業系統中內建的倉頡輸入法是第三代的修改版;Windows Vista/7/8內建的倉頡輸入法則相容第三代和第五代(預設情況下,僅支援第三代;設定使用CNS11643中文標準交換碼字根後,可同時支援第三代和第五代)。
Mac OS X 10.4內附的為第五代。
SCIMgcin 同時提供第三代和第五代,部份如OXIM只提供第五代。
  • 其他
電子辭典等平台,中文全字庫漢字構形數據庫 等漢字數據庫檢索系統,皆採用第三代。而朱邦復推廣的漢文庫典,則採用第五代。
此外網絡上還有許多自製的倉頡輸入法,第三代和第五代皆有,例如馬來西亞。倉頡之友 所製作的倉頡第五代通用版、國際版與香港版等,採用了五代倉頡。

取碼方法[編輯]

倉頡鍵盤[編輯]

倉頡輸入法所有字根在電腦鍵盤上的排列

倉頡字母分為四大類,共24個,另有2個特殊鍵。這些鍵與26個英文字母一一對應(以下括號內的中文字為字母之代表字[10]):

哲理類 筆畫類 人體類 字形類 特殊鍵
  • 日(A)
  • 月(B)
  • 金(C)
  • 木(D)
  • 水(E)
  • 火(F)
  • 土(G)
  • 竹(H)
  • 戈(I)
  • 十(J)
  • 大(K)
  • 中(L)
  • 一(M)
  • 弓(N)
  • 人(O)
  • 心(P)
  • 手(Q)
  • 口(R)
  • 尸(S)
  • 廿(T)
  • 山(U)
  • 女(V)
  • 田(W)
  • 卜(Y)
  • 難(X),用於特殊的「難字」,包括:臼(HX)、卍(NX)等。注︰輸入    並不會輸出「難」字。
  • 重(Z),從第三代開始作為輸入標點符號,如「句號 」,或被一些自製倉頡當作特殊鍵,寫法不一,有作「重」、「片」、「符」、「標」等等。

前24個倉頡字母還可再變化、衍生出「輔助字形」(輔助字根、輔根)來辨別所有的中文字。

例如「水」衍生出「氵」、「又」;「中」(縱)衍生出「丨」;「弓」(鈎)衍生出「亅」等等。

取碼概要[編輯]

倉頡輸入法的取碼範例

憑視覺(非字義或筆順)把漢字分割為字首及字身,字首為最左、最上、最外部份,剩餘部份為字身。若字身可以再分,則分為次字首和次字身。各部份再分拆為有限個字碼(中間部分省略),以不破壞字形特徵和視覺容易辨識為準。

字首最多取二碼,字身最多取三碼;無法明確分割為字首、字身者(如「东」),則全取。一個漢字最少用一碼輸入,最長則為五碼。取碼以後再按下空白鍵(組字鍵),即可輸出字元(字形)。

例如:

漢字 分割 取碼 對等按鍵
山、山 4-1 取碼 山山 UU
王、里 2-3 取碼 一土、田土 MGWG
艹、女、古 2-1-2 取碼 廿、女、十口 TVJR
言、五、口 2-2-1 取碼 卜口、一一、口 YRMMR
註︰ 以上數碼為取碼規則之類別。基本上,只要將字形一分為二,最左、最上、最外的字首部份,依輔助字形取首、尾二碼;其餘的字身部份,依一定的規則取三碼,則可拆解所有漢字)

繁簡輸出[編輯]

倉頡輸入法是少數能同時輸出繁、簡體的輸入法,但簡體倉頡的拆字法則仍在發展中,微軟視窗內置倉頡跟蘋果OS部分拆字亦略有差異,部分違反了原本的拆碼規則,熟習繁體輸入的用戶需要稍作適應。一些外掛的倉頡輸入法會採取加入容錯碼,令同一字可能有不同拆碼。

例如:

簡體字 字碼 註譯
弓女弓人 繁體「飲」字的首碼是「人」,但打簡體時,「饣」首碼是「弓」形,因此「饮」的全碼是「弓女弓人」。
女一 在繁體中,練、絲、紅這類字的「糸」部首均為「女火」,但簡體练、红的輸入方法是「女一」。
大木 「大木」相交,形成「东」字,因此取碼為「大木」。「陈」(陳)字是「阝」(弓中)+「东」字,編碼是「弓中大木」;然而,「练」(練)字的邊旁雖然看似「东」,但其邊旁寫法並非「東」字,取碼應為「女一」+「手木」,而非「大木」。
广 卜竹 「廣」的首碼為「戈」,但簡體卻是「卜」,如「广」全碼是「卜竹」而非「戈」。
金一大 首碼為「金」而非「廿」,全碼為「金一大」。
一月人 繁體「頁」為「一月山金」,但簡體是「一月人」,最後一碼是「人」而不是「金」。
戈弓 言字旁,取碼為「戈弓」,如「订」的編碼是「戈弓」+「一弓」。
雖然「冰」、「冷」等繁體為「冫」偏旁的字,「冫」取碼為「戈一」;但一些只會在簡體才出現這偏旁的字,例如「冲」、「凉」等(這些字繁體時的偏旁為三點水),「冫」取碼為「卜」(兩點)。

此外,簡體倉頡亦有小部分一字兩碼或違反直覺的情況,例如:

簡體字 字碼 註譯
  • 心人
  • 人心卜口女
編碼可以是「心人」或「人心卜口女」,兩者均不符合倉頡取碼法則。
  • 心人
  • 中尸
編碼可以是「心人」或「中尸」(後者符合取碼原則),但輸入「问」字時,必須輸入「中尸口」,而非「心人口」。
戈月弓木 按倉頡原則,此字首碼應為「火」,但簡倉卻編成「戈月弓木」,該字開首的「灬」(火)被當成「丶」(戈)看,需要強記。
人一 在倉頡中是「人土」,但「谁」字的簡體碼是「戈弓人一」,「准」字是打「戈一人土」,此中分別只能強記。
弓心一 編碼為是「弓心一」,並不符合倉頡取碼規則。

不過,大部分字如         均符合繁體倉頡的取碼原則,毋須重新適應。金字旁的字如  ,編碼則與繁體相同,需要選字。另外「人心日女」亦能打出字。

其他特色[編輯]

以下是字形輸入法的比較
字形輸入法 時間 輔助字根數 大五碼重碼率[11]
共5401個常用字
倉頡輸入法 1976年 140個(含難字根) 三代:434÷5401=8.04%
鄭碼 1980年 約170個 不明
五筆字型輸入法 1983年 約200個 不明
大易輸入法 1988年 約250個 三碼:2115÷5401=39.16%
四碼:613÷5401=11.35%
嘸蝦米輸入法 1989年 約250個 2515÷5401=46.57%
行列輸入法 1992年 超過300個 三十:1064÷5401=19.70%

倉頡和速成也能輸入標點符號,方法是輸入 ,速成則取頭尾碼,或選擇全形後直接按鍵盤上相應的半形標點符號。另外同時按下 Ctrl + Alt + , 會彈出符號表。

第一個?只能為 A、B、C 其中一個,
第二個?只能為 A 至 Y 其中一個。

比較常用的為 ,以及 

衍生[編輯]

有眾多輸入法皆源自倉頡輸入法,如下所示:

  • 簡易輸入法
  • 新倉頡輸入法:發佈時間大約在Windows 2000推出時,同時發佈還有新注音輸入法。它免除選字的麻煩,對於一個熟練的打字員,可以在完全不用看螢幕的情況下盲打,而讓系統自動分詞選字。不過由於不少人並不習慣新倉頡的盲打模式及沒有關連字的提供,他們都對新倉頡輸入法非常抗拒,甚至千方百計要找回舊有的倉頡輸入法來重新安裝。為此,微軟在後來的Windows版本裡仍保留舊有的倉頡輸入法。
  • 第五代倉頡輸入法:發明人朱邦復支援倉頡之友·馬來西亞推出的輸入法,支援七萬多個漢字,組字字根全採第五代拆碼原則,並為第二個重碼字(依使用頻率排序)增加以「難(X)」為開頭的組字字根,如「知」、「佑」 為重碼字,「知」較「佑」常用,以「人大口(OKR)」組字時,「知」為第一個候選字(連續輸入時可以省略按1)、「佑」為第二個候選字;「佑」可用「 人大口(OKR)」組字後直接出字。此輸入法程式有WindowsLinux版本,為一免費軟件,其介面與Windows XP簡體中文版內建的輸入法程式較接近。此外,Linux系統多已內建三代及五代倉頡輸入法。
  • 自由倉頡輸入法:由香港華通軟件開發,免費供中港臺地區人士使用。
    香港華通另設一「自由速成輸入法」,取倉頡碼的首尾兩碼,兼有以上的特點。
    特點如下:
  1. 免費公益軟件(支援Windows Vista/7
  2. 使用全新的「TSF」輸入技術,全面支援32位元/64位元Windows平台。
  3. 依據Windows第三代倉頡為基礎
  4. 支援及更正統一碼字根的編碼
  5. 含有詞組輸入,大幅提高輸入速度
  • 快速倉頡輸入法:簡稱快倉,是麥志洪先生自1987年改良第三代倉頡輸入法而成的。
    快速倉頡輸入法視窗版本叫作「快倉2000 中文輸入法系統」。
    「快速倉頡輸入法」已發展至第七版,第七版以提升打字速度為主,並不納入「一字多碼」及容錯碼。
    「快速倉頡輸入法」第六版有以下特點:
  1. 簡化倉頡輸入法的編碼規則,即取倉頡碼的第一、二和尾碼
  2. 「快倉字根偏旁」編碼技術減少重碼
  3. 「高頻字根偏旁」編碼技術減少重碼
  4. 消滅重碼的「SDFG」編碼技術
  5. 兩碼簡碼表
  6. 採用「一字多碼」的編碼策略包含了兩種輸入法:一是倉頡輸入法(傳統的第三代倉頡輸入法),二是已改良的倉頡輸入法(包含簡化的第一、二和尾碼;快倉字根偏旁;高頻字根偏旁。亦即第七版快倉)
  7. 擁有容錯碼
  8. 改良標點符號編碼
  • 輕鬆輸入法:輕鬆輸入法雖由倉頡衍生(字根多半沿用),卻大有不同。輕鬆輸入法的宗旨是易學、方便,將字根減至75個,取碼只取頭尾,有些類似速成。
    面對選字過多的問題,輕鬆輸入法採用超大詞庫、五碼定字、詞音定字等方式,不但減少選字選詞,也增加了輸入速度。
    採用免費GPL授權,人人可以免費取得,以及自由的使用,是第一個開放源碼的輸入法系統。

輸入法表格:

  • 蒼頡檢字法
  • 中標倉頡中華民國行政院主計處為「CNS全字庫」製作的輸入法表格(又稱為「對照表」或「參考檔」),目前OpenDesktop的「OXIM輸入法1.2.2」裡提供的「中標倉頡」即採用主計處在2006年2月22日修訂的參考檔。「中標」為「中文標準交換碼」的簡稱。此參考檔支援字數超過七萬字,採用第三代倉頡拆碼原則。中標倉頡的組字字根與微軟倉頡的組字字根較近似,另外亦提供中華民國教育部頒佈之國字標準字體的組字字根(如「今」字的「人」下面應為「一」而非「、」,但微軟倉頡只能拆「人戈弓」,中標倉頡拆「人戈弓」或「人一弓」皆可)。
  • 泰瑞倉頡輸入法:整合「倉頡之友·馬來西亞」的第五代倉頡輸入法組字字根及中標倉頡輸入法的組字字根(第三代),並確認中日韓統一表意文字及其擴展A、B區合計的70195個漢字都被編入對照表裡。另外參照了亂倉打鳥輸入法的符號組字字根,並做適度的修改,使得符號輸入方式更加便捷。目前已提供TXT檔(給 Windows「通用輸入法編輯工具」)及CIN檔(給「Yahoo! 奇摩輸入法」、「OpenVanilla輸入法」、Linux平台輸入法)兩種格式的對照表,優點為具備高度之彈性,可配合個人喜好編修對照表,來產生適合自己使用的輸入法程式。
  • 亂倉打鳥:融合了倉頡三代及大新倉頡的優點,支援常用詞及日文字母及各種符號的輸入,提供一個更快速、更簡單好用的輸入環境,同時適合入門新手以及已使用倉三、快倉、✕✕倉等的老手們來使用。
    「亂 倉打鳥」名字的來源,是因為此輸入法包含倉頡三代、大新倉頡以及一些自創的規則。「這樣一個『亂』七八糟的『倉』頡要『打』個什麼『鳥』啊?」,這一句 說 話便是本輸入法命名的原則。這個輸入法最大的優點,是提供了將近七萬個詞供輸入,且依詞頻排序過,有助增加輸入的效率。
  • 簡體倉頡輸入法:是由第五代倉頡輸入法和網上流傳的第六代倉頡輸入法整合修改而成。只支援簡化字輸入。建立於2013年7月。[12]
    簡體倉頡輸入法有如下特點:
  1. 選字範圍以國家語委早期發佈的現代漢語通用字表和2013年發佈的通用規範漢字表及其徵求意見稿為藍本。在此基礎上略有擴充。所選字數在8600字以上。
  2. 取碼以簡化字宋體字型為標準。
  3. 取碼基本沿用倉頡五代的取碼規則,在左右結構和上下結構的判斷上採用了更直觀的方式。
  4. 字根以網上流傳的第六代倉頡輸入法為基礎,為便於簡化字錄入進行了一定改進。
  5. 對取碼有爭議或有難度的字設立了容錯碼,容錯碼的設定以不增加常用字重碼為原則。
  6. 一、二級漢字中的五碼字均可四碼輸入。
  7. 設定以分號後置的重碼解決方案,以免去對不常用重碼字的預判。
  8. 碼錶內容以 CC-BY-NC-SA-3.0 協議授權。

以下是商業軟件

  • 易頡輸入法
  • 大新倉頡輸入法:為商業軟件,特色是簡化整體拆碼規則、最大碼長簡為4碼、增加六段簡碼、多種容錯碼、重覆字最佳化編排等,並提供優質的影音、圖文教學。大新倉頡為TQC中打認證中創下最高記錄的打字者所使用的輸入法。[13]

已經不存在的輸入法:

參考資料[編輯]

  1. ^ Pollster波仕特線上市調:七成以上民眾使用注音輸入法
  2. ^ Chinese Input Methods - fedorapeople.org
  3. ^ 注音新酷音輸入法等歸屬音碼輸入法簡體中文世界最普及的形碼輸入法則為五筆輸入法
  4. ^ 與其他形碼輸入法的比較
  5. ^ 一般所稱「倉頡輸入法」僅是朱邦復構思之整套倉頡系統中的部份功能。
  6. ^ 在朱邦復設計的「倉頡系統」中,倉頡碼作為內碼使用,所以字元和倉頡碼只能是一對一的關係,不能有一對多的情況,這是朱邦復不設容錯碼的原因。但繁體中文Windows系統係以Big5Unicode作為內碼,因此此種一對一的限制非屬必要,所以衍生的倉頡輸入法,常出現容錯碼。
  7. ^ 參見維基教科書之字體問題
  8. ^ 參見維基教科書之三代與五代編碼差異微軟三代倉頡的編碼訛誤
  9. ^ 詳見同文-漢文史考證文庫介紹。
  10. ^ 第五代倉頡輸入法手冊第二節:倉頡字母
  11. ^ 參見:原始驗證檔案
  12. ^ 官方網站 - 簡體倉頡輸入法
  13. ^ 中華民國電腦技能基金會的「TQC中打認證」中,目前最高記錄為彰化成功國中黃莉晴同學的【238】字/分;行列輸入法最快記錄為215.5字/分,嘸蝦米輸入法為209字/分

相關條目[編輯]

外部連結[編輯]

Wikibooks-logo.svg
您可以在維基教科書中尋找此百科條目的相關電子教程: