倉頡輸入法

维基百科,自由的百科全书

(重定向自新倉頡輸入法)
跳转到: 导航, 搜索
中文輸入法
倉頡輸入法
發明人 朱邦復
發明年份 1976年
類別 字形
「倉頡輸入法」的正體字取碼

倉頡輸入法是一種常用的中文輸入法,由台灣朱邦復1976年創製。初期只有繁體中文版本,原名「形意檢字法」,用以解決電腦處理漢字的問題,包括漢字輸入、字形輸出、內碼存儲、漢字排序等。1978年蔣緯國將軍重新定名為「倉頡輸入法」。

倉頡輸入法適用於多種平臺,主流作業系統和大部分電子辭典均有內嵌。一些線上漢字字典也採用倉頡編碼作為檢索工具。

目录

[编辑] 源流與簡介

倉頡系統中,倉頡碼不僅用來輸入固有字,也可以組合、輸出字形,甚至呈現虛構字。

朱邦復1980年代初在個人電腦上設計中文系統,以倉頡碼為其根本,收字數萬,效率甚高。

朱邦復於1982年登報公開放棄倉頡輸入法專利,並且極力推動電腦中文化。現今大部分作業系統,甚至一些電子辭典皆附有倉頡輸入法,為注音以外最普及的形碼輸入法。以往為正體中文使用地區最常用的形碼輸入法,用於香港馬來西亞等地。但台灣由於智慧注音輸入法之發展,以及後繼發明之免費及非免費等形碼輸入法甚多,「萬碼奔騰」,倉頡輸入法未成主流。目前選用倉頡輸入法者,除早期使用而不願更換外,多為其普及率考量。

朱邦復本來想根據其「漢字基因」理論,建立一「倉頡系統」,用倉頡碼統一處理漢字形、音、義、碼、序、辨等六大問題。其中倉頡碼的原始目的是漢字檢索及排序,其取碼具有字首字身的概念,以字首做為分類,字身做為補充,如此便可讓電腦「理解」漢字,進而達到組字、字義理解,甚至與人溝通的功能。

由於本以漢字檢索為目的,倉頡取碼依據視覺辨識原理,能反映漢字的細微特徵,幾乎所有不同字形異體字,都有不同的編碼,因此重碼率為當今中文輸入法中最低。倉頡輸入法亦為一般系統中字庫最大者,幾乎所有系統可見的字型,皆可用倉頡輸入法鍵入,因此也成為漢字文化工作者選用的主要輸入法。然而,當今主流電腦系統只提供倉頡輸入法,而沒有採用整套倉頡系統,因此許多原先的設計理念,如倉頡內碼、字型產生器與極大字庫等,皆沒有實現。

然而倉頡輸入法也受到許多批評,例如為顧及檢索,編碼規則繁複,無容錯編碼[1],加上系統字集問題[2]字體問題[3]、版本混亂問題[4],導致規則混亂、取碼麻煩,因而不少人視學習為畏途。另外倉頡輸入法並未為常用字之快速輸入設計簡快碼標點符號之輸入也略嫌不便,因此沒有成為最快速的中文輸入法。

目前倉頡輸入法最新的公開版本是第五代,最常使用版本是第三代。待公開的第六代(又稱蒼頡檢字法),由朱邦復的多年助手沈紅蓮設計,應用於他們開發的蒼頡系統上,該系統字庫完整收錄了歷代文獻用字十萬以上,以倉頡碼作為內碼,重碼率低於5%。因設計符合漢字特性,獲國學大師錢鍾書讚賞,並指定用來進行古籍電子化[5]第六代現僅提供部分文史專家學者使用。蒼頡檢字法不是為了支援統一碼;朱邦復批評統一碼處理漢字方法愚昧,收字不全,字序混亂,碼長不等,因此不能採用。

[编辑] 版本與適用平臺

[编辑] 版本演進

  • 1977年,朱邦復在台灣發表第一代倉頡,根據一萬二千字的《國語辭典》所設計。
  • 1980年,發表第二代倉頡,僅將第一代倉頡略作調整。
  • 1982年,發表第三代倉頡,是以《康熙字典》為範圍,選取其中四萬字,將第二代加以改良的結果。
  • 1985年,在美國發表第四代倉頡。
  • 1987年,返中國深圳科技園,任兩儀文化科技公司總經理,發表聚珍大字庫、第五代倉頡輸入法。五代將正簡字統一處理,共收集了約六萬字,同時增加一些輔助字形及修正了少許的取碼。在朱邦復工作室網站上的《第五代倉頡輸入法手冊》一書中提供了第三代、第五代改碼字的字碼對照表。
  • 1990年,與台灣資策會合作開發微軟中文視窗系統3.0,採用倉頡系統的概念。後來朱邦復與微軟的合作關係破裂,之後 Windows 系統改採用其他的漢字編碼系統,並自行更新倉頡輸入法第三代(修改了一些異體字及加入了部分香港字,但有錯碼),成為目前所見的主流版本。目前一般所稱的「三代倉頡」多指此版。
  • 2002年,朱邦復在其論壇提及,倉頡輸入法最後一版本——第六代已完成,並據之設計中文CPU。因為朱先生已不理輸入法之事,轉交沈紅蓮女士照料。倉頡輸入法至第六代改名為「蒼頡檢字法」,至2008年止未曾公開,僅供與「朱邦復工作室」有工作關係之專家學者使用。

由「面」、「非」兩字即可辨別是第三代或第五代倉頡:

  • 三代:「面」字取碼 MWYL(一田卜中);「非」字取碼 LMYYY(中一卜卜卜)
  • 五代:「面」字取碼 MWSL(一田尸中);「非」字取碼 LMSY(中一尸卜)

[编辑] 軟件支援

Windows 95 / 98 / Me / 2000 / XP作業系統中內建的倉頡輸入法是第三代倉頡的改進版;Windows Vista 內建的倉頡輸入法則兼容第三代和第五代倉頡碼(預設情況下,僅支援第三代倉頡碼;設定使用CNS11643字根後,可同時支援第三代和第五代倉頡碼)。
Mac OS X 10.4 內附的為第五代。
SCIM 同時提供第三代和第五代,部份如 OXIM 只提供第五代。
  • 其他
電子辭典等平台,中文全字庫漢字構形資料庫等漢字資料庫檢索系統,皆採用三代倉頡編碼。而朱邦復推廣的漢文庫典,則採用五代倉頡。
此外網路上還有許多自製的倉頡輸入法(見#從倉頡衍生的輸入法一節),三代和五代皆有,例如馬來倉頡之友所製作的倉頡第五代通用版、國際版與香港版等版本採用了五代倉頡。

[编辑] 取碼方法

[编辑] 倉頡鍵盤

倉頡字碼的鍵盤排列

倉頡字母(中文輸入法中通稱為「字碼」)分為四大類,共24個,另有2個特殊鍵。這些鍵與26個英文字母一一對應。(括號為讀音與特殊含義)

  • 哲理類:日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)
  • 筆劃類:竹(H,斜)、戈(I,點)、十(J,交)、大(K,叉)、中(L,縱)、一(M,橫)、弓(N,鉤)
  • 人體類:人(O)、心(P)、手(Q)、口(R)
  • 字型類:尸(S,側)、廿(T,並)、山(U,仰)、女(V,紐)、田(W,方)、卜(Y)
  • 特殊鍵:難(X),用於特殊的「難字」,包括:臼(HX),卍(NX)等;重(Z),第三代開始作為輸入標點符號,或被一些自製倉頡當作特殊鍵,寫法不一,有作「重」、「片」、「符」、「標」等等。

首24個倉頡字母還可再變化、衍生出「輔助字形」來辨別所有的中文字。

例如「水」衍生出「氵」、「又」;「中」(縱)衍生出「丨」;「弓」(鉤)衍生出「亅」等等。

[编辑] 取碼概要

倉頡輸入法取碼示例

憑視覺(非字義或筆順)把漢字分割為字首及字身,字首為最左、最上、最外部份,剩餘部份為字身。若字身可以再分,則分為次字首和次字身。各部份再分拆為有限個字碼(中間部分省略),以不破壞字形特徵和視覺容易辨識為準。取碼以後再按下空白鍵,即可輸出字形。

一個漢字最少用一碼輸入,最長則為五碼。例如:

「出」 →(分割)→ 出 →(4取碼)→ 山山 →(按鍵)→ UU
「理」 →(分割)→ 王.里 →(23取碼)→ 一土.田土 →(按鍵)→ MGWG
「菇」 →(分割)→ 艹.女.古 →(212取碼)→ 廿.女.十口 →(按鍵)→ TVJR
「語」 →(分割)→ 言.五.口 →(221取碼)→ 卜口.一一.口 →(按鍵)→ YRMMR

[编辑] 從倉頡衍生的輸入法

[编辑] 簡易/速成輸入法

簡易輸入法(DOS年代的稱呼),或稱速成輸入法(中文Windows的稱呼),又簡稱作簡易速成,為倉頡輸入法之簡化版本。只取倉頡碼的首尾兩碼,所以一字最長只有兩碼。此取碼法比較簡單,所以較受初學者歡迎。由於輸入組合只有約600個,用者要從大量同碼字中選擇需要的字,輸入速度變慢。不過一些人已將數字選擇的部分亦死記下來,使輸入速度提升,可是此法只能應付常用字。另外,由於早期已預設在Windows作業系統內,不需另行安裝,是很多電腦內最常預設的輸入法之一,所以有不少使用者。

[编辑] 新倉頡輸入法

新倉頡輸入法大約在Windows 2000推出的時間一同推出。它免除選字的麻煩,對於一個熟練的打字員,可以在完全不用看螢幕的情況下盲打,而讓系統自動分詞選字。不過由於不少人並不習慣新倉頡的盲打模式及沒有關連字的提供,他們都對新倉頡輸入法非常抗拒,甚至千方百計要找回舊有的倉頡輸入法來重新安裝。為此,微軟在後來的Windows XP裡仍保留舊有的倉頡輸入法。

[编辑] 自由倉頡輸入法

由香港華通軟件開發,免費供中港臺地區人士使用。特點如下:

  • 免費公益軟件(支援Windows Vista)
  • 依據Windows第三代倉頡為基礎
  • 支援及更正Unicode字根的編碼
  • 含有詞組輸入,大幅提高輸入速度

香港華通另設一「自由速成輸入法」,取倉頡碼的首尾兩碼,兼有以上的特點。

[编辑] 快速倉頡輸入法

快速倉頡輸入法,簡稱快倉,是麥志洪先生自1987年改良第三代倉頡輸入法而成的。 它的特點有:採用「一字多碼」的編碼策略、擁有容錯碼、改良標點符號編碼等等。

目前,「快速倉頡輸入法」已發展至第七代,又名「快倉2000中文輸入法系統」。

[编辑] 全方位倉頡輸入法

全方位倉頡輸入法(簡稱全倉)是一種由倉頡輸入法改良而成的中文輸入法。根據科學化的統計,全倉使用者的打字速度比倉頡使用者高最少百分之三十。全倉輸入法由「全倉研發小組」於2001年開始研究,同年推出正式版供用家下載,並擁有這輸入法的版權。

[编辑] 亂倉打鳥輸入法

亂倉打鳥輸入法融合了倉頡三代及大新倉頡的優點,支援常用詞及日文字母及各種符號的輸入,提供一個更快速、更簡單好用的輸入環境,同時適合入門新手以及已使用倉三、快倉、✕✕倉等的老手們來使用。

「亂倉打鳥」名字的來源,是因為此輸入法包含倉頡三代、大新倉頡以及一些自創的規則。「這樣一個『亂』七八糟的『倉』頡要『打』個什麼『鳥』啊?」,這一句說話便是本輸入法命名的原則。這個輸入法最大的優點,是提供了將近七萬個詞供輸入,且依詞頻排序過,有助增加輸入的效率。

[编辑] 易頡輸入法

  • 採用Microsoft新一代的進階文字服務來制作,支援32Bit和64Bit Windows Vista
  • 基本上兼容倉頡第五代和速成。打兩個碼便是速成,打足全部碼數便是倉頡,打不足全部倉頡碼時,易頡便會根據人工智能來尋找最合適的中文字。例如想輸入討論的「討」字,只須輸入「卜口戈」便可,所得出的候選字效率一定比速成高,因為使用者比使用速成時提供了多一個碼,電腦便有更多的資訊去找出更適合的字出來。
    易頡的口號就是「將知道的倉頡碼盡量打出來」。簡單來說,將一個字知道的倉頡碼盡量順序打出來,不知道或不確定的倉頡碼就不用打出來,最後交給易頡的人工智能來找出最合適的字。非常適合一些會倉頡但不精通的用家。詳細的說明請看易頡教學。
  • 自動學習所打過的中文字中文詞組,增加自動選擇的候選字的準確率,每個使用者都有為自已優化的資料庫

[编辑] 大新倉頡輸入法

大新倉頡輸入法,打破TQC全球華人中文輸入法新記錄──227字的輸入法,比行列輸入法的最快記錄每分鐘215.5字和嘸蝦米輸入法的一分鐘209字最高記錄還快。特色是整體減少取碼數、增加六段簡碼、多種容錯碼、重覆字最佳化編排。為一商業軟體

[编辑] 輕鬆輸入法

輕鬆輸入法雖由倉頡衍生(字根多半沿用),卻大有不同。輕鬆輸入法的宗旨是易學、方便,將字根減至75個,取碼只取頭尾,有些類似速成。

面對選字過多的問題,輕鬆輸入法採用超大詞庫、五碼定字、詞音定字等方式,不但減少選字選詞,也增加了輸入速度。

採用免費 GPL 授權,人人可以免費取得,以及自由的使用,是第一個開放源碼的輸入法系統。

[编辑] 第五代倉頡輸入法

倉頡之友 。馬來西亞推出的輸入法,支援七萬多個漢字,字根全採第五代拆碼原則。有WindowsLinux版本。為一免費軟體

[编辑] 中標倉頡輸入法

中華民國行政院主計處為「CNS全字庫」製作的輸入法表格(又稱為「對照表」或「參考檔」),目前OpenDesktop的「OXIM 輸入法 1.2.2」裡提供的「中標倉頡」即採用主計處在2006年2月22日修訂的參考檔。「中標」為「CNS11643國家中文標準交換碼」的簡稱。此參考檔支援字數超過七萬字,採用第三代倉頡拆碼原則。中標倉頡的字根與微軟倉頡的字根較近似,另外亦提供中華民國教育部頒布之國字標準字體的字根(如「今」字的「人」下面應為「一」而非「、」,但微軟倉頡只能拆「人戈弓」,中標倉頡拆「人戈弓」或「人一弓」皆可)。

[编辑] 泰瑞倉頡輸入法對照表

整合「倉頡之友 。馬來西亞」的第五代倉頡輸入法字根及中標倉頡輸入法的字根(第三代),並確認中日韓統一表意文字及其擴展A、B區合計的70,195個漢字都被編入對照表裡。另外引用了亂倉打鳥輸入法的符號字根,並做適度的修改,使得符號輸入方式更加便捷。目前已提供TXT檔(for Windows「通用輸入法編輯工具」)及CIN檔(for「Yahoo! 奇摩輸入法」、「OpenVanilla 輸入法」)兩種格式的對照表,優點為具備高度之彈性,可配合個人喜好編修對照表,來產生適合自己使用的輸入法。

[编辑] 蒼頡檢字法(倉頡輸入法六代)

詳見主條目蒼頡檢字法

[编辑] 附註

  1. ^ 在朱邦復設計的「倉頡系統」中,倉頡碼作為內碼使用,所以字元和倉頡碼只能是一對一的關係,不能有一對多的情況,這是朱邦復不設容錯碼的原因。但繁體中文Windows系統係以Big5Unicode作為內碼,因此此種一對一的限制非屬必要,所以衍生的倉頡輸入法,常出現容錯碼。
  2. ^ 倉頡系統係一字一碼,其中有編碼的許多字,因目前主流系統的字集不夠大而無法呈現,也沒有編碼,而這些系統也沒有為這些字加上容錯碼,導致使用者常常拆不出字。例如「麻」(中間為二個木,編碼「戈木木」)
  3. ^ 參見維基教科書之字體問題
  4. ^ 參見維基教科書之三代與五代編碼差異微軟三代倉頡的編碼訛誤
  5. ^ 詳見同文-漢文史考證文庫介紹

[编辑] 參見

[编辑] 外部連結

您可以在維基教科書中查找此百科条目的相關電子教程:

[编辑] 參考書籍

个人工具