五筆字型輸入法

維基百科,自由的百科全書
跳到: 導覽搜尋
五筆字型輸入法
中文輸入法
New Wubi.png
五筆新世紀版碼元的示意圖
發明人 王永民
發明年份 1983年8月
類別 字型

五筆字型輸入法簡稱五筆,是王永民在1983年8月發明的一種漢字輸入法中文輸入法的編碼方案很多,但基本依據都是漢字的讀音和字形兩種屬性。五筆字型完全依據筆畫和字形特徵對漢字進行編碼,是典型的形碼輸入法

五筆字型輸入法主要用於使用簡體中文中國大陸,過去,五筆打字比拼音輸入法方便,但隨着智能拼音的興起,五筆已經不具備優勢。調查表明,目前,在大學生中,使用五筆的人已經很少了[1]

字根[編輯]

五筆字根是五筆輸入法的基本單元,86版使用234個字根,98版使用259個字根,新世紀版使用了226個字根。

五筆中的漢字結構及字型[編輯]

基本字根在組成漢字時,按照它們之間的位置關聯可以分成四類結構。

  • 單:基本字根本身就單獨成為一個漢字。這種情況包括鍵名字和成字字根。如:口、木、竹等。
  • 散:指構成漢字的基本字根之間可以保持一定的距離。如:漢、湘、結、別、安、意等。
  • 連:指一個基本字根連一單筆畫。如:「丿」連「目」成為「自」。
  • 交:指幾個基本字根交叉套迭之後構成的漢字。如「申」是由「日」交「丨」,「夷」由「一」交「弓」交「人」交叉構成。

在五筆中,漢字分為左右型、上下型和雜合型漢字。

取碼原理[編輯]

這是五筆98碼元的示意圖。僅供參考
第三代五筆字型(新世紀版)簡體字根鍵位圖。僅供參考

五筆將漢字筆劃分為五個區:即:(同)、(同)、五區。把字根碼元按一定規律分佈在25個字母鍵上(即標準的QWERTY鍵盤,不包括Z)。取碼時最長四碼,最短一碼。

2006年12月,王永民又在此基礎上,研究出用於手提電話輸入的基於6個碼元和「右手法則——前四末一」取碼法的數碼王碼[2]

鍵名字[編輯]

鍵名是指各鍵位左上角的黑體字根,它們是組字頻度較高,而形體上又有一定代表性的字根,它們中絕大多數本身就是漢字,只要把它們所在鍵連擊四次就可以了。如:王:11 11 11 11(GGGG)

成字字根[編輯]

在每個鍵位上,除了一個鍵名字根外,還有數量不等的幾種其它字根,它們中間的一部分其本身也是一個漢字,我們稱之為成字字根。 輸入方法:鍵名代碼+首筆代碼+次筆代碼+末筆代碼(如果該字根只有兩筆畫,則補空格鍵結束)

86版五筆字根

  • 1區橫起筆 11G 王旁青頭戔(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石廠 14S 木丁西 15A 工戈草頭右框七
  • 2區豎起筆 21H 目具上止卜虎皮 22J 日早兩豎與蟲依 23K 口與川,字根稀 24L 田甲方框四車力 25M 山由貝,下框幾
  • 3區撇起筆 31T 禾竹一撇雙人立,反文條頭共三一 32R 白手看頭三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺點無尾魚,犬旁留兒一點夕,氏無七(妻)
  • 4區點起筆 41Y 言文方廣在四一,高頭一捺誰人去 42U 立辛兩點六門疒(病) 43I 水旁興頭小倒立 44O 火業頭,四點米 45P 之字軍蓋道建底,摘礻(示)衤(衣)
  • 5區折起筆 51N 已半巳滿不出己,左框折屍心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴馬,丟矢矣 55X 慈母無心弓和匕,幼無力

98版五筆字根

  • 1區橫起筆 11 G 王旁青頭五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石廠 14 S 木丁西甫一四里 15 A 工戈草頭右框七
  • 2區豎起筆 21 H 目上卜止虎頭具 22 J 日早兩豎與蟲依 23 K 口中兩川三個豎 24 L 田甲方框四車力 25 M 山由貝骨下框里
  • 3區撇起筆 31 T 禾竹反文雙人立 32 R 白斤氣丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登頭單人幾 35 Q 金夕鳥兒犭邊魚
  • 4區點起筆 41 Y 言文方點誰人去 42 U 立辛六羊病門裡 43 I 水族三點鱉頭小 44 O 火業廣鹿四點米 45 P 之字寶蓋補礻衤
  • 5區折起筆 51 N 已類左框心屍羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶馬失蹄 55 X 么母貫頭弓和匕

新世紀版五筆字根

  • 1區橫起筆 11 G 王旁青頭五一提 12 F 土士二干十寸雨 13 D 大三肆頭古石廠 14 S 木丁西邊要無女 15 A 工戈草頭右框七
  • 2區豎起筆 21 H 目止具頭卜虎皮 22 J 日曰兩豎與蟲依 23 K 口中兩川三個豎 24 L 田框四車甲單底 25 M 山由貝骨下框里
  • 3區撇起筆 31 T 禾竹牛旁臥人立 32 R 白斤氣頭叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭風頭幾 35 Q 金夕犭兒包頭魚
  • 4區點起筆 41 Y 言文方點在四一 42 U 立帶兩點病門裡 43 I 水邊一族三點小 44 O 火變三態廣二米 45 P 之字寶蓋補示衣
  • 5區折起筆 51 N 已類左框心屍羽 52 B 子耳了也乃齒底 53 V 女刀九巡錄無水 54 C 又巴甬矣馬失蹄 55 X 么母絞絲弓三匕

單字輸入[編輯]

除鍵名字和成字字根漢字之外的漢字,如果一個字可以取夠四個字根,就全部用字根鍵入,只有在不足四個字根的情況下,才有必要追加識別碼。

末筆字型識別碼[編輯]

當一個字拆不夠4個碼元時,它的輸入編碼是:先打完碼元,再追加一個「末筆字型識別碼」,簡稱「識別碼」。末筆字型識別碼由漢字的末筆畫代碼和字型代碼組成。

拆分原則[編輯]

  • 能散不連
  • 兼顧直觀
  • 能連不交
  • 取大優先

詞組的錄入[編輯]

  • 雙字詞

取第一字的前兩位編碼和第二字的前兩位編碼,如「北」(UXN)+「京」(YIU)=「北京」(UXYI

  • 三字詞

取第一字的第一位編碼,第二位的第一位編碼,第三字的前兩位編碼,如「毛」(TFNV)+「澤」(ICFH)+「東」(AII)=「毛澤東」(TIAI

  • 四字詞

取每一個字的第一位編碼,如「六」(UYGY)+「十」(FGH)+「四」(LHNG)+「卦」(FFHY)=「六十四卦」(UFLF

  • 多字詞

取一、二、三、末字的第一位編碼,如「中」(KHK)+「國」(LGYI)+「共」(AWU)+「產」(UTE)+「黨」(IPKQ)=「中國共產黨」(KLAI

簡碼字[編輯]

指一些較常用字可以用一、二或三字母編碼打出,分別稱為一、二、三級簡碼

一級簡碼包含漢語(尤其是官方語體)最常用字中的25個,為了儘可能全面地安排最常用的漢字,部分一級簡碼並非是該字全碼的首位。

但所有的二級或三級簡碼均為該字全碼的前二或三位

一級簡碼如下,86版、98版和新世紀版通用

編碼 A B C D E F G H I J K L M N O P Q R S T U V W X Y
文字

特殊鍵[編輯]

「Z」鍵[編輯]

由於五筆字型中,採用了五種筆劃,每個字根或碼元只取前兩劃定位它們在鍵盤上的位置,所以五筆字型漢字編碼只用到了5×5=25個字母鍵。每個字的編碼中都沒有「Z」。後來大部分五筆輸入軟件都附與Z鍵查詢功能,又叫作「萬能鍵」或「萬能學習鍵」。初學者可以在對某個字不確定其拆分時,使用「Z」鍵代替不確定的字根或碼元。也有一些五筆輸入法使用「Z」鍵來實作拼音反查五筆或符號輸入功能。早期DOS系統中Z鍵可以用在任何位置,然現今大多數五筆輸入法中Z鍵均無法在首位作為不確定的字根代替碼。一些輸入法中若在首位輸入Z則跳出特殊符號選擇列表。

「L」鍵[編輯]

與「Z」鍵的用途為大多數熟知不同,「L」鍵在五筆編碼中也有許多人不太了解的特殊用途:

單筆畫字
編碼方案對單筆畫字的編碼規定為「兩個單筆畫字母加兩個L」,如一(GGLL)、丨(HHLL)、丿(TTLL)、丶(YYLL)、乙(NNLL)。由於豎、撇、捺構成的字不為大多數人認識,而「一」字有一級簡碼(G),乙字又不常用(偶爾用到時,一般不記得正確編碼的輸入者常會用別的輸入法代替輸入),所以這一編碼方案細節常被人忽略。
罕用字與常見詞組的衝突
詞組「勞動」與「蔻」字,如果按編碼方案,其編碼均為(APFC),因早期的五筆輸入法不支援詞組與單字重碼,按照一般的規定,重碼時應是以單字優先,可是相比之下,「勞動」是常用詞,而「蔻」字幾乎不會單獨出現,通常總是以詞組「豆蔻」的形式出現,所以,為了方便輸入以及減少重碼,在最終方案中蔻字的編碼被強制設為(APFL),但非所有五筆輸入法都跟隨。

類似地,早期版本的五筆將「靨」字的編碼強制設為(DDDL),以避免和更常用的「大」(DDDD)重複.

以舊字型為本[編輯]

  • 筆畫「丿」(),一般寫法當作「丶」(),有時手寫體豎鉤(亅)以「一」()或「乙」()代替。
  • 「象」字,簡體字寫法中間為口(K),而實際用橫日(J)

評價[編輯]

讚許觀點 批評觀點
五筆鍵碼短、輸入快,多簡碼,一個字或一個詞組最多只有四個碼,適用於簡化字。 五筆雖然單字的重碼率低,但詞組的重碼率高,因此,五筆普遍不使用大詞庫,以防止過多重碼,但詞庫太小時,打字反而不方便,尤其現在各種智能拼音輸入法的興起,五筆低重碼率的優勢已大大縮小。由於開始設計時是針對簡體字,雖然日後經過不斷改善,86、98版都可直接用繁體字編碼,但使用效果上還有待進一步優化。
五筆練習對分拆漢字的能力是很好的訓練,並能鍛煉個人的認字能力。例如「尷尬」二字中的「尢」常被誤寫為「九」,五筆按「尢」拆分可以糾正這種錯誤觀念。五筆輸入法能在一定程度上避免使用拼音輸入法過度而造成的提筆忘字的問題。 為了減少重碼,五筆中有大量的無理碼,這不符合漢字的結構和書寫規範,因此,並不能鍛煉人的認字能力,長期用無理碼打字,使人們對漢字有了錯誤的認識,反而有害。中華人民共和國教育部就是因為這個原因沒有在學校強制推廣五筆。例如,按規範「力」、「刀」、「萬」、「方」、「乃」等一類字的末筆應為撇,可是86版五筆字型卻規定為折;「瓦」的末筆應為中間的點,86版五筆字型卻規定為折;「戈」、「戔」、「我」、「咸」、「成」、「戊」、「戌」、「戎」等一類字的末筆應為右上角的點,86版五筆字型卻規定為倒數第二筆撇,凡此等等。[2]
五筆只需考慮字形,可輕鬆地按編碼規則輸入自己會寫(或照稿子),但不認識不會讀的字。且中國方言眾多,漢字發音差異頗大,但字形相對統一,對於不會拼音或掌握不好的人,五筆佔優勢。 不適合輸入只知道發音而忘了怎麼寫的字。
較易實現盲打(不看螢幕),尤其單字時。而拼音不論單字還是詞組,都有極高的重碼率,只有在輸部份常用語句上才會惟一(或者說排在第一個選項上)(如:你好呀,我吃飯了,這是什麼)。對不常用的一些語句,成片的生僻字(如地名),或一些相互之間字意聯繫不大的字詞(如人名),五筆的優勢非常明顯。 輸常用句子時,智能拼音輸入法亦可盲打,且不輸五筆,甚至快於五筆(由於五筆在輪片語時,重碼率不再是優勢而一個句子又不能光用單字模式)。
會打五筆的人用字比打拼音更準確。 打字準不準確取決於打字者是否細心,沒有錯別字的拼音輸入的文章很多,用五筆時出現的錯別字也並不罕見。例如2012年11月3日《江南晚報》頭版頭條「亂撳叭被罰不要喊冤」寫成了「亂撳叭被罰不要喊冤」。[3]
由於有五筆字型口訣,並不難於記憶。實際熟練後,打字時手指會自然地去尋找所需字根,並不像初學者那樣打個字時還得口中念念有詞。 五筆字型使用的是字根和碼元作為輸入時的助憶碼,86版使用130個字根,98版更需要使用245個字根,記憶量要比拼音或注音輸入方法大。不僅如此,五筆字型的字根排布沒有規律,遠不及其它形碼,增加了它的記憶難度。而且,五筆字型一旦有一段時間不用,就會忘記,需要重複學習,增加民眾學習負擔。

版本[編輯]

王永民自1983年發明五筆字型以來,共推出了三種編碼方案,即86版98版新世紀版

  • 86版也就是老式的五筆,又稱4.5版。使用130個字根,可處理GB 2312-80漢字集中的6763個漢字。由於習慣問題,它至今仍然是擁有使用者群最為巨大的編碼方案。
  • 98版是一種改進型的方案,其編碼的科學性更強、更易於學習和使用。使用259個碼元,可處理GBK漢字集中的21003個簡繁漢字。但二者在編碼原則上大同小異。
  • 新世紀版於2008年1月28日推出,採用新設計的字根體系更加符合分割劃位規律,更加科學易記而實用,按規範筆順寫漢字的人,取碼輸入更容易,可以處理GB 18030-2000漢字集中的27533個簡繁漢字。

版本的使用情況[編輯]

設計者認為,86版的字根設定不如98版和新世紀版科學。但是由於86版較先發行,且98版和新世紀版五筆字型編碼的專利權尚掌握在王碼公司手中,而王碼公司反對其他公司在未授權的情況下開發和發行五筆字型輸入法[4],因此86版五筆字型編碼及相關軟件的使用者和輸入法程式都比98版和新世紀版多。

  1. 從學習的角度看,有的人包括設計者在內的認為三個版本五筆相比較,86版較難學習,很多筆畫多的字沒有字根,導致很難拆分;也有的人認為由於86版較先發行,很多人已經掌握了86版的字根排布,很難再接受98版或新世紀版的五筆字根排布。
  2. 重碼問題一直是困擾漢字輸入法的一道難題,五筆字型一樣會有重碼。三個版本的重碼相差不大,而新世紀版五筆在重碼實用頻度得到降低。
  3. 從字形上看,86版很多字都沒有以簡化字的字形出發,而以舊字形編碼,造成很多字不按規則輸入,形成特例字。98版已經較為改進這一類情況,使得輸入此類字的時候能正確區分其左右,上下,外內等因素,但並沒有根本解決此問題。
  4. 折的部分由於向右偏移,造成不順手、不習慣。
  5. 86版過分在乎重碼字,以規則去區分兩個形近字,如(日與曰,未與末),但加入詞組後,重碼仍無法避免(尤、萬、尢)。98版在修改字根排布之後較少出現這類情況。
  6. 86版設計的時候只適用於簡化字,目前只有少數輸入法支援五筆輸入繁體字,而且繁體字輸入在極少字根下十分困難,且大多是輸單字時可直接用繁體編碼,輪詞組時則需要用簡體字的編碼,輸入法會自動切換成對應的繁體詞組。98版和新世紀版的更新中把一些拆分過量的字根和碼元進行了整合,使之更容易支援繁體字。

輸入軟件[編輯]

王碼五筆輸入軟件[編輯]

  • 王碼五筆型18030推出,是由於部分使用者不適應98版,而又有輸入更多漢字的需要而出現的。它基本延用86版的編碼,而能處理中國國家的強制性標準GB 18030-2000字集的漢字,該字集可以處理27533個漢字。
  • 王碼大一統五筆字型輸入法軟件是現在的正式五筆字型輸入法軟件,安裝包預設帶有86、98和新世紀3個版本。

其它五筆輸入軟件[編輯]

在王碼五筆出現之後,又出現了許多其它的五筆輸入法。由於86版編碼的專利開放,它們大多採用86版的編碼方式,但也有使用者個人提供98或新世紀版編碼的碼錶。它們在造詞等功能上加以改進,也獲得了一定的使用者群。這其中也有一部分是以五筆編碼形式為主的輸入平台,它們不僅可以以五筆方式來輸入,也可以根據使用者的需求安裝不同的碼錶以提供其它編碼的輸入方式。

常見的五筆輸入法[編輯]

獎項與應用[編輯]

  • 解決了漢字進入電腦的世界性難題,2008年1月8日,王碼公司研發的「大一統五筆字型」獲得中國國務院頒發的「國家科學技術發明獎」,成為唯一獲此殊榮的漢字輸入法。
  • 聯合國全面採用,是全世界唯一廣泛應用的「漢字編碼」輸入技術。
  • 新華社評價「王碼」是「在中國文化史上其意義不亞於活字印刷術的重大發明,中國國家郵政總局發行了「當代畢昇——王永民」的郵票。在中科院院長路甬祥主編的《科學改變人類生活的100個瞬間》一書中,將王永民稱為「把中國帶入資訊時代的人」。

參見[編輯]

參考[編輯]

  1. ^ 大學新生幾乎都使用拼音,五筆輸入法正在被疏遠
  2. ^ [1]
  3. ^ [今天《江南晚報》頭版頭條錯別字!五筆的編輯傷不起! http://www.xici.net/d178121695.htm]
  4. ^ 王碼公司官方網站文章《「大一統五筆字型」簡介》 中宣稱:「……不經許可公然抄襲五筆字型編碼作為其核心技術的各種盜版的、改頭換面的、冠名為「××五筆」或「五筆××」的「寄生五筆」名目繁多,泛濫成災!不僅嚴重地損害了王碼的合法權益和聲譽,而且因其編碼錯誤、畫蛇添足、技術滯後和功能缺陷,極大地干擾、誤導、坑害了廣大使用者!這類「開發商」以盈利為目的,鮮有「售後服務」,更是給王碼公司造成了沉重的負擔!」

外部連結[編輯]