嘸蝦米輸入法
维基百科,自由的百科全书
| 中文輸入法 嘸蝦米輸入法 |
|
| 發明人 | 劉重次 |
| 發明年份 | 1989年 |
| 類別 | 字形 |
嘸蝦米輸入法,為臺灣人劉重次發明的中文輸入法。將漢字分拆成字型結構,再以字型結構的形、音、義與英文字母加以聯想,拼出漢字。嘸蝦米輸入法的發想始於劉重次在歐洲留學期間(1969年-1975年左右),當時因為Telex電傳系統(電報機)普及,劉重次於是想創造一種便利中文資訊溝通的方法,於是投入中文檢字法的世界,經過數十年後嘸蝦米輸入法才告完成,並於1990年成立了「行易有限公司」[1]。
嘸蝦米最大優點是以26個英文字母為字根,可同時練習中、英打。上排數字鍵則留予使用者直接輸入數字,操作筆記型電腦時此優點尤為明顯。
然而,不同於倉頡、大易、行列等輸入法,嘸蝦米長期以來因行使專利權保護,所以並未內建於任何作業系統中而需另行付費購買,或至行易有限公司網站下載有字數、日期限制的試用版。
目录 |
[编辑] 名稱
嘸蝦米一詞,為閩南語「無甚物」(白話字:bô-siáⁿ-mi̍h)之國語音譯,意思為「沒什麼」。其外文名稱使用「Boshiamy」一名;另外軟體檔案使用「Liu」一名,則取自發明人的姓氏──劉。例如2007年可下載之Windows試用版檔名為「liu2007b.exe」。
[编辑] 字根分類
嘸蝦米輸入法大部份的字根可分為形、音、義三大類,並與26個英文字母相配合運用。
- 形
- 取字根的形狀
- 例如:「命」,由「A」、「O」、「P」組成
- 音
- 取字根的發音
- 例如:字根「西」是C,「爾」是R(與字母的英文音近),「平」是P(聲母)
- 義
- 取字根意思的聯想
- 例如:字根「車」是C、「女」是G、「手」是H、「水」是W、「火」是F(分別取英文的Car, Girl, Hand, Water, Fire首字母)
- 其他
- 必須要記憶的字根
- 例如:字根「土」是Y、「鬼」是V
這樣的配合聯想方法,是便利初學者熟記它的三百多個字根與英文字母的對應,待熟練後便不再以這些聯想方法輔助。而且雖然有的字根以音記憶,真正拆碼時只需知道字形,而不用懂得拼音。
[编辑] 取碼原則
[编辑] 截長補短
每字取一碼至四碼,取碼順序基本上按由上至下,由左至右,由外至內,以目視來分拆字的輪廓,稱為「眼順」,不完全與筆順符合。例如「彎」字上部由左至右拆成S(糸)、I(言)、S(糸),而非按筆順先取I(言)。
「截長」指的是一個字如拆碼超過四碼,則只取首、二、三、尾碼,其餘捨去。
- 例如:「歡」的字碼為:R(廿)、O(口)、O(口)、V(隹)、I(欠),取碼為ROOI,捨去V(隹)。
「補短」指的是一個字拆碼如不足三碼,則須加上補根,就是最後一筆劃的字根。
- 例如:「取」的字碼為:R(耳)、U(又),加上補根X(乂),取碼為RUX。
[编辑] 縮短碼長
因為補短原則,騰空了很多一碼和二碼位置,這空間便用來加上最常用的字,以縮短輸入碼長,這就是一碼和二碼簡碼字。例如:
- 「通」字原來取TNQW,可用簡碼T,減少三碼。
- 「是」字原來取DEZ,可用簡碼JN,減少一碼。
一碼和二碼簡碼字共編入702(=26+26×26)字。
為了再減少其他字的碼長,還加上了一百多個簡速字根。這些字根多數是字的常見偏旁,比其他字根大的多。例如:
- 「俞」是A——「愈」字由AURH縮短至AHA
- 「曷」是D——「渴」字由WDNL縮短至WDL
- 「易」是E——「場」字由YDEM縮短至YEP
[编辑] 優點
- 以26個英文字母為組字按鍵,熟練中文打字即能熟練英文打字
- 每字最多取四碼(配合「VRSF選字」功能時可直接輸入五碼出字),相對於倉頡輸入法而言取較少的碼數
[编辑] 缺點
- 重碼率為常見字形輸入法[2]之冠。以Big5碼的5,401個常用字來說,重碼率高達46.57%(=2,515/5,401)。必須以背誦的方式記憶簡碼或第二候選字的替代字根[3],才能提高輸入效率。
- 字根數為常見字形輸入法之冠。倉頡字根約140種(包含「難」對應的字根);行列、大易字根各約250種;嘸蝦米字根則高達347種[4]。
- 許多基本字根、簡速字根、簡碼不易背誦,甚至必須與注音符號產生聯想才能背誦[5]。背誦法則太過多種,字根又多達三百多種,容易讓初學者望而卻步。
- 行易有限公司發行的嘸蝦米輸入法為一商業軟體,受著作權法保護,需購買授權才能合法使用。
- 嘸蝦米輸入法的專利權(在中華民國經濟部智慧財產局登記為「漢字數理碼輸入法暨其鍵盤裝置」)雖已於2003年11月11日因未依限繳費而消滅,但至今衍生的輸入法仍不多見(衍生出來的多半為免費的輸入法表格)。
- 隨著Windows Vista的新細明體字型已支援Unicode 3.1的字元,以及各種檔案的編碼類型紛紛捨棄ANSI改用UTF-8或Unicode(這意味著往後遇到Big5以外的字時,不一定要造字,因為可以直接使用Unicode 3.1收錄的70,195個漢字),是故,各類輸入法將被使用者要求必須支援Unicode 3.1的所有字元;因嘸蝦米定義的輔根及取碼原則有其內在的缺陷[6],屆時面臨的重碼字問題勢必將變得比倉頡輸入法或其他的字形輸入法更為嚴重!有統計資料指出:倉頡輸入法不會出現候選字的字根(可直接出字者)超過55,000個,而嘸蝦米的不到35,000個[7]。所以,嘸蝦米較適合用來輸入常用漢字,而不適合用來輸入大量的罕見漢字。
[编辑] 產品特色
行易有限公司最新發行的嘸蝦米輸入法7.0(for Windows)有下列特色:
- 有支援特殊符號的輸入(如欲輸入「☆」,可使用「,」加「星」字的字根,也就是取「,ds」即可輸入「星」;另外也有提供符號表供使用者點選)
- 有支援同音字的輸入[8]
- 有支援容錯功能[9]
- 有支援萬用碼功能[10]
- 有提供「快打摸式」(,,SP):切換至此模式時只能使用最簡碼出字。
- 有提供「注音查詢」功能:其實是一種「注音輸入」模式,它的前導字元是「、;」,然後再輸入「注音符號+空白鍵」即可列出候選字,它可以用來模擬注音輸入法,省去不會拆字時需要切換輸入法的麻煩。
- 有「VRSF選字」功能:它是一種重碼字的解決方案。
- 此功能設計原理簡述如下:
- 當一個字根對應兩個以上的字元時,
- 「0」或「空白鍵」是第一個字元的選擇鍵,
- 「1」(不需加空白鍵)是第二個字元的選擇鍵,
- 「2」(不需加空白鍵)是第三個字元的選擇鍵……依此類推。
- 快打時,可背下第二個字元、第三個字元的順序,然後用「簡碼」來輸入,即:
- 可用「同一取碼+V」來輸入原本該按「1」選擇的字元,
- 可用「同一取碼+R」來輸入原本該按「2」選擇的字元,
- 可用「同一取碼+S」來輸入原本該按「3」選擇的字元……依此類推。
- 「一、二、二、四……九」的嘸蝦米字根分別是「E、R、S、F……K」,
- 在這種簡碼方式裡,只不過是把「E」(一)改成「V」,
- 其餘的簡碼,用的規則仍舊維持不變(不過這個功能有許多的例外[11])。
- 「回」字使用「OOOV」取碼,即為「VRSF選字」功能的一例。
- 只支援Unicode 1.0的20,902個漢字,而不是Unicode 3.1的70,195個漢字。[12]欲輸入中日韓統一表意文字擴展A、B區的字元時,必須用「加字加詞檔」的功能(此功能只有7.0版及偽‧蝦米才有)匯入蝦米族樂園製作的對照表。
- 長期以來,因專利權的保護,嘸蝦米輸入法軟體的發布及更新皆由行易有限公司負責(即使專利權已告消滅,但一般仍將行易有限公司視為官方代表),使用者可獲得較完善的客戶服務。
[编辑] 爭論
有別於注音輸入法、倉頡輸入法、行列輸入法、大易輸入法,行易有限公司為嘸蝦米輸入法設計了「多國語言輸入」模式而將中日韓統一表意文字歸屬到不同的輸入法參考檔,它們分別是:
- 繁體中文模式:切換鍵為「,,T」,輸入法參考檔為「liu-uni.tab」
- 簡體中文模式:切換鍵為「,,C」,輸入法參考檔為「liu-uni2.tab」
- 簡體中文(打繁出簡)模式:切換鍵為「,,CT」,輸入法參考檔為「liu-uni3.tab」
- 日本漢字模式:切換鍵為「,,J」,輸入法參考檔為「liu-uni4.tab」
好處是:
- 避免重碼字的麻煩(例如:繁體的「飲」與簡體的「饮」字根同為「XIN」,如果混合為一種模式則必須經常選字)。
- 許多簡繁部首的字根是共用的,使用者不必思考書寫方式不同而產生的不同的字根拆法。簡體中文模式慣用者,切換至繁體中文模式後,可用同一種拆法打出繁體中文;反之,繁體中文模式慣用者,切換至簡體中文模式後,可用同一種拆法打出簡體中文。
壞處是:
- 有些字使用者無法分辨歸屬於哪一種模式,如:「俤」,看似繁體中文,實則為日本漢字,只能在日本漢字模式下打出這個字。
- 有些字使用者無法分辨是否為中日韓統一表意文字擴展A、B區的字元,如:「㑆」(此字為中日韓統一表意文字擴展A區的字,需具備支援之字型才能正常顯示),使用者必須花費時間切換至各種模式一一試過後,才會考慮到加字加詞檔的功能。
- 要打一篇簡體、繁體文字並存的文章時,需反覆進行切換的動作。
結論:
- 不區分各種模式時,可避免上述的壞處,但享受不到上述的好處(雖然可以用單一CIN檔配合Yahoo!奇摩輸入法的方式達到打繁出簡,但如果此一CIN檔混合所有常見中文字元集的漢字時,會使重碼機率大增)。
- 區分各種模式時,則上述壞處依然存在。
[编辑] 其他功能
嘸蝦米可直接輸入符號、簡體字、日文漢字及假名,並支援Unicode,為中文輸入法首先整合者。此外,行易有限公司發行的嘸蝦米輸入法已支援 Windows、Mac OS、Unix-like 平台。
[编辑] 相關參考
[编辑] 註釋
- ^ 參考:《先父 劉重次生平事略》,劉晁亨、劉芳妤,2007年。
- ^ 在台灣,常見的字形輸入法為倉頡、行列、大易、嘸蝦米四種。
- ^ 如:「品」與「回」理論上之取碼皆為「OOO」,但輸入「OOO+空白鍵」時會上「品」字;上「回」字時需改用「OOO1」(不需再加空白鍵)或「OOOV+空白鍵」、「OOV+空白鍵」。由於類似情形太多,因此將增加使用者背誦方面的負擔。
- ^ 由蝦米族樂園─嘸蝦米查碼程式的更新記錄可以連結到「嘸蝦米查碼程式」的部落格,此部落格2008年4月的文章裡附有嘸蝦米的完整字根表,它一共列出:11個一碼的數字(〇、一~十)、85個「形」類別的字根、117個「音」類別的字根、120個「義」類別的字根、14個必須硬背的字根,這樣就已經高達347個字根了!如果再計入156個簡速字根和15個一碼常用字,要背誦的字根將多達518個。
- ^ 如:「心」取「Heart」之意,故對應到「H」;但「耳」不取「Ear」之意,而以諧音的方式對應到「R」;「攵」因形狀與注音的「ㄆ」相似,「ㄆ」的漢語拼音以「P」開頭,故對應到「P」。
- ^ 嘸蝦米拆字時常取「較大的形」,這有利於初學者不必從細微處去思考字要怎麼拆(例如:「米」部的字,嘸蝦米取「M」開頭;倉頡卻要取「火木」開頭),所以很多初學者會覺得嘸蝦米雖然要背的東西比較多,但至少取碼上比較便利。不過,取「較大的形」時,反而需要為這些「較大的形」各取一個對應的按鍵,當這些「較大的形」數量太多,按鍵又被限定只能用26鍵時,就會變成一個按鍵需要對應很多「較大的形」(例如:「M」對應了「米」、「目」、「毛」、「門」這些常見的部首),無形之中捨棄了「字形輸入法應取漢字共同的細微字形」的重點,加上碼長最多只取四碼,因此助長了重碼字的機會。嘸蝦米重碼字高居4種字形輸入法之冠,主要肇因於此。
- ^ 參考「泰瑞的世界」部落格的研究文章(可由外部連結連上部落格查看)。
- ^ 所謂同音字功能就是當您不知道某個字的寫法時,可以用「'」加上這個字的某同音字字根,就可以列出全部的同音字,例如:不確定「蔻」字怎麼寫時,可以用「叩=OPI」來聯想,當您輸入「'OPI」時,就會列出所有唸作「ㄎㄡˋ」的字,您就可以用這樣的方式輸入「蔻」了!
- ^ 例如「誠」字,標準拆碼為「IAQN」,但拆成「IAQY」也會上字。「容錯」拆法是嘸蝦米輸入法的特色之一,因為每個人看字的角度不同,所以容錯拆法即成為一種人性化的拆碼方式。
- ^ 例如「溪」字,假設您只會拆首碼-W、第二碼-E、尾碼-D,第三碼不知道要拆什麼,這時可以先打「WE」,再打「]」,最後再打「D」,然後就可從候選字挑選「溪」字了!換句話說,就是候選字會列出「WE?D」對應的字讓您選擇,輸入時只是把「?」改成「]」,此為單一碼不確定時的情況。如果不確定的碼不只一碼時,則可以用「[」,它代表「*」,如果打「WE[」,就會列出「WE」開頭而後面是任意碼的字讓您選擇。
- ^ 請由嘸蝦米查碼程式的更新記錄連結到「嘸蝦米查碼程式」部落格,參閱此部落格2008年8月的文章─「查碼程式新功能:加 VRSFWLCB 字的提醒」一文
- ^ 補充:以官方發行的7.0版為例,在繁體中文模式下,支援的漢字約為18,437個。如果再切換到簡體中文及日文模式下,可再多輸入2,465個字。

