蒼頡檢字法

维基百科,自由的百科全书
跳转至: 导航搜索
蒼頡檢字法
中文輸入法
發明人
  • 朱邦復
  • 沈紅蓮
發明年份 2002年
類別 字形

蒼頡檢字法,坊間亦稱「第六代倉頡輸入法」,但它與常見的「三代倉頡」、「五代倉頡」差異較大。朱邦復将其重命名為「蒼頡檢字法」,目的非僅供輸入,而在完整解決漢字之檢索及應用問題[1]

2002年,朱邦復於其留言版提及,倉頡輸入法最新版本——第六代(即蒼頡檢字法)已完成,並據之設計中文CPU。蒼頡檢字法已轉交沈紅蓮照料。原本並不公開,僅供與「朱邦復工作室」有工作關係的人士,及部分文史專家學者使用,例如倉頡系統、漢文庫典[2]、蒼頡電書[3]、漢文史資料庫等。直至2013年才釋出予倉頡輸入法愛好者。雖然通稱「六代」,但實際使用上,一般都不把它視爲倉頡輸入法的新版本,相反更像另一款由倉頡衍生而來的新輸入法。

蒼頡檢字法的取碼規則基本沿用倉頡輸入法第五代,但有以下主要變化:[4]

  • 修改字根、輔助字形、複合字、特殊字首
  • 取消難字規則,改以其他方式處理
  • 修改反字身取碼
  • 上下形字除「封閉或半封閉字形、以“八”形與下分離者、上部字形縱列者、同形字組成者、『𢦏、戶、廴』等形之字首、複合字首」外,其餘上下形至多四碼
  • 修改重複字處理方式
  • 異體字各自取碼。例如「」=弓月手,「」=弓月土。因以蒼頡為內碼,兩字内碼也不同。(統一碼把兩字當作「地區差異」字形,併入同一內碼。)
  • 將符號由原先的 YYYA? ~ YYYY? 段改到 ZZ??? 段。

這些改變主要目的為提升倉頡系統之組字、檢字效率,而非提升輸入速度。事實上,六代由於反字身取碼規則更改,拆碼往往比五代更多。

六代系統收字近八萬,重碼字約5%[5],佔空間500KB左右,有多種字體,可無級次放大。如有需要隨時可加,每加一字,平均約需十字節、工作時間一分鐘(含測試)。[6]

因設計符合漢字特性,獲國學大師錢鍾書讚賞,並指定用來進行古籍電子化[7]第六代主要提供部分文史專家學者使用。

蒼頡檢字法不是爲了支援統一碼;朱邦復批評統一碼處理漢字方法愚昧、收字不全、字序混亂、碼長不等,因此不能採用。

字根[编辑]

六代蒼頡檢字法將原「竹(H)」改為「的」,原「難(X)」改為「止」,並增加「片(Z)」部[8]

對應英文:「ABCDEFGHIJKLMNOPQRSTUVWXYZ」

六代字根:「日月金木水火土戈十大中一弓人心手口尸廿山女田

五代字根:「日月金木水火土竹戈十大中一弓人心手口尸廿山女田難卜Z」

其中「的」、「止」為基本字根,單字分別取「的」(H)和「止」(X)碼,「竹」字改為拆開編碼「人中人弓」。但「片」字並不是字根,單字拆碼為「中中一尸」(其異體寫法拆作「中中一中」)。

新增字根[编辑]

字根 字根主形 例字
字形 六代編碼 五代編碼
廿.的 廿.竹日.戈
止中的的 卜中一竹

字根「竹」今取消,單字「竹」改為拆開編碼「人中人弓」。

「片」字與「的」、「止」不同,並不是字根,單字拆碼為「中中一尸」(其異體寫法拆作「中中一中」)。

新增輔助字形[编辑]

輔助字形即指由字根衍生的字形。

字根 輔助字形 例字
字形 六代編碼 五代編碼
𠔉 火.尸的 火手.尸竹
賓(去宀貝) 十.火月金 十.一竹金
止.戈的火 卜一.戈竹竹
幷(半) 的.的 卜十.卜十
瓜(中間) 的戈人 竹女戈人
虫(去中) 中戈 中一戈
廿.田戈月 廿.田中月
豖(去丆人) 一大人 一尸大人
𢆉 卜中 卜廿十
卜中.大尸.中 卜十.大尸.十
关(去末捺) 中人 廿大
中土.木戈 廿土.木戈
中廿十木 廿金廿木
中廿土水 廿金廿水
非(左半) 中.尸卜 中一.尸卜
兆(左半) 中.山人 中一.山人
詹(去言) 弓.卜一口 弓金.卜一口
𠄎 的木弓的 竹木.弓竹尸
土.弓的的 土.弓尸竹
人.弓口 人.戈.弓口
人.月.中弓 人.一.月弓
的廿.人 竹廿.竹竹.人
斷(去幺和斤) 心女.的一中 女戈.竹一中
手日 十大日
手心.日 十心.日
彑(去一) 女火.口一水 女火.女弓水
𠱠 一片.口.一人 一月.口口.人
丣(下左) 一口口田 一中中田
丣(下右)
火尸 火尸一
尸尸.的日 尸一.竹日
囬(去囗) 一田尸 一田尸中
豕(去丆人) 一尸人 一尸竹人
𠃍 戈尸水 戈弓水
廿 𠀎 木.廿土月 木.廿廿月
𠄌 人.的山.一 人.竹心.一
口山心 口女心
一山弓戈 一女弓戈
鼠(下左) 止.女女女 竹難.女卜女
𠂈、乡(去首筆) 女女.戈戈.中 女竹.戈戈.中
的女.尸中 竹竹.尸中
𡿧 廿.女.田 廿.女一.田
女.人大 女中.人大
𢆶 廿.女.弓木 廿.女戈.木
亜(去𠄠) 一田一 一中中一
卜.的手一 卜竹.竹手一
啇(去古) 卜金口 卜月金口

「女」的輔助字形「𠄌」(用於「民」等字)今取消,該輔助字形改歸“山”。

字根「止」尚有一些由五代「難字」而來的輔作字形,見難字取碼段落。

複合字[编辑]

無論單用或做字首用皆特別規定者。如「門」在任何情況的編碼都為「日弓」。

除了部留五代編碼的複合字「門、鬥、阝、隹、畿(去田)」,六代新增或改動了的複合字有:

複合字 字根 例字
字形 六代編碼 五代編碼
土片 土片 土中弓金
的片 的片 竹日卜火
島(去山) 的片 的片.卜竹女 竹日卜女
馬(去灬) 尸手 𩡧 尸手.廿廿 尸手尸廿
尸一 尸一.戈金水 弓一.戈金水
十片 的.十片 竹.木一
一片 一片 一月山金
弓片 弓片的 弓戈弓竹
廿片 廿片女 廿一一女
卜片 卜片 卜中弓金
弓水 弓水.的止 弓大.竹卜一
鬻(去米) 弓+中上部+片 弓火木片 弓弓一口月
嬴(去女) 卜大 卜大.月山金 卜弓.月山金

與五代比較,簡化字「门」不保留,拆碼作「中戈尸」(LIS);至於「嬴(去女)」正體寫法(右下是「卂」)由「卜弓」(YL)改作「卜大」(YK),簡體寫法(右下是「凡」)則取「卜弓」(YL)。

留意「𩰲」獨用時取「弓弓一口月」(NNMRB)。「𦝠」獨用時視為連體字取「卜女口大」(YVRK)。「虎(去儿」與五代一樣,但「虍」獨用時拆碼作「卜的心」(YHP)。

尚有一些由五代「難字」而來的複合字,見難字取碼段落。

特殊字首[编辑]

做字首或次字首時,視為一整體,取規定拆碼。單用或作字身用時則依一般規則取碼,或不存在單用的組合。

三代五代共用的「气、原、厭、辰、麻」,及五代新增的「薛」,在六代中仍是特殊字首。但三代五代共用的「羽」,五代的「合、春、舂、冬、登」及三代的「䧹、府、歴(去止)、厤」則取消,不再是特殊字首。

特殊字首 字根 例字
字形 六代編碼 五代編碼
麵(去面) 木水 木水.心火木 十水.心火木
徵(去一王) 的大 的大.一一土 竹人.山土.大
帶(去巾) 大月 大月.中月 大心.月中月
一月 一月.戈止心 一一.月月.心
一片 一片.木.月山 一月.木.月山
夢(去夕) 廿月 廿月.一弓心 廿.田中.心
亮(去儿) 卜月 卜月.竹手山 卜.口.月山
卜心 卜心.卜月心 卜月.卜心.心
卜心.卜心.心 卜心.卜月.心
卜心 卜心.的山 卜心.竹山

難字取碼[编辑]

六代取消難字規則,用新的輔助字形、複合字處理五代的難字。

單一字[编辑]

字形 六代編碼 五代編碼 說明
的卜尸 竹難
𦥑 的心尸 竹難
弓止山 弓難山 基本沿用五代
尸止 弓難 首碼由「弓」改為「尸」
女止 女難

輔助字形[编辑]

字根 輔助字形 例字
字形 六代編碼 五代編碼
水.弓.止 水.弓.竹難
止人 竹難人
𦥑 止中.水 竹難中水
止月.弓木 竹月.弓木
興(外殼) 止金.手 竹金.手
止卜金 竹難卜金
止月一金 竹難月金
鹿(去广比) 戈止卜火 戈難火
兜(上半的外殼) 止日.的山 竹女.竹山
亞(去𠄠) 一止一 一中中一
鼎(去目) 月山.止 月山.女一.中

複合字[编辑]

複合字 字根 例字
字形 六代編碼 五代編碼
卜止 卜止.中弓 卜難.中弓
中止 的.中止 竹.中難
廿止金 戈.廿止金 戈.廿難金
𣶒 中止中 水.中止中 水.中難中
止山 𢫋 手.止山 手.月尸尸
山止 土.山止 土.尸尸山
中火木 中火木 中中火中
中火 中火 中難
𠂔 中弓的 女.中弓的 女.中難竹
的尸的 弓火.的尸的 弓火.竹難竹
月日日 女火.月日日 女火.口難山

反字身取碼[编辑]

左右字形之字身若為某些特定組合,則字首字身互易,稱為反字首、反字身。例:「難」原為「廿人.人土」,「𦰩」(廿人)為字首,「隹」(人土)為字身;六代編碼為「廿中人.人土」,「隹」(人土)為反字首,「𦰩」(廿中人)為反字身。反字首取碼與字首相同,最多兩碼,超出兩碼者取首、尾。反字身取碼與字身相同,最多三碼,可以細分作次字首和次字身。不過,與普通漢字不同的是,普通漢字先取字首,再取字身,最多取「2+3」碼;這些反字身漢字則先取字身,再取字首,最多取「3+2」碼。

反字首 字例 六代編碼 五代編碼 說明
人一木.卜水 人木.卜水
月山金.人大 月金.人大
一女的.弓中 一竹.弓中
廿.口土.弓人 廿土.弓人
十口山.中弓 十山.中弓 即使「克」向右延伸,取碼規則亦然
卜女人.大尸 卜人.大尸
女戈火.人土 女火.人土 即使「糸」通常作字首,取碼規則亦然
一心止.的片 一一.竹日火 簡化的「鸟」不作反字首
一一.的卜一 一一.心卜一
日.一人.一片 日人.一月金 簡化的「页」不作反字首
日人.一月人 日人.一月人

重碼字處理[编辑]

用數字1至5區別重碼字;若原字已有五碼,則取前四碼加數字,如「知」是「人大口」(OKR),「佑」是「人大口1」(OKR1);「縱」是「女火的人人」(VFHOO),「縰」是「女火的人1」(VFHO1)。

其他改變[编辑]

主要變化是將許多上下字形視為連體字。此外還有一些零散變化。

字形 六代編碼 五代編碼 說明
木人人水 十人弓戈
水人月 火金月
的人
月山 月一
一尸 一女尸
尸手火 尸手尸火
尸一 尸一 五代倉頡曾先後將马的首根編為中、弓、尸。
完整編碼為:中女尸一、弓女尸一、尸一(難尸一)。[9]
的卜尸一 心卜尸一
的女尸一 心女尸一
的田的戈 竹山.戈 視為連體字
十田戈心 十戈.心 視為連體字
十田戈戈 十戈.木戈 視為連體字
廿土的戈 廿土.竹手戈 視為連體字
中一火廿 中一.火.月廿 視為連體字
田火土土 田土.火.土 視為連體字
一木一口 一一.口 視為連體字
弓片人 弓弓手人 拆為「弓弓手人」的「承」字中間少一橫,只有二橫。
一口口口 一土口口 做字首時只拆「一口口」
田田.土 田田.田田.土
中女.中戈.戈 女一.中戈.戈

注釋[编辑]

  1. ^ 留言#3364提及:「倉頡」主要之精神不在「追求輸入快速」,而係「保存漢字之根本」
  2. ^ 漢文庫典,其字形圖片使用六代倉頡編碼。
  3. ^ http://www.cbflabs.com/?id=120
  4. ^ 留言#1976
  5. ^ 留言#3364
  6. ^ 留言#6257
  7. ^ 詳見同文-漢文史考證文庫介紹。
  8. ^ web2.hsps.tp.edu.tw/unit/11/96下專題/4/倉頡--大信OK.doc 第40頁末段
  9. ^ 參見第五代倉頡碼表說明

參見[编辑]

外部連結[编辑]