動態組字
|
|
此条目或章节需要精通或熟悉本主题的专家参与编辑 請协助邀請適合的人士,或參照相關專業文獻,自行改善这篇条目。更多的細節與詳情請參见條目討論頁。 |
拼音文字如英文字母,一套字型只要製作26個字母和一些標點符號就足夠使用。但漢字是一種意音文字,若無數千到數萬個字型數量,便不足以應付基本的訊息交換。即便已有數萬個字型,往往在面對古籍時還有缺字的問題。這造成漢字無論是製作、儲存、使用、或交流,成本都遠高於表音文字,這對漢字的文化發展非常不利。
鑑於此,兩岸都有人在研究「動態組字」技術,這個技術的目的是解除電腦系統對漢字的束縛。作法是,只在記憶體中儲存少量(約數百至一千多)的字根部件,並用程式控制,以遞迴的方式根據部件做即時的「二維組字」,顯示到螢幕上。「字根」在此就相當於拼音文字的字母,差別只在於字母表音而字根表意。
有了動態組字,使用者便可因應各式需求自行造字,再無缺字之虞。此外,組字的過程反向操作(也就是拆字),就可以作漢字理解,也有助於人工智慧、手寫辨識及中文PDA、手機等手持式裝置開發。亦可延長儲存裝置壽命。
目录 |
[编辑] Unicode
Unicode標準從3.0開始,開始有表意文字序列(Ideographic Description Sequence,IDS),為採用表意文字組合符 (Ideographic Description Character,IDC)與文字部件的組合,為缺字描述定下一個標準基礎,只要加上解譯描繪的機制,也是一種動態組字的實現。
[编辑] 參考
- Unicode 5.0 的IDC碼位一覽
- http://unicode.org/iuc/iuc18/papers/b16.ppt
- Unicode 4.0 IDC/IDS技術規格文件
[编辑] 倉頡系統
這是最早產品化的系統,由早年開拓電腦中文化的先鋒:朱邦復先生所提出。編碼上採文傳碼,是一種定長度編碼,也就是說可造字有限。
文傳碼分為兩版:
- 2 byte 版的文傳碼,上限是 15 bits(三萬二千字),第一個bit為避開ASCII。
- 4 byte 版的文傳碼,每個輸入碼佔6 bits共5組,每個6 bits為倉頡輸入碼(26個)+ 5個重複字(1號重複,2號重複)所以理論上有超過一千萬個碼位。
該系統精巧快速,但因以8086組合語言寫成,故需要重新解譯才能跨平台使用。且部分組字上不符合文字學原理,如「門」就硬生生被拆成「日弓」。優點:如果拼音文字,可組出符合中文構字原理的任何字,理論上可達一千萬個字。目前只有在香港文化傳信授權製造的特定的嵌入式硬體才有實作此技術。
[编辑] 參考
- 朱邦復工作室設計的字型產生器(正体中文)
[编辑] 中央研究院漢字部件檢字系統
中央研究院漢字部件檢字系統的研發最早可追溯於1972年國立交通大學關於「交大字根系統」的一系列論文和報告。1993年,中央研究院資訊科學研究所中由謝清俊院士及莊德明助技師所帶領的文獻處理實驗室沿用「交大字根系統」的方法,經年整理各代古文,提出構字式(基於Big5)的作法,整理出各代文字的部件資料庫,分析所有漢字在文字學上的合理組成,進行重作改造,進而建立漢字構形資料庫。2008年更名為中央研究院漢字部件檢字系統,程式部份改以GPL 3.0發佈,資料部份則改以GFDL 1.2及CC-BY-SA 2.5 TW發佈,作為整體軟體專案時則以GPL 3.0發佈。最新版本為2.62。目前中研院正開發3.0版,新版的中文字碼將改用Unicode,亦支援簡體中文Windows系統。
[编辑] 參考
- 漢字構形資料庫,中華民國中央研究院。(正体中文)
- 古籍解決缺字問題的方法,中華民國中央研究院。(正体中文)
[编辑] 向量組字編輯器
台灣剎那搜尋工坊(前易符科技)以構字式研究成果:漢字構形資料庫為基礎,改以Unicode IDS(Ideographic Description Sequence,且是不定長度編碼)實作,成為構形碼,可高效率以遞迴方式合成漢字,英語字母也可組到漢字中,但仍有合成漢字不美觀的問題。2007年single.fnt作者本因漢字構形資料庫著作權問題無法將剎那工坊維護的字形資料庫兼字形檔single.fnt轉為開放文檔,後因漢字構型資料庫更改授權而GFDL化。
[编辑] 參考
- 開放古籍平台的意義與實作(正体中文)
- 剎那工作室實作的無限組字編輯器解說(正体中文)
- 動態組字技術組成表(正体中文)
- 動態組字函式庫專案(正体中文)
- 正體中文網:介紹動態組字器(正体中文)
- 魔法設計的藝術: 漢字研究(正体中文)
- Planet OrzLab: zhongwen(正体中文)
- Planet OrzLab: unicode(正体中文)
[编辑] CDL字形描述語言
美國文林公司提出的CDL字形描述語言(字描語,以XML為基礎的構字式)。
[编辑] 參考
- 美國文林公司(英文)
[编辑] 漢字組字伺服器「影」
[编辑] 參考
- 和田研フォント:日語的「和田研字型」條目
- 日本京都大學的漢字自動生成技術(日文)