動態組字
维基百科,自由的百科全书
拼音文字如英文字母,一套字型只要製作26個字母和一些標點符號就足夠使用。但漢字是一種意音文字,若無數千到數萬個字型數量,便不足以應付基本的訊息交換。即便已有數萬個字型,往往在面對古籍時還有缺字的問題。這造成漢字無論是製作、儲存、使用、或交流,成本都遠高於表音文字,這對漢字的文化發展非常不利。
鑑於此,兩岸都有人在研究「動態組字」技術,這個技術的目的是解除電腦系統對漢字的束縛。作法是,只在記憶體中儲存少量(約數百至一千多)的字根部件,並用程式控制,以遞迴的方式根據部件做即時的「二維組字」,顯示到螢幕上。「字根」在此就相當於拼音文字的字母,差別只在於字母表音而字根表意。
有了動態組字,使用者便可因應各式需求自行造字,再無缺字之虞。此外,組字的過程反向操作(也就是拆字),就可以作漢字理解。
目录 |
[编辑] Unicode
Unicode標準從3.0開始,開始有表意文字序列(Ideographic Description Sequence,IDS),為採用表意文字組合符 (Ideographic Description Character,IDC)與文字部件的組合,為缺字描述定下一個標準基礎,只要加上解譯描繪的機制,也是一種動態組字的實現。
[编辑] 參考
- Unicode 5.0 的IDC碼位一覽
- http://unicode.org/iuc/iuc18/papers/b16.ppt
- Unicode 4.0 IDC/IDS技術規格文件
[编辑] 倉頡系統
這是最早產品化的系統,由早年開拓電腦中文化的先鋒:朱邦復先生所提出。編碼上採文傳碼,是一種定長度編碼,也就是說可造字有限。
文傳碼分為兩版:
- 2 byte 版的文傳碼,上限是 15 bits(三萬二千字),第一個 bit 為避開 ASCII
- 4 byte 版的文傳碼,每個輸入碼佔6bits 共5組, 每個6 bits為倉頡輸入碼 (26 個)+ 5個重複字(1號重複,2號重複) 所以理論上有超過一千萬個碼位。
目前只有在香港文化傳信授權製造的特定的嵌入式硬體才有實作此技術。
[编辑] 參考
- 朱邦復工作室設計的字型產生器(正体中文)
[编辑] 漢字筆畫組字理論
任職於中華人民共和國陝西省氣象局,張時釗先生的漢字筆畫組字理論。
[编辑] 參考
- 張時釗先生的網站(简体中文)
- 自然序汉字检索法(简体中文)
- 汉字组字机制(笔画组字原理)(简体中文)
[编辑] 漢字構形資料庫
台灣中研院謝清俊院士所帶領的文獻處理實驗室,經年整理各代古文,提出構字式(基於Big5)的作法,整理出各代文字的部件資料庫,分析所有漢字在文字學上的合理組成。
[编辑] 參考
- 古籍解決缺字問題的方法,中華民國中央研究院。(正体中文)
[编辑] 向量組字編輯器
台灣剎那搜尋工坊(前易符科技)以構字式研究成果:漢字構形資料庫為基礎,改以Unicode IDS(Ideographic Description Sequence,且是不定長度編碼)實作,成為構形碼,可高效率以遞迴方式合成漢字。
[编辑] 參考
- 開放古籍平台的意義與實作(正体中文)
- 剎那工作室實作的無限組字編輯器解說(正体中文)
- 動態組字技術組成表(正体中文)
- 正體中文網:介紹動態組字器(正体中文)
- 魔法設計的藝術: 漢字研究(正体中文)
[编辑] CDL字形描述語言
美國文林公司提出的CDL字形描述語言(字描語,以XML為基礎的構字式)。
[编辑] 參考
- 美國文林公司(英文)
[编辑] 漢字組字伺服器「影」
[编辑] 參考
- 和田研フォント:日語的「和田研字型」條目
- 日本京都大學的漢字自動生成技術(日文)

