動態組字

维基百科,自由的百科全书

跳转到: 导航, 搜索

動態組字是一種汉字計算機等領域的編碼理論及技術。

拼音文字英文字母,一套字型只要製作26個字母和一些標點符號就足夠使用。但漢字是一種意音文字,若無數千到數萬個字型數量,便不足以應付基本的訊息交換。即便已有數萬個字型,往往在面對古籍時還有缺字的問題。這造成漢字無論是製作、儲存、使用、或交流,成本都遠高於表音文字,這對漢字的文化發展非常不利。

鑑於此,兩岸都有人在研究「動態組字」技術,這個技術的目的是解除電腦系統對漢字的束縛。作法是,只在記憶體中儲存少量(約數百至一千多)的字根部件,並用程式控制,以遞迴的方式根據部件做即時的「二維組字」,顯示到螢幕上。「字根」在此就相當於拼音文字的字母,差別只在於字母表音而字根表意。

有了動態組字,使用者便可因應各式需求自行造字,再無缺字之虞。此外,組字的過程反向操作(也就是拆字),就可以作漢字理解。

目录

[编辑] Unicode

Unicode標準從3.0開始,開始有表意文字序列(Ideographic Description Sequence,IDS),為採用表意文字組合符 (Ideographic Description Character,IDC)與文字部件的組合,為缺字描述定下一個標準基礎,只要加上解譯描繪的機制,也是一種動態組字的實現。

[编辑] 參考

[编辑] 倉頡系統

主条目:倉頡系統

這是最早產品化的系統,由早年開拓電腦中文化的先鋒:朱邦復先生所提出。編碼上採文傳碼,是一種定長度編碼,也就是說可造字有限。

文傳碼分為兩版:

  • 2 byte 版的文傳碼,上限是 15 bits(三萬二千字),第一個 bit 為避開 ASCII
  • 4 byte 版的文傳碼,每個輸入碼佔6bits 共5組, 每個6 bits為倉頡輸入碼 (26 個)+ 5個重複字(1號重複,2號重複) 所以理論上有超過一千萬個碼位。

目前只有在香港文化傳信授權製造的特定的嵌入式硬體才有實作此技術。

[编辑] 參考

[编辑] 漢字筆畫組字理論

任職於中華人民共和國陝西省氣象局張時釗先生的漢字筆畫組字理論

[编辑] 參考

[编辑] 漢字構形資料庫

台灣中研院謝清俊院士所帶領的文獻處理實驗室,經年整理各代古文,提出構字式(基於Big5)的作法,整理出各代文字的部件資料庫,分析所有漢字在文字學上的合理組成。

[编辑] 參考

[编辑] 向量組字編輯器

台灣剎那搜尋工坊(前易符科技)以構字式研究成果:漢字構形資料庫為基礎,改以Unicode IDS(Ideographic Description Sequence,且是不定長度編碼)實作,成為構形碼,可高效率以遞迴方式合成漢字。

[编辑] 參考

[编辑] CDL字形描述語言

美國文林公司提出的CDL字形描述語言(字描語,以XML為基礎的構字式)。

[编辑] 參考

[编辑] 漢字組字伺服器「影」

日本京都大學的漢字組字伺服器「」。

[编辑] 參考

个人工具