字符

维基百科,自由的百科全书

跳转到: 导航, 搜索

電腦電信領域的術語中,字符是一個資訊單位。在使用字母系統音節文字等的文字的自然語言中,它大約對應為一個音位、類音位的單位或符號。

字符的例字有字母、數字系統標點符號。同時包含控制字符的概念,是指它並不對應到自然語言中的某個特定符號,而是對應到語言中一些用來處理文句的東西。其例子為列印機或其它顯示設備的命令,如回車鍵tab

目录

[编辑] 字符編碼

主条目:字符編碼

電腦和通訊設備會使用字符編碼的方式來表達字符。意思是指,會將一個字符指定給某個某西。傳統上,是代表整數量的位元序列,如此,則可透過網路來傳輸,同時亦便於儲存。兩個常用的例子是ASCII和用於統一碼UTF-8。根據谷歌的統計,UTF-8是目前最常用於網頁的編碼方式。[1]相較於大部分的字符編碼把字符對應到數字或位元串,摩斯密碼則是使用不定長度的電子脈衝的序列來表現字符。

[编辑] 術語

從歷史來說,字符這個辭彙在工業專業中被廣泛用來指為一個編碼過的字符(通常用於程式語言API)。同樣地,字符集則被廣泛用於指為那些對應到特定位元序列的抽象字符總集合。隨著統一碼及位元形式未確定的編碼格式的到來。更精確的術語獲得愈來愈多的認同。

對某些內容而言,區分一個字符是資訊單位而非任何特定的視覺顯示是很重要的。如Aleph("א")這個希伯來字母常用於數學中,表示某種無窮,但它同時又用於原本的希伯來文件中。在統一碼中,儘管這兩種用法有一樣外形,但它們是不同的字符,而且由不同的碼位來區分。相對地,如"水"這個中文表意文字,在日文文件會和中文文件中有些微不一樣的外觀,這會反映在不同地區的字體。但它們仍代表相同的資訊,即視為一樣的字符,並且在統一碼中使用一樣的碼位。

字形這個辭彙用於描述一個特定字符實質的外觀。很多電腦字體包含許多字形,且由一個字符的統一碼碼位來對其字形做索引。

統一碼準則(The Unicode Standardand)和 通用字符集彼此定義字符抽象字符用來組織、控制或表達資料的成份所組集合的成員之一。統一碼的定義則補充了一些解釋用的註釋,鼓勵讀者去區分字符、字位和字形。這個準則也區分抽象字符和編碼過的字符,後者是指和數字編碼成對,以利於電腦中的表示。

[编辑] 另見


[编辑] 外部鏈結

本条目包含特殊字母符号部分操作系统浏览器须要特别外文支持,否则游览器会显示乱码、问号等其它符号
个人工具