字符

维基百科,自由的百科全书
跳转至: 导航搜索
Six glyphs.svg
文字
文字史
字位
文字列表
拼音文字相關
字母
字母的歷史
类别
表音文字
全音素文字
辅音音素文字
元音附标文字
半音節文字
特徵文字
音節文字
语素文字
輔助使用
速記
音標
特殊使用
數字
盲文
相关条目
象形文字
形意文字
搭配使用的符
附加符號
标点符号
可轉換為文字
的其他使用
電報編碼
字元

電腦電信領域中,字符Character)是一個資訊單位。對使用字母系統音節文字自然語言,它大約對應為一個音位、類音位的單位或符號。簡單來講就是一個漢字、日文字、韓文字...,或是一個英文、其他西方語言的字母。

字符的例子有:字母數字系統標點符號。另外有所謂控制字符的概念,它是指:並不對應到自然語言中的某個特定符號,而是對應到語言中一些用來處理文句的概念(類似排版)。例子為列印機或其它顯示設備的命令,如EnterTab

字符編碼[编辑]

電腦和通訊設備會在表示字符時,會使用字符編碼。是指將一個字符對應為某個东西。傳統上,是代表整數位元序列,如此,則可透過網路來傳輸,同時亦便於儲存。兩個常用的例子是ASCII和用於Unicode編碼UTF-8。根據谷歌的統計,UTF-8是目前最常用於網頁的編碼方式。[1]相較於大部分的字符編碼把字符對應到數字或位元串,摩斯密碼則是使用不定長度的電子脈衝的序列來表現字符。

術語[编辑]

從歷史來說,“字符”這個辭彙在工業專業中被廣泛用來指一個編碼過的字符(通常用於程式設計語言的API)。同樣地,字符集則被廣泛指為那些對應到特定位元序列的抽象字符的集合。隨著Unicode編碼等未指定位元形式的字符編碼的到來。更精確的術語獲得愈來愈多的認同。

對某些文件而言,區分一個字符是資訊單位而非任何特定的視覺顯示是很重要的。如Aleph(“א”)這個希伯來字母常用於數學中,表示某種無窮,但它同時又用於原本的希伯來文件中。在統一碼中,儘管這兩種用法有一樣外形,但它們是不同的字符,而且由不同的碼位來區分。相對地,如“水”這個中文表意文字,在日文文件會和中文文件中有些微不一樣的外觀,這會反映在不同地區的字體。但它們仍代表相同的資訊,即視為一樣的字符,並且在統一碼中使用一樣的碼位。

字形Glyph)這個辭彙用於描述一個特定字符實質的外觀。很多電腦字體包含許多字形,且由一個字符的統一碼碼位來對其字形做索引。

Unicode標準(The Unicode Standard)和 通用字符集彼此定義“字符”和“抽象字符”為“用來組織、控制或表達資料的成份所組集合的成員之一”。統一碼的定義則補充了一些解釋用的註釋,鼓勵讀者去區分字符、字位和字形。這個準則也區分抽象字符和“編碼過的字符”,後者是指和數字編碼成對,以利於電腦中的表示。

另見[编辑]

外部鏈結[编辑]