本頁使用了標題或全文手工轉換

使用說明:特殊字母與符號

維基百科,自由的百科全書
前往: 導覽搜尋
維基百科使用手冊索引 · 關於 · 閱讀 · 編輯 · 管理 · 開發 · 附錄 · 元說明(簡體 · 繁體

概述[編輯]

在MediaWiki 1.5中,所有的專案都使用了UnicodeUTF-8)字元編碼。如果你的作業系統和瀏覽器不支援Unicode,或者沒有安裝可以顯示某些Unicode字元的字型,你將無法正確瀏覽、編輯帶有這類字元的文章。典型的狀況是:把不能顯示的字元被顯示成內有數位的小方框,編輯框內不能顯示的字元被顯示成一組組字元代碼。本文章的下列章節會給出具體的介紹。

你可在在#顯示#相關字型的下載與安裝這2章節找到有關的解決方案。

字元編碼系統[編輯]

2005年6月底,當這個新的版本開始在維基媒體上使用時,英國、荷蘭、丹麥和瑞典的維基百科已經使用了windows-1252編碼(他們宣布他們使用的是ISO-8859-1編碼,但實際上瀏覽器把二者識別為同一種,而且Mediawiki並沒有限制使用windows-1252的歷史)。在資料庫中準備升級的wiki文件將始終以windows-1252編碼儲存,並且在載入時被轉換。此後編輯們的更新將作為UTF-8編碼儲存在資料庫內。載入時轉換的過程對於用戶來說是不可見的。

  • Unicode(UTF-8)
    • 各字元位元組數可變
    • 特殊字元,包括中日韓統一表意文字,都可以在網頁和編輯框里正常顯示。另外可以使用多字元代碼,且不會在編輯框里被自動轉換。
  • ISO 8859-1
    • 各字元僅一位元組
    • 在此字符集中不可用的特殊字元以多字元代碼形式儲存,它們通常有兩到三個等價表示,例如:€,可表示為€,或€,或€。
    • 包含最常見的特殊字元,比如é,也可表示為é,但這樣沒必要。

注意到Special:Export輸出時使用UTF-8,無論資料庫使用的是哪種編碼。

若想了解某維基使用的編碼系統,開啟瀏覽器的「察看原始碼」,找到類似字元:

<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />

<meta http-equiv="Content-type" content="text/html; charset=utf-8" />

編輯[編輯]

許多不在標準ASCII表中的字元也許對維基十分重要。有四種方法輸入非ASCII字元:

  • 使用編輯框下的特殊字元以插入文章。但有可能部分字元無法顯示。
  • 按住ALT鍵並從數位鍵區依次輸入三位數輸入EASCII字元,但超出EASCII範圍的數位會被轉換成SOH符號(U+0001)。
  • 直接使用特種鍵盤輸入法,或者字元對映程式。在ISO-8859-1的維基將把字符集以外的字元轉換為HTML數位字元實體(見下)。
  • 使用HTML命名字元實體參照,比如&agrave;。這對於不同的字符集來說都能非常正確的表達指定字元,即使無法顯示。不過可能引起搜尋的困難(見下)。
  • 使用HTML數位字元參照,比如&#161;。這是輸入未命名實體Unicode值的唯一辦法,比如土耳其字元。代碼點128到159在ISO-8859-1Unicode中都未使用,因此其間的字元參照是錯誤的,「非法的」,會引起多種問題。

總的來說,西歐語言一般不出現問題。

為了搜尋的成功,特殊字元最好不用字元實體參照,否則搜尋會出現問題。比如「Odiliënberg」,伺服器只會以「Odili」、「euml」或「nberg」進行搜尋。這其實是個bug,應該被修正。參見:Help:搜尋


瀏覽器[編輯]

有些瀏覽器會對編輯框裡的文字作一些手腳。最常見的行為就是將文字轉換為原生的編碼形式。用戶將不得不手動轉換回來。這也常造成特殊字元變成問號(在某些瀏覽器變成了音譯文字!)。

MacInternet Explorer[編輯]

這種常見瀏覽器使用Mac OS Roman編碼系統。它幾乎把所有的Unicode字元變成問號,部分ISO-8859-1也不能幸免於難(特別是¤ ¦ ¹ ² ³ ¼ ½ ¾ Ð × Ý Þ ð ý þ 和軟連字元)。所以用它瀏覽維基百科會造成極大的不便。

Netscape 4.x[編輯]

問題與上者類似。

工作區[編輯]

正常瀏覽器:
資料庫和編輯框
異常瀏覽器:
編輯框
œ &#x153;
&#x153; &#x0153;
&#x0153; &#x00153;

在英文維基變為UTF-8之後,跨維基機器人就開始替換HTML實體為Unicode字元,但對於有些瀏覽器來說,不正常的Unicode字元越來越多。工作區就是為此設計,以保證那些瀏覽器能安全的進行編輯,當然僅當Mediawiki知道哪些瀏覽器是有問題的。

列在$wgBrowserBlackList(一組正規表式,匹配User-Agent字串)的瀏覽器被提供一個特別的編輯框。十六進制HTML實體有多餘的前導0,非ASCII字元在編輯框顯示為無前導0的十六進制HTML實體。

當前IE Mac和一些版本的Linux Netscape 4.x瀏覽器在黑名單之中,不過這能解決一些問題。

顯示[編輯]

瀏覽器以及設定[編輯]

各種瀏覽器對Unicode的支援程度參差不齊。一些瀏覽器需要透過以下手段開啟對Unicode的預設支援。

Internet Explorer

在Windows下在預設狀況下即可正常顯示(需要下一章節的字型支援)。

其中一個問題便是,IE對字型的處理是:使用在登錄檔中的設定,卻不對可能顯示成問號的字元的字型進行搜尋。這就造成IE有時必須使用特定字型。在英文維基有一組這種功能樣板:en:template:unicode處理通用Unicode字元,en:polytonic處理多音希臘語en:IPA處理國際音標。而在Windows象形文字清單中的字元能夠不用特殊手段安全使用。<font face="Arial Unicode MS">...</font>可能只在用戶有這種字型時才正常顯示。

Konqueror、Safari和Opera

基本上在預設狀況下即可正常顯示。(需要下一章節的字型支援)

Mozilla Firefox

在Windows下在預設狀況下即可正常顯示(需要下一章節的字型支援)。其他平台上可能需要更改設定。點開「工具」選單,進入「選項」,點選「內容」標籤,點選「字型和顏色」中的「高階」按鈕,取消允許網頁使用指定的字型(allow pages to choose their own fonts)在「字型編碼」中選中「Unicode (UTF-32BE)」,確定結束。

世界語[編輯]

在編輯框 在資料庫和輸出
S S
Sx Ŝ
Sxx Sx
Sxxx Ŝx
Sxxxx Sxx
Sxxxxx Ŝxx

Mediawiki軟體可以設定世界語使用UTF-8編碼作為儲存和顯示編碼。但在編輯時,這些文字被轉換為容易以標準鍵盤編輯的格式。

有這種特性的字元有:Ĉ,Ĝ,Ĥ,Ĵ,Ŝ,Ŭ,ĉ,ĝ,ĥ,ĵ,ŝ,ŭ。你可以用特種鍵盤直接鍵入這些字元,不過儲存後在編輯時你還是會看見Sx。這叫做「x-加帽拼寫」(參見:en:Esperanto orthography#The x-system)。如果想輸入在這些字元或它們的不發音形式(A,G,H,J,S,U,c,g,h,j,s,u)後的「x」,則應輸入顯示出來的「x」兩倍的「x」。

比如,世界語維基連結到en:Luxury car跨語言連結,原始碼是[[:en:Luxxury car]]。這曾造成跨維基機器人工作的問題。

相關字型的下載與安裝[編輯]

古代字母[編輯]

古代字母在這裡包括:腓尼基字母古義大利字母線形文字B

Windows

下載安裝下列的任意一種字型:

Linux

基於DebianLinux(例如ubuntu和Linux Mint等)可透過Synaptic下載ttf-ancient-fontsdeb包

楔形文字[編輯]

要顯示蘇美爾楔形文字,下載安裝下列的任意一種字型:

安裝這幾種字型後firefox中能正常顯示和編輯,不過IE和Chrome僅能正常顯示楔形文字音節表,位於輔助多語言平面(SMP)內的U+12000—U+1236E 楔形文字(879個字元)和U+12400—U+12473 楔形文字數位和標點(103個字元)則無法顯示。

古埃及聖書體[編輯]

要顯示古埃及聖書體,下載安裝下列的字型:

鄂圖曼亞文字和Shavian文字[編輯]

要顯示鄂圖曼亞文字和Shavian文字,下載安裝下列的字型:

古埃及象形文字[編輯]

比如<hiero>A54</hiero>得到

A54

。參見mw:Extension:WikiHiero/Syntax(警告:本頁面含大量影像)。

這與瀏覽器的編碼系統無關,因為這是影像。

當然也可用Unicode來表示它們,不過只有「Aegyptus」支援古埃及象形文字。

盲文[編輯]

要顯示盲文,從下列的連結下載安裝字型:

布吉文[編輯]

要顯示布吉文,從下列的連結下載安裝字型:

婆羅米系文字[編輯]

要顯示婆羅米系文字,從下列的連結下載安裝字型:

滿文[編輯]

要顯示滿文,下載安裝下列的字型:

國際音標[編輯]

參見國際音標#國際音標字體

有特殊字元的連結[編輯]

當用戶使用下劃連結時,且連結有特殊字元時,結果可能有歧義。

連結 + - < > ⊂ ⊃ 得到 + - < > ⊂ ⊃,也許看起來像± = ≤ ≥ ⊆ ⊇。這樣最好單獨給出連結。

參見[編輯]

外部連結[編輯]

  • http://www.unicode.org/charts/ Unicode字元表,僅十六進制數,PDF檔案顯示所有瀏覽器不能顯示的字元(英文)。
  • http://www.unicode.org/help/display_problems.html 在大多數平台上啟用Unicode的幫助(英文)。
  • 0到65535Unicode字元,十進制。
  • HTML 4.0 Character Entity References—shows how the named and decimal character references look in one's browser
  • FileFormat.Info—details of many Unicode characters, including the named, decimal and hexadecimal character reference, showing how it should look and for each, how it looks in one's browser
  • Alan Wood's Unicode resources—comprehensive resource with character test pages for all Unicode ranges, as well as OS-specific Unicode support information and links to fonts and utilities
  • CharacterPal—Free Mac OS X Dashboard Widget that displays key combinations for special characters
  • A converter that helps one find the right escape sequence to use—helps when one needs to escape ASCII/Unicode characters that are special characters in wiki markup