本頁使用了標題或全文手工轉換
Semi-protection-shackle.svg

維基百科:地區詞處理

維基百科,自由的百科全書
跳至導覽 跳至搜尋
Chinese conversion.svg 字詞轉換
首頁 討論
轉換請求
錯誤修復請求
地區詞候選
轉換介紹
字詞轉換處理 討論
  繁簡處理 討論
  地區詞處理 討論
  公共轉換組 討論
說明文件
繁簡與地區詞處理 討論
  轉換原理 討論
  手工轉換 討論
  進階語法 討論
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
地區用詞 地區詞模板
地區用詞2 進階地區詞模板
各地中文名 地區用詞資訊框
檢視 - 討論 - 編輯 - 變動

中文維基百科裡,地區詞處理繁簡處理字詞轉換系統的兩大組成部分。地區詞轉換旨在為中國大陸、香港、澳門、新加坡、馬來西亞、台灣的中文使用者提供貼近其語言習慣的轉換模式。其中,中國大陸(zh-cn)、新加坡(zh-sg)及馬來西亞(zh-my)的地區詞為簡體中文;台灣(zh-tw)、香港(zh-hk)與澳門(zh-mo)的地區詞為繁體(正體)中文。

修改歷程

  • 港澳繁體:原以zh-hk參數涵蓋zh-mo,社群於2013年討論後,正式啟用zh-mo參數,拆分「香港繁體」和「澳門繁體」。
  • 馬新簡體:原以zh-sg參數涵蓋zh-my,而在2018年經過社群討論後,正式啟用zh-my參數,拆分「新加坡簡體」和「大馬簡體」。

轉換涵蓋順序

  • 中文:zh相容zh-hans、zh-hant
  • 簡體:zh-hans zh-cn ⊃ zh-sg ⊃ zh-my
  • 繁體:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo

因此若順位較低的地區詞與上一順位者相同,擇該上位者涵蓋即可。zh雖相容zh-hans、zh-hant直接取代,但下位區域轉換不影響。

全域轉換

地區詞的全域轉換總共通過五個轉換表來實現:分別是MediaWiki內建的轉換表大陸簡體轉換表台灣正體轉換表港澳繁體轉換表新馬簡體轉換表

全域轉換是最為方便快速的轉換處理方式,但也較容易出現過度轉換的問題。為了避免過度轉換造成的錯誤,除了穩定和使用廣泛的地區對應詞彙(判定依據見下方的先決條件),維基百科一般不接受其他情況的全域地區轉換。

對於地區詞的全域轉換,維基百科特別設立了一個字詞轉換/地區詞候選的頁面,在該頁面中,使用者可根據需求,並在符合後文中列出的先決條件的情況下,提交其希望加入全域轉換的地區詞。並通過社群投票產生共識,再由管理員加入相應的轉換頁面中。

判斷投票通過的一般依據是:在7天時間裡,總共獲得6名具備投票資格的維基人的支持,且反對票數不超過總票數的三分之一。

以下為提請加入全域地區詞轉換的先決條件(申請刪除全域地區詞轉換沒有這樣的限制,提報位置見下):

  1. 被轉換詞為單字的轉換絕不能出現在全域轉換中,例如「宏=>巨集」的轉換;
  2. 提請進行全域轉換的被轉換詞必須至少在100篇條目中出現(可通過搜尋引擎以判斷);

此外,被轉換詞字數較少(不大於三字)的轉換,社群在投票過程中還應考慮其中漢字的字頻,以及可能導致過度轉換的可能性。

關於漢字字頻方面的研究,可參考漢字單字字頻總表現代漢語常用字表其他的相關統計

如果您發現了地區詞的過度轉換錯誤,請前往Wikipedia:字詞全域轉換修復請求提報。

全文轉換

全文轉換適用於特定的單個條目,有極強的針對性。

「-{A|轉換內容}-」是全文轉換的原始碼實現,但這一方式實現的全文轉換往往會導致轉換程式碼與條目正文的程式碼混淆不清,不利於進行維護。因此,維基百科推薦內嵌全文轉換的{{NoteTA}}模版來作為實現全文轉換的方式。要使用這一模版實現該功能,只需在特定條目原始碼的頂端插入「{{NoteTA}}」的模版,並依照該模版頁面的說明輸入轉換內容即可。

由於全文轉換的針對性極強,所以較難出現過度轉換的情況。但有些情況也需要利用單獨轉換來實現。

公共組轉換

對於一些主題、領域相同和相似的條目,其中需要被轉換的內容是大同小異的,可以把這些多個條目中要用到的共同轉換字詞單獨建立一個公共轉換組。公共轉換組的方便程度處於全域轉換與全文轉換之間,而過度轉換程度也處於這兩者之間。

建立一個公共轉換組時,要依據這一組大多數詞彙在多個條目中被轉換的可能性,而不應依據轉換詞彙的類別。比如,各國現任領導人的姓名轉換,存在複用的可能性非常低,就不應當建立這樣類別的公共組。建立公共轉換組的方法可參見Wikipedia:字詞轉換處理/公共轉換組中。

公共組轉換中的轉換內容可由普通使用者所控制,而它所影響到的範圍也沒有全域轉換這麼大。公共組轉換甚至可以用來填補在全域轉換中受限制的二字轉換。一個典型的例子是「數位=>数码」的轉換:對於全域轉換來說,在非電腦和資訊科技相關的條目中,「數位」的後側極有可能會搭配「人士」並組成「數位人士」一詞,這樣便會導致「数码人士」的過度轉換結果產生。然而,在電腦和資訊科技的公共組轉換中,所涉及到的條目大多是技術類型的條目,其中有許多本來就應該被轉換的「數位」詞語,同時,技術性的內容也導致「數位人士」的用法幾乎不會出現。

然而,也正如上述所說,假如真的碰巧出現了「數位人士」,公共組轉換也有其局限。過度的地區轉換可以通過繁簡處理的全域轉換來進行修復(詳見該頁面),也可以通過後文中提供的其他方式實現。

單獨轉換

「-{轉換內容}-」或「避免過度-{}-轉換內容」是單獨轉換的原始碼實現。單獨轉換可以用於避免特定的過度轉換,或者實現其他的一些特殊功能。

舉例而言,在條目艾奧瓦州中,單獨轉換「又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''」可以用於別名的展示。其展示的結果便是「又譯作愛阿華州愛我華州衣阿華州」。或者,使用「{{各地中文名}}」等模板,說明之間差異。

又舉例說明避免特定的過度轉換:上文所述的「數位人士」,在存在「數位=>数码」轉換的同時可通過「數-{}-位人士」來避免過度轉換。

注意事項

手動轉換書寫格式

概括而言:您可以只使用zh-hans與zh-hant便達到目的,也歡迎您按照推薦的格式來書寫

雖然,地區詞處理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六種模式,但出於方便實際操作的原因,並不強制要求按照何種方式填寫,只要填寫的轉換能夠滿足預期的要求,並在各種模式下都不出現錯誤即可。

然而,上述的操作實際上並不完全符合於繁簡轉換與地區詞轉換分立的思想。因此,這裡還推薦另一種做法,即讓zh-hans、zh-hant的名稱保持一致,只填寫繁簡體對應詞,不要填寫對應地區詞。對A轉換採用哪一地區詞先到先得(即先編輯轉換的),對於T轉換,要求除繁簡之別外與標題一致。這一做法並不要求所有的編者都要掌握,因此不會對第一種簡便做法填寫造成任何妨礙,了解第二種做法的編者會逐漸地將第一種做法修正。

參考文獻應避免情況

此外,參考文獻中的文字應只進行繁簡轉換,而不進行地區詞轉換(非中文的標題、姓名、引文等內容的中文翻譯除外)。因此,如果在參考文獻中不進行避免過度轉換的處理,則無論是在全域轉換、主題轉換還是全文轉換中,都有可能會對其中的文字造成影響。為避免此類現象發生,請在引用參考文獻時使用可防止地區詞轉換的{{cite}}系列模板

官方中文名稱處理

當一個機構或人物已經有官方的漢字或中文名稱時,社群對應否進行地區詞轉換出現分歧。根據討論結果,臨時解決方案為:條目名稱遵從「名從主人」原則,使用條目描述事物(人、物、事件等)所在地的最常用用法(例如新馬簡體版本:馬哈迪);但其他地區語言版本依然顯示該地區的最常用用法(例如大陸簡體版本:馬哈蒂爾),在內文以「地區詞轉換」方式顯示名稱(註:此方案不反對在文中個別地方標明條目描述事物在其他地區的名稱)。