帮助:中文维基百科的繁简处理/读者须知事项

维基百科,自由的百科全书

中文维基百科的繁简处理是维基百科的一项自动转换,目的是以计算机程序适应不同用字模式的差异。

中文读者和编者来自世界各地。他们提供、需求的中文在性质上有许许多多的差异,像是简化字繁体字的差异、简体中文繁体中文词汇的差异、方言差异造成的书面语言的差异等等。本百科将这些中文性质集合在一起,称为“用字模式”。可以说:一种用字模式就是某些中文性质的一个集合。

为了整合读者和编者多元的资源,也为了促进各方的交流,本百科并不规范读者或编者要使用何种用字模式,而是以计算机程序适应这些差异,让编者可以在源码中以自己的用字习惯提供资料,也让读者可以选择所要的资料的用字遣词。

注意:中文维基百科不保证用字模式自动转换功能和内容的正确性。用字自动转换并不一定正确,甚至可以说是各种自动转换中问题特别多的。中文维基百科的内容有可能已经被用字自动转换修改、破坏,或者自动转换程式本身可能也已经被修改、破坏。

目前的中文维基百科正在进行这样相当特别的计算机程序实验。因此阅读时有特别的事项需要注意。

现行的自动转换[编辑]

用字模式转换与维基系统本身的原理有关。大部分编者输入系统的文章内容,包括文字和维基语法等等,在此称为源码。维基系统通常会保留完整不变的源码,不作自动转换。读者使用维基系统时,并非直接阅读源码,而是由系统将源码自动转换成合适的形式,例如加上图片、超链接等等。而中文维基百科的用字模式转换就是众多自动转换程序中的一道。

自动转换计算机程序的能力范围不只是百科的条目文章,也包括页面分类等等页面。

大多数时候(预设情况),本程序是由读者指定用字模式后,根据转换表将源码转换成指定的用字模式。但有的时候,则以根据编者在源码中指定的方式优先,包括不转换或是所谓“手动转换”(编者自行增加的转换方式)。

不保证用字模式自动转换功能和内容的正确性[编辑]

注意:中文维基百科不保证用字模式自动转换功能和内容的正确性。用字自动转换并不一定正确,甚至可以说是各种自动转换中问题特别多的。中文维基百科的内容有可能已经被用字自动转换修改、破坏,或者用字自动转换本身可能也已经被修改、破坏。

请见Wikipedia:免责声明

断词的问题--自动转换程式很常见的问题[编辑]

转换程序使用最简单的“最大匹配”法进行转换。这会导致如下的错误:

假设转换表中有一对应关系为

内存 => 記憶體

现对以下句子作转换

人体内存在很多微生物

基于最大匹配,系统会对“内存”进行转换,得到“記憶體”。整个句子将会被错误地转换成

人體記憶體在很多微生物

这就是断词的错误。阅读本百科时请多加注意。遇到可疑的部分可以前往编辑页面去查源码,或是多多留意不同用字模式之间的转换关系,以养成自行“反转换”的能力。

用字模式选择[编辑]

目前中文百科系统支持中文的zh-cn(中国大陆用字),zh-tw(台湾用字),zh-hk(香港用字),和zh-sg(新加坡用字)四种用字模式。要支持更多的用字模式需要修改程序,如果有实际需要请在讨论页提出。

文章主体用字模式选择(按优先级):

  • 所有人都可以在URL(http://zh.wikipedia.org/wiki/条目名称)中的 wiki 改成 zh-x。对于 http://zh.wikipedia.org/w/index.php 开头的页面,可以在URL最后加上 &variant=zh-x?variant=zh-x(视URL是否含有?而定)。其中 x 可为 hans、hant、cn、tw、hk、mo、sg
  • 已登入的用户可以在个人偏好里选择不同的中文语言;
  • 对匿名用户,系统根据用户浏览器要求的语言设置;
  • 如果以上设置都没有,则缺省为不转换。

另,各皮肤(Skin)都增加了到各个用字模式的链接,如现在MonoBook皮肤,链接是在文章的右上方。

界面的用字模式[编辑]

界面的用字模式独立于文章内容的用字模式,是皮肤(Skin)本身的性质,不能由放在文章旁的连结设定。已登入用户可以在个人参数里设置。除了中文的各种用字模式,还可以选择英文、法文等等语言。

自动转换的能力范围[编辑]

本百科很多页面都可进行自动转换。但是仍有很多例外。例如最近更新页面Special:Recentchanges这样的特殊页面,就有一部分是不转换的。

参见Wikipedia:什么是条目

页面分类[编辑]

目前自动转换计算机程序的能力范围不只是百科的条目文章,也包括页面分类等等页面。因此除非特别指定,否则条目标题或是子分类标题的分类是根据经过自动转换之后的结果来分类。

实例:美国政治家John Kerry分别有“约翰·克里”、“約翰·克里”与“約翰·凱利”的不同译名。译名的关系已加入转换表,而条目的源码中并没有特别指定不转换,所以阅读者使用维基系统时,并非直接阅读源码,而是由系统将源码自动转换成合适的形式。

在分类页Category:美国政治家之中,如果读者选择中国大陆用字新加坡用字模式,将看到约翰·克里的条目归类在“约”字之下:

而选择台湾用字香港用字的读者则会看到这条目归类在“約”字之下:

子分类也是一样。

参看:页面分类

内部链接、URL、重定向与搜寻[编辑]

虽然源码一般不做转换。只有程序产生出来的页面有经过转换。然而读者收到的页面上,在维基系统之内的“内部链接”(不是外部链接或普通的URL,参见Help:链接),并不是由源码决定,是由程序产生出来的页面决定。也就是说:连结也会受到自动转换计算机程序影响。

同上例:从2004年3月8日2005年3月26日之前,维基百科上面只有约翰·克里条目,而没有台湾用字模式的約翰·凱利条目,也没有将“約翰·凱利”重定向至约翰·克里。这段时间如果在源码中有[[約翰·凱利]] 这段代码的话,那么:
    • 如果有人是用“不转换”模式来浏览的话,那么可以收到连往“约翰·克里”页面的“約翰·凱利”(系统会在用字模式自动转换之后自动加上连到“约翰·克里”的连结)。
    • 如果有人是用“不转换”模式来浏览的话,那么会收到有待编辑的“約翰·凱利”(因为系统直接连到当时什么都没有的“約翰·凱利”)。

用字自动转换计算机程序的能力范围不包括维基百科的URL与搜索功能。百科的系统不会对URL之中的汉字(有时是Punycode的代号形式),或是输入搜索功能的查询字串作用字转换。

同一例:这段时间,“約翰·凱利”无论是条目名称或是其相关的URL(例如 http://zh.wikipedia.org/wiki/約翰·凱利)都是空的。直到2005年3月26日Zhengzhu将“約翰·凱利”重定向至约翰·克里約翰·凱利這個條目,以及相关的URL才有内容。

重定向页的内容不会受到自动转换计算机程序影响。

同一例:Zhengzhu所加入的重定向代码如下:
#REDIRECT[[约翰·克里]]
这并不受自动转换计算机程序影响。请看http://....title=約翰·凱利&redirect=no&variant=zh-tw

本百科的搜索也不会受到自动转换计算机程序影响。但是本百科之外的搜索引擎Google却可能有自己的自动转换计算机程序。

参看[编辑]