由于论文发表压力,多数作品都先以英文写作,再部分翻译成中文后释放于此供维基人讨论使用,若有不便之处请见谅。
若有中文作者想要合作或协助相关研究的翻译及延伸, 请连络我 , 谢谢。
两百科网站,在各地以中文关键字搜寻的结果,的确为能见度最高 的网站
中文关键字类型对能见度最高 网站排名虽有影响,但两百科网站名列前矛的结果似乎具有一致性。
一般来说,中文网站在能见度排名分布,及能见度历史走向,有富者愈富, 贫者愈富的走向,百科网站的重要性也因此更确立。
各地/搜索引擎的偏好,对不同网站形成的能见度高低偏好,可以用来验证网络连结效果(internet connectivity effects)的实证资料基础。
利用能见度前100名的网站,按其能见度数值,以数学方法的二维网络关系区块建模(two-mode blockmodelling),成功将原资料100x9(100网站x9搜寻可能)产出一个3x3分类(3类网站x3类搜寻可能)的分类结果,找出(连结)断裂之所在(对特定中文用户少出现在其搜寻结果的网站)。
以创新的网络视觉化 及社会网络分析 ,不但确定了两百科网站的关键中心角色,也突显了不同的连结效果,而这连结效果,似乎可以相关的地理语言设置来做出区分解释。
(待内容扩充:有关于微博及twitter的接收及使用两百科的分析)
能见度前20名网站列表与能见度分布图: 极少数的网站拥有相当高的能见度数值
2011 OX 在各地搜索引擎能见度最高网站:不同种类搜寻关键字比较
2012 HK 在各地搜索引擎能见度最高网站:不同种类搜寻关键字比较(多了Fortune 500的搜寻关键字)
能见度前100名网站按各地/搜索引擎能见度区块建模分类表结果(Blockmodelling)
按能见度区块建模分类表结果来决定连结断裂(边界)之处
尽管总数上比中文维基多,百度百科的外部链接的世界地理分布,不如中文维基的多元 :ccTLD和geoIP方法产生的地理分区的结果,在世界上几乎所有的地域各别比较上,中文维基的外部链接数量比百度百科的来的多(差异比例最大地区为欧洲、中东和南美 ,并非中国和美国)。
百度百科绝大部分的外部链接为中文 内容(简体为主),中文维基则较多元
百度百科绝大部分的东亚与中文的外部链接为全简体中文 内容,中文维基则较平衡
考量地域大小后,百度百科和中文维基外部链接差异不在中国和美国 的差异,而是在香港、澳门及台湾。
在连往中国的网站 中,中文维基并没有“不够”中国 ,不过的确是比不上百度百科来的“电子商务”。
在连往美国的网站 中,百度百科最爱维基百科,而中文维基百科连往的美国网站有明显地专业及资源集中偏好。
在连往香港的网站 中,中文维基百科比较接近“百科全书”的多样包容性:包括香港主要新闻、政府、体育、金融及公共运输的网站;百度百科不只易受到电子商务/资讯宣传的外部链接影响,还不如中文维基百科在取得香港主要资讯的多样和权威。
在连往台湾的网站 中,中文维基百科比较接近“百科全书”的多样包容性:包括台湾主要新闻、政府、金融及媒体的网站;百度百科连往台湾的网站在质和量上比香港还差/少。
跨语连结:此图呈现维基百科中文版(zh)和其他语言的主要连出连入关系在所有跨语连结网的关系,注意其他百度百科只有一种中文语言版本,而维基百科则有其他中文言语版本及文言文版本
跨语连结:此图呈现维基百科俄文版(ru)和其他语言的主要连出连入关系在所有跨语连结网的关系
跨语连结:此图呈现维基百科阿拉伯文版(ar)和其他语言的主要连出连入关系在所有跨语连结网的关系
跨语连结:此图呈现维基百科土耳其文版(tr)和其他语言的主要连出连入关系在所有跨语连结网的关系
维基百科和百度百科都是使用者产出的网络百科全书(user-generated encyclopedia),也因此,维基百科和百度百科的发展先决条件,在于:能在数字网络环境有读写中文能力的使用者,也就是中文网民。
根据东亚网民扩散比率的历史比较,中国地区的发展,在网民扩散比率上有比较特殊而不符合理想或其他东亚类似区域的创新扩散 S型曲线。
以#网络百科发展 , 维基百科被封和百度百科发起的关键时间为2005-2006年。
以#东亚网民扩散 , 照创新扩散理论, 网民比率应该理论上为S型曲线(正态分布累积), 如en:Diffusion_of_innovations ), 而台湾和马来西亚的确较接近S型曲线(正态分布累积)的发展。
台湾和马来西亚分别做为北京及上海的对照组(依比率最靠近来选取的), 或著是理论S型曲线来看北京及上海的资料, 发现2002-2006年是一个奇异区段 , 似乎在2002-2006年有网民扩散比率在中国有受到抑制。
尽管如此, 网民扩散比率在中国2006-2008年飞快成长, 上海成长之快还超过原领先的马来西亚,
在整合中国新兴第三第四段段网民(late majority, late adopters), 特别是下乡到各学校组织的推广上, 百度百科着力和优势多, 在2006-2009年的发展上也是事实
2002-2006年和2006-2008年两段网络发展史,在中国大陆地区,似乎有一个明显的发展断裂。而这发展断裂的转折点,恰好也是两个网络百科的发展的发展的转折点:(维基百科开始遭受长期封锁,百度百科开张)。
因此,在断裂和整合的问题, 可能有地理语言区的断裂和整合的问题:
百度百科主要整合的是中国大陆地区的使用者,排除了香港及台湾潜在用户,而由于历史发展,不少已使用并编辑维基百科的前期用户,有可能和后来百度百科取得的用户有时间上的断裂。
维基百科主要整合的是各地区的中文使用者,没有排除特定地区用户的自发性问题,然而由于历史发展和关键时期封锁,在整合中国大陆地区2006-2008年快速成长的网络人口中的前期大众和后期大众(early and late majority)则有一空缺,形成了在用户地理(中国大陆地区非沿海城市)及世代人口上(2006-2008年开始变成网民的年轻人)的空缺断裂。
(待内容扩充:有关于两者的编辑政策的数字及素质的发展、及地理语言政策的差异)
两网络百科历史: 百度百科作为后发者及维基百科被封期间
百度百科及维基百科超级用户比较: 2012全球分布
百度百科及维基百科超级用户比较: 2012及2009年在东亚
===总结===
网络的连结效应(connectivity effects)是如何作用的呢?是否能有跨越原有界线的效果还是强化了已有的界线?
同样的大问题,也可以问在百度百科 (Baidu Baike, BB)及中文维基百科 (Chinese Wikipedia, CW)对世界上的中文使用用户的影响,到底这两个网络百科全书,对中文使用者、中文书写百科知识及各种知识来源的整体效果来说,究竟是整合抑或是断裂呢?
我收集了三方面资料:
(1) 编辑‧环境 ,
(2) 内容‧来源 ,
(3) 接收‧使用
并从网络计量学 (webometrics )、书目计量学 (bibliometrics , or scientometrics )及区域设置 设计及技术发展国际化(i18n)及在地化(L10n) ,发展出一套可一般化操作又符合中文网络发展差异的地理语言分析 方法,来对这些资料进行分析,结果发现:
中文维基百科 利用了不少符合网络发展的创新技术,部分解决了中文各地方可能因众多地理语言(及其相关的文化政治)差异的整合性难题,本来最具有整合效应。
然而中文维基百科 在中国大陆地区特定时间遭长期封闭,使得其在整合中国大陆地区新兴网民主体大众上,发生断裂的问题。
在中文维基百科 在中国大陆地区特定长期封闭时期,百度百科 的发起并在中国大陆地区新兴网民主体大众上,取得在中国大陆地区新兴网民主体大众整合的效果,然而其特定的地理语言设置及编辑政策,非中国大陆地区的使用者、内容、及潜在用户并没有整合进百度百科 的发展之中。
互联网 的连结效应(connectivity effects)因此被证明和区域设置 设计及相关的地理语言因素 直接相关,中国官方的网络封锁只是影响连结效应的因素之一,而百度百科及维基百科在考量相关地理语言因素所造成的连结效应(或无/避免连结效应)可能更为关键。
回顾现代中国(modern China)自清朝以来报业发展的地理语言因素及文化政治,中文维基百科 和百度百科 的发展,相当程度为
学者王赓武等大陆中国及海洋中国 的观点。中文维基百科 则为海洋中国为主体的发展,在东亚及太平洋沿岸的华人为主体并以汉字统一码为共同架构上发展的整合活动,百度百科 相较之下则为大陆中国的发展,以三个沿海城市形成的中国大陆网络及简体汉字为主要架构上发展的整合活动。
资料
(...WORK IN PROGRESS)
方法
(...WORK IN PROGRESS)
发表
===研究启示:政策===
(...WORK IN PROGRESS)
发展策略
(...WORK IN PROGRESS)
文化政治
(...WORK IN PROGRESS)
===研究启示:学术===
(...WORK IN PROGRESS)
地理语言
(...WORK IN PROGRESS)
网络计量
(...WORK IN PROGRESS)
许多维基人也许会担心自己在我个人研究的写作中,会有不当的诠释及陈述。也许有人会帮腔,反正维基百科全是公开的没什么好隐藏的。
的确,维基百科的特点之一就是透明,但许多个人资讯如个人的访问资讯及监视列表仍是隐私的范围,维基基金会在释出可供研究的资料时,也非常重视个人隐私保障。
我的写作原则是,预设都是匿名引用,必要时才直接引用其维基账户ID名称,而不以实名引用。若有人强烈要求使用现实真名,我愿配合,但必须请您签一份纸本的同意书。
研究过程虽然是参与的,但论文的写作是个人的,我对我的写作负完全的学术及法律责任,但也请各位尊重我个人的判断及研究成果,若有不同意见,欢迎提出讨论,但并不能要求将讨论全部要写入论文之中,这点请各位了解。
Han-Teng Liao