维基百科:互助客栈/消息/存档/2014年6月

维基百科,自由的百科全书

漢語種百科流量歷史數據

漢語種百科流量歷史數據的視覺化/可視化--❦維基vs百度來源專題 hanteng 2014年5月23日 (五) 10:26 (UTC)

此為資料可視化的互動及動態產生(svg檔格式和json等web friendly的前端資料產出的流程建立)的試做,再補上一個本人試作的互動cartograms為例,利用了最近中國統計當局開放的資料。現行一張又一張的地圖或圖表,不但難以更新也較互動式圖表的侷限多,可否考量未來維基平台的相關圖表的再一次基礎建設更新。--❦維基vs百度來源專題 hanteng 2014年6月1日 (日) 03:48 (UTC)

转发:被“革了命”的维基百科和进化中的知识协作

传送门:http://tech.sina.com.cn/zl/post/detail/i/2014-05-15/pid_8452959.htm-- 2014年5月17日 (六) 06:03 (UTC)

原文有一些观点有意思,但我认为它指出的道路—“后维基时代的知识图景”一节—里面有些点是不成立的,更让人隐隐感觉本文是在给某些商业机会做铺垫。 因为我也有一些系统的思考,这里给出我对此文的回应,也希望大家可以探讨:

文章开头指出—“存量知识已经渐渐颗粒归仓,增量知识又因为支离破碎而无法捡拾”,这个观点是有趣的。很多人都在做类似的思考,也包括我在内。 先简单说一下“后维基时代的知识图景”一节不成立的地方,后面再对增量过程来展开。

  • 人的因素确实重要;但考虑到知识生产(也就是增量部分)的艰难,所谓“社交网络及移动互联时代”的这些商业噱头并不成立。
  • 碎片化而非结构化:我个人也觉得碎片重要,但上文作者此处的碎片化应该是因循社交网路的碎片化而来的,那里的大部分碎片之间并没有太多逻辑的关联;碎片之所以重要,是因为人类知识增量过程是通过碎片一小步一小步艰难完成的,每一步都付出很多。
  • 媒介格式:格式对于思考的突破没有那么重要,音频、视频的出现,多半是在增量完成之后的解释阶段;信息可视化有助于增量的达成;格式问题目前看来 iPython Notebook 和WolframAlpha 的 CDF 都在努力解决,但整体突破或许可能要等待 HTML 的下一个重要版本了。这里的批评有待整个工业界的努力,对维基的批评并不简单成立。
  • 不再追求标准答案:维基从来没有追求过标准答案,这一条对维基的指责并不成立。

我个人对增量过程也很感兴趣,早在2002年汪丁丁先生早就撰文指出了“语言创造”的困难。

 汪丁丁观点修订版:宽带写作是宽带技术提供的创作方式,强调大规模的信息集结和带来的创作。
 大规模的集结或整合,绝非单纯的数量积累,而要求深度思考。
 思考越深入,集结规模就越可宽广。宽带写作的理想形态是在集结了整个网络上与主题相关的信息之后,
 在由此而达的思考的深度和广度上,实行语言创造。

我对此曾经有如下的阐述:

 微博上人们相互呼应,新鲜想法诞生、传播、生长、发散、汇聚。
 围绕有生命力的想法,实践者联系起来产生实践活动,渐渐成长出人际圈和知识域。
 当后来者进入这圈子和领域时,需要一个引领的途径,实践者从想法中理出脚手架供人攀爬,
 有些脚手架存在几个世代甚至几千年了。它们是活的,是引领我们的路途。
 知识的集结、实践者团体的连接变得越来越容易,这是一个正在发生的过程;
 但语言的创造依然艰难,学习的过程不能被取代;
 碎片化的方式并不一定适合所有的领域,学习还是需要付出努力才能掌握前人留下的“脚手架”。

对于增量过程如何完成的,我个人的思考结果是一种知识的波动观和颗粒化机制:

回归到工具层面,我个人的观点是“智能增强”:

 机器不需要僭越人的位置去创造,而只是借助人类智能的创造力,通过相对固定的算法,
 把新词汇和新旧词汇间的关系综合起来,来帮助人们更好的做事情。这就是我们前面讲到的智能增强。

在工具的实现上,我觉得开源的或者商业的笔记类的知识工具是更可能的实现方式。

以上是我的一些简单看法。--Mountain留言2014年5月22日 (四) 14:53 (UTC)

真希望Mountain能回归管理层,给中文维基多带来一些思想。如今规章制度的大网越织越密,管理员忙于/惯于/乐于维护这张网,整个社群基本上还是按照多年前的惯性前进,事务主义让人窒息。--Gilgalad 2014年5月22日 (四) 17:30 (UTC)
谢谢。不过确实生活、工作非常繁忙。这些想法还很粗浅,落实下来,还要去找构造算法、语料库上实测、寻求例证等等,才能真正成为站住脚的一种观点;工作还很多,不过我有兴趣缓慢推进。--Mountain留言2014年5月23日 (五) 04:49 (UTC)
這些各種開放資料的重新組合再造,其實不僅限於傳統定義的自然科學,還有社會科學(如computational social science)、資訊/信息計量學、及人文科學等等(如human geography of web data),維基百科的角色個人建議是成為人讀的懂有脈絡有來源的data curation 資訊/信息展示平台。 最近中國統計當局開放的資料及可視化界面,和中國幾大網路平台的合作,將有更多資料展示的空間,若不嫌棄,可看本人試作的互動cartograms為例,重點或許在於資料可視化的互動及動能產生(svg檔格式和json等web friendly的前端資料產出的流程建立),而不是現行一張又一張的地圖或圖表,不但難以更新也較互動式圖表的侷限多。--❦維基vs百度來源專題 hanteng 2014年6月1日 (日) 03:44 (UTC)
多谢回应!我个人对开放数据数据可视化也有兴趣。不过依照数据信息知识的传统层级划分,开放数据和数据可视化都在比较低的层级上。维基百科更是知识的 curation 平台,其中包含一部分数据和信息的 curation 任务,但后者更多将会在维基数据计划中来承载。但现在的维基百科的缺点是,它虽然整理了知识,却无法把相关的读者、编者非常有效的整合起来;而且它只处理知识生产后期形态相对完备的知识点,对于尚未完全成型的知识点,它能够辅助的比较有限。当然,我想像的这种辅助知识创新的工具,应该已经超出了维基百科的使命和范围了。--Mountain留言2014年6月5日 (四) 15:38 (UTC)

这两天的一些新的关于“可观察性”的想法。“可观察性”的想法最早来自于沃德·坎宁安,他在发明 Wiki 时意识到整个系统必须可以有效的被观察到,才能很好的工作,所以他发明了 RecentChanges 的时间线。今天的维基百科已远非当年的小小站点,如今维基百科的 RecentChanges 已经不能达到有效的被观察的目的了。我们能否重新思考“可观察性”来激活读者和编者呢?举例来说:

  • 我曾经尝试过的 UltraFilter 把 RecentChanges 巨流按照学科拆散,能多少提高一点观察的有效性
  • 参考文献和站外链接里有非常丰富的信息,能否把全站的参考文献和站外链接的更新汇总,重新组织后发布出来呢?
  • 头几年的 Wikizine 和后来的 Signpost 定期汇总社群重要消息,其实也是“有效的可观察”的思路

只有有效的可观察,才能更容易激发人们的参与意识。而维基必须克服传统的知识压倒人的做法,在观察和参与的过程中促成更加和谐、顺畅的人的链接。我觉得从上述角度看,维基百科可以改进的还很多--Mountain留言2014年6月5日 (四) 16:04 (UTC)

Wikidata weekly summary #112

有报道称维基百科 90% 的医学资料有错

这是我发现的传送门

-- 2014年6月1日 (日) 11:25 (UTC)

有错是真的,这个标题“90%的医学资料有错”是误导性表述吧。原文说90%的条目包含错误信息,没说这90%的条目中每条条目中的资料100%是错的。Liangent留言 2014年6月1日 (日) 11:41 (UTC)
所以上回那個美國大學組織醫學學生編輯維基百科是極好的一個辦法,再者不知道為什麼英文版從來不見有{{medical}}。--淺藍雪 2014年6月1日 (日) 16:39 (UTC)
因为页底已经有免责声明,没有必要所有条目中再加上一个--百無一用是書生 () 2014年6月3日 (二) 02:04 (UTC)
是那個Disclaimer?可是中文不是也有嘛--淺藍雪 2014年6月3日 (二) 05:23 (UTC)
英文維基的WP:NDT是正式指引,中文不是。可參考2007年7月25日26日的討論。--M940504留言2014年6月8日 (日) 01:51 (UTC)

关于学术期刊类的

哪里可以提供期刊类的学术网站 --Good2018留言2014年6月4日 (三) 08:39 (UTC)

Google 学术搜索能搜这类网站的信息。-- 2014年6月4日 (三) 15:01 (UTC)
@Good2018:看这Wikipedia:互助客栈/其他#共享文献数据库。--Gilgalad 2014年6月10日 (二) 11:01 (UTC)

越南语版条目数超过日语版

如题。越南语版913505个条目,日语版911510个。--GZWDer留言2014年5月30日 (五) 05:10 (UTC)

天哪,越南语WP又开始刷条目了啊!看来,如果越南语WP再刷九万的话,它就成为第一个条目数突破一百万的亚洲语言版本了(前提是瓦瑞瓦瑞语和宿雾语这个时候没有开机器人去刷条目)!--To be №.N 2014年5月30日 (五) 06:05 (UTC)
我们这里都没人急,急什么,而且还四处唱衰的,急什么也没用。刷得不好又骂,写得慢又骂,看着人家开机器人刷就算刷得不好也只会干咬手帕,哎╮(╯▽╰)╭ ,累了不爱啊——路过围观的Sakamotosan 2014年5月30日 (五) 07:24 (UTC)
  • 個人還是認為質量優先數量,再說地域不同條目內容會有許多差異,比如社會事件、歷史、尤其是行政區和戲劇。最近常看到有人創一些古代秀才的簡短資料,倒底是幹嘛的?關注度就有極大問題了吧,還有一堆雜七雜八的古裝劇鄉土劇,所以用條目數去衡量一個語言非常不準,重點還是在基礎條目質量(強烈支持自然科學!)。另外中維扣除消歧義只有749033,真正條目數不能看首頁的統計。最後,英維就拿元素說好了很多不是特色就是優良,中文維基人似乎沒有非常熱衷去完善一個條目,又加上有方言分散勢力(維基大典更是),還有好長的路要走(以上是在下這兩個月的見聞,有錯還請糾正)__^ 2014年5月30日 (五) 10:00 (UTC)
    好像不是秀才吧,秀才和进士的区别可大了呢。。。--AddisWang (留言) 2014年5月30日 (五) 15:54 (UTC)

呵呵。—Snorri留言2014年5月30日 (五) 16:05 (UTC)

光靠條目數而缺乏質量的名銜,百度百科應該穩握手中,我們不須要去爭。User:水思,元素條目是我的工作重點,不是沒人樂意完善一個條目,只是孤身一人比不過千萬大軍呀!鋼琴小子 打個招呼 查看貢獻 2014年6月1日 (日) 04:04 (UTC)
我有看過你的週期表,元素算我一份,我確定要翻了,現在在等動員令。是說我還蠻期待中日大戰的,只是要記得數字不是真的(真掃興)__^ 2014年6月1日 (日) 07:30 (UTC)
也算我一个,我要翻我家:) --砜中嘌呤的白磷萃取 打谱 2014年6月8日 (日) 01:59 (UTC)
  • 這傢伙[1]用戶頁真是太囂張了,到底越南是怎麼衝條目數的?或者應該說我們之間差的條目數是在哪部份?影視娛樂?還是自然科學?(日語有沒有打算要追啊,我倒寧願是日語先)__^ 2014年6月11日 (三) 04:03 (UTC)
Hello there! I am not arrogant as you think. I guess you use Google Translate to understand the meaning on my page. Sorry typing in English because rarely of us know or learn Chinese. Alphama留言2014年6月11日 (三) 23:08 (UTC)

越南版上百万也指日可待了呢。—Snorri留言2014年6月11日 (三) 04:07 (UTC)

搜索引擎与网站间网络结构:基于能见指数的分析

百科全书网站和百科全书网站的跨中文本地化關係,已有中文版供社群朋友們閱讀批評。在此感謝 武汉大学 信息资源研究中心 的博士生 张斌的大力編輯及潤稿。此中文全文已投武汉大学所舉辦的一學術研討會。文件下載:[2]--❦維基vs百度來源專題 hanteng 2014年6月14日 (六) 08:06 (UTC)

Portal:中国共产党正式建立!!!

请对本主题有兴趣的维基人进行完善!!!有兴趣请移步Portal:中国共产党--Ds950524留言2014年6月13日 (五) 09:14 (UTC)

謝謝你理解維基專題不應該拿來做公關(任何有中国共产党党員身份的人要注意WP:COI),而是展示有意義的知識。我做了此編輯[3]而你補上[4],這樣比較有讓讀者做多方解讀的空間。祝好運。--❦維基vs百度來源專題 hanteng 2014年6月14日 (六) 08:10 (UTC)

待我更新完Portal:化学/Did you know/存档之后,我会在Wikipedia:新条目推荐中寻找与中国共产党相关的DYK并放入Portal:中国共产党/Did you know中。另外(*)提醒一下主题创建者不要忘记在{{portals}}中的合适位置加入您所创建的主题。--To be №.N 2014年6月14日 (六) 14:49 (UTC)

Wikidata weekly summary #113

中國如何和世界互動:全球事件数据库GDELT的視覺化試作

全球事件数据库GDELT,收集了近幾十年來的新聞事件並加以情緒、地理、及行動者的相關編碼。譯言有一篇介紹在过去的三十年,新闻报道如何影响了我们的世界观

我最近也試用了一下,跑了一下今年六四之前一個月的新聞並視覺化,結果在此[5]。若有人有興趣試做或試改,相關程式碼及說明見此[6]

我在Wikipedia:互助客栈/技术提問如何能有系統地從維基資源取得類似的新聞事件的資料點?動機是�由於GDELT的資料或有其英文中心或偏向的問題,所以我在思考如何從不同語種的維基資源中有系統地擷取類似的資料點。--❦維基vs百度來源專題 hanteng 2014年6月16日 (一) 08:40 (UTC)

台灣維基分會在2014開源人年會上有攤位

感謝 COSCUP 2014 開源人年會主辦單位,今年中華民國維基媒體協會有正式攤位,歡迎想了解 Wikipedia 維基百科相關媒體計劃的朋友們,到時候一起來攤位上與維基人聊天。--章安德魯留言2014年6月17日 (二) 03:38 (UTC)

  • 主辦地點不錯喔,是中研院很新的大樓,常用來辦國際會議的。後面還有一個小山丘和農家,想運動看夜景的人還可以一路從中華工專的入山口健行到四獸山。可惜我七月就要回歐洲準備口試了,不過若有人要在台北組織wikipedia hackathon,找我。主辦地點交通方面是不如台北其他地方方便,不過中南部的學術界朋友可以試試看中研院到幾個大學的專車看能不能用的上喔。--❦維基vs百度來源專題 hanteng 2014年6月17日 (二) 06:36 (UTC)

华语微博用户拿百度百科和维基百科作啥?

[7]為回答此问题,我從信息接触/資訊參與(information engagement)的角度分析了由 香港大学WeiboScope及Texifter.com提供的DiscoverText – 微博数据集,一共超过40,000微博帖子。若旅行經費順利找著,我将在今年在柏林的Opensym2014宣讀並展示研究结果。英文論文連結[8]。--❦維基vs百度來源專題 hanteng 2014年6月17日 (二) 06:39 (UTC)

問:蔣勳先生生平

今(2014/6/18)日找尋蔣勳先生相關資料時,卻發現在條目上註明他已於2010年去世,但蔣勳先生尚未去世,近期內亦有參加過他的演講,可煩請更動之大德將其復原,謝謝。 --Tseng29留言2014年6月18日 (三) 03:10 (UTC)

使用方针修订:公开有偿编辑

维基媒体基金会已经正式发布了修正后的方针修订,任何通过编辑获得报酬的行为都需要以指定的方式公开。--♥VC XC 2014年6月17日 (二) 07:18 (UTC)

部分测试功能即将在中文维基百科全面试用

今天与基金会技术团队交流,得知很可能在本月底或下月初,在包括中文维基百科在内的数个语言版本全面试用包括“悬停卡片”、“简洁用户栏”、“媒体文件查看器”、“新搜索”等测试功能。届时这些功能将对所有用户设置为默认启用,但可以在设置中关闭。目前未决定这些功能是一起启用还是分批启用,但对方表示,它们都已经进入开发完毕的收尾阶段,并鼓励用户前往参数设置里尽早体验,以提报可能存在的BUG。--♥VC XC 2014年6月13日 (五) 03:31 (UTC)

“新搜索”早就默认启用了搞错了...--百無一用是書生 () 2014年6月13日 (五) 06:18 (UTC)
“悬停卡片”目前不支持繁简转换。而且悬停卡片下方的“最后编辑于xxx”的xxx无法汉化(我找了半天也没找到在哪里改)--百無一用是書生 () 2014年6月13日 (五) 06:54 (UTC)
你看到的是之前用户的繁简设置……bugzilla:66621。后面一半 无法重现Liangent留言 2014年6月14日 (六) 18:19 (UTC)
移到书生君用户页连接写有“最后编辑于a month ago”这叫 无法重现,呵呵。--Liuxinyu970226留言2014年6月15日 (日) 03:21 (UTC)
話說zhwp會有幫助:圖書嗎?——C933103(留言) 2014年6月20日 (五) 05:52 (UTC)

Wikidata weekly summary #114

瓦萊瓦萊文維基百科成為百萬大戶

剛剛傳來的消息,瓦萊瓦萊文維基百科藉著刷生物條目成功成為百萬大戶。餘下的我就不說了,留待大家商議。--春卷柯南夫子 ( ) 2014年6月9日 (一) 14:04 (UTC)

哈→哈→哈↘。——路过围观的Sakamotosan 2014年6月10日 (二) 00:30 (UTC)

那宿雾语怎么办,LSJbot打算放弃它了吗?--向端粒向酶解投上冷冷的一眼骑士呵,向前2014年6月10日 (二) 03:33 (UTC)

哈!賓賓的機械人果然利害。只有77名活躍用戶的百科,竟然刷了百多萬個條目。超越英語維基真的是指日可待啦!XD --Qui cherche trouve 2014年6月10日 (二) 03:49 (UTC)
没有质量的数量,不要也罢--180.155.69.97留言2014年6月10日 (二) 06:30 (UTC)
但人总要脸,没质量的话只能打肿双面充胖子。——路过围观的Sakamotosan 2014年6月10日 (二) 07:24 (UTC)
槍打出頭鳥,它以這樣的速度增長,相信很快會有管理層留意。--Qui cherche trouve 2014年6月10日 (二) 07:43 (UTC)
希望基金会拨乱反正,然后刷过的退回去或者一纸禁令?呵呵,希望吧。倒不如找wing提议下,或者想办法在不影响现有条目质与量的情况,冲击一下吧。——路过围观的Sakamotosan 2014年6月10日 (二) 08:57 (UTC)
不是两年前就有人说要跟基金会说么。说没说忘了...--lavixcanvas Fight On M T C 2014年6月10日 (二) 09:29 (UTC)
我记得有人说过老大哥曾经公开场合支持机器人刷条目的行为。--Walter Grassroot () 2014年6月10日 (二) 09:35 (UTC)
条目数多有什么价值?能向基金会申请更多的资源吗?或者提升某些语言的国际地位?--管闲事且对地图炮具有100%抗性的朝鲜的轮子留言2014年6月11日 (三) 01:52 (UTC)
规模效应啊。瓦莱瓦莱哇,亚细亚一番哟!—Snorri留言2014年6月11日 (三) 01:58 (UTC)
小小菲國有美帝撐腰,竟然真的狐假虎威起來了!--Qui cherche trouve 2014年6月11日 (三) 02:14 (UTC)
唉,真是可笑复可悲。—Snorri留言2014年6月11日 (三) 02:19 (UTC)
我在想象排名低于中文的版本发生的事情:(==这人为何不去刷塔加洛语版)适当修改代码后,它确定了下一个双刷目标是(以下之1~2):奥克语版皮埃蒙特语版海地语版布吉语版Samogitian语版Banyumasan语版。--Liuxinyu970226留言2014年6月10日 (二) 09:20 (UTC)
瓦萊瓦萊語是紅連,是否應該為它建立一個條目,讓大家知道甚麼國家的人在使用,使用人口有多少?別外,我真的很想廢掉香港語粵語維基百科,不堪入目--Dragoon17cc留言2014年6月10日 (二) 18:28 (UTC)
瓦瑞瓦瑞語,菲律賓方言。--Qui cherche trouve 2014年6月11日 (三) 01:24 (UTC)
粵語應該要介紹有關自己語言文化風俗,而不是愚昧地重複創建中文維基有的學科條目,這是我對方言百科的看法,況且基本上中文維基就應該包含所有方言有的條目__^ 2014年6月11日 (三) 04:21 (UTC)
每次看到机器人刷条目就想到摆渡百科。--管闲事且对地图炮具有100%抗性的朝鲜的轮子留言2014年6月11日 (三) 01:50 (UTC)
青山不改,綠水長流……--Qui cherche trouve 2014年6月11日 (三) 02:10 (UTC)
這是什麼巫術?(越南語哭哭囉)__^ 2014年6月11日 (三) 04:14 (UTC)
越南語也开始行动了vi:Special:NewPages。条目数目前是935360个,比十几天前多了两万个。今天已经建了六千个条目。--GZWDer留言2014年6月11日 (三) 05:13 (UTC)
这是一场Cheers!-bot 和 LSJbot两人的斗争。--Walter Grassroot () 2014年6月11日 (三) 06:06 (UTC)
機器人需要人操作還是可以自運?應該不用休息吧?挖了一下vi:Special:NewPages,第一槍從2014/6/10 14:33一直到22:00(似乎是UTC),隔天02:29又開始刷到07:52,最快時在03:30左右每分鐘19頁。是說維基是共用伺服器還是有分語言?__^ 2014年6月11日 (三) 10:16 (UTC)
维基媒体基金会有137台应用程序服务器运行Apache+PHP,对不同语言不同项目提交的请求都会被负载均衡到这些服务器上,不存在“分语言”这一说法,甚至同一用户两次修改一个页面的两个请求都是由不同的服务器处理的。话说每台服务器每秒处理20-40个请求,总共每秒处理3000-6000个请求,“每分鐘19頁”根本不算什么。参见ganglia--180.155.69.97留言2014年6月12日 (四) 05:09 (UTC)
真不愧是機器人,創出簡潔有力的條目。--躍(留言)☜DC12 2014年6月12日 (四) 12:24 (UTC)
再請教一下,機器人創頁面的資料都哪裡來的,自動翻譯其他語言嗎?這樣不就會有拙劣翻譯問題?(war:special:newpages還在搞,速度慢很多就是了,這樣下去我賭乾杯-殭屍!會贏←谷歌老兄的翻譯)__^ 2014年6月12日 (四) 12:41 (UTC)
神聖的大便!這就是真相嗎?一個淒美的愛情故事造就了第一個突破百萬的亞洲語言?(泣__^ 2014年6月12日 (四) 12:55 (UTC)

請讀並加入Wiki-research-l Quality on different language version的討論。--❦維基vs百度來源專題 hanteng 2014年6月13日 (五) 19:13 (UTC)

我在想今年wikimania的时候要怎么办…… --达师 - 277 - 465 2014年6月21日 (六) 04:36 (UTC)

有什么问题吗?--管闲事且对地图炮具有100%抗性的朝鲜的轮子留言2014年6月21日 (六) 14:00 (UTC)

中文维基百科条目增速彻底慢了。E100C留言2014年6月22日 (日) 16:17 (UTC)

以後的條目都小作品就好了,這樣創立比較迅速果決,遵守規定才免於快速刪除。--Jisiko11留言2014年6月25日 (三) 14:42 (UTC)
果真是迅速果决啊- - 首先对于此版本的wikipedia表示热烈祝贺,另外(...)这样的方法还是很不错的吧......

2014年4月维基媒体亮点

亮点来源于2014年4月维基媒体基金会报告维基媒体工程报告,以及其他重要的维基媒体活动事件

—以上未簽名的留言是于2014年6月27日 (五) 14:42 (UTC)之前加入的。

80万条目所用标志

中文维基百科将突破80万条目时所用标志是什么?Joe young yu留言2014年6月28日 (六) 10:19 (UTC)

参考WP:ST,还有至少130天,现在想这个是不是太早了?--Azunyan(留言) 2014年6月29日 (日) 07:23 (UTC)

Wikidata weekly summary #115