维基百科:互助客栈/技术

维基百科,自由的百科全书
跳转至: 导航搜索

互助客棧消息发表 · 方针发表 · 技术 · 求助发表 · 条目探讨发表 · 其他发表 知识问答发表
快捷方式
WP:VPT
Breezeicons-categories-32-applications-development.svg

本頁用作讨论在编辑时遇到的技术问题;發表問題或討論前,請先參閱常見問題解答帮助信息MediaWiki基本問題及搜索舊討論記錄。另請注意:

請注重禮儀及遵守方針與指引,一般問題請至互助客栈/其他知识问答提出,留言后请务必签名(点击 Vector toolbar signature button.png )。


發表前請先搜索存档,參考舊討論中的内容可節省您的時間。
存档图像
互助客栈(技术)档案馆
编辑

2005年 12
2006年 1 2 3 4 5 6 7 8 9 10 11 12
2007年 1 2 3 4 5 6 7 8 9 10 11 12
2008年 1 2 3 4 5 6 7 8 9 10 11 12
2009年 1 2 3 4 5 6 7 8 9 10 11 12
2010年 1 2 3 4 5 6 7 8 9 10 11 12
2011年 1 2 3 4 5 6 7 8 9 10 11 12
2012年 1 2 3 4 5 6 7 8 9 10 11 12
2013年 1 2 3 4 5 6 7 8 9 10 11 12
2014年 1 2 3 4 5 6 7 8 9 10 11 12
2015年 1 2 3 4 5 6 7 8 9 10 11 12
2016年 1 2 3 4 5 6 7 8



缺字處理議題:引進動態組字處理技術[编辑]

Hi大家好,敝人跟夥伴目前在維基文庫處理吳守禮紙本的s:國臺對照活用辭典維基化作業,遇到了大量的漢字缺字課題。好在現在動態組字技術成熟了,也已經有開放原碼的動態組字引擎,這使得產生出來的字可交換、可讀、可顯示、還可被搜尋,而不再需要苦苦等unicode編新的碼。除了敝專案以外,這個技術一樣可以造福所有的古籍上傳課題(unicode不管有沒有編碼的漢字都可以呈現了),於是想要引進這個技術。雖然本來是維基文庫的議題,但是發現維基百科一樣有缺字問題,例如Biángbiáng面缺字搜尋結果,所以也在這邊提一下。

測試給Mediawiki使用的動態組字引擎與mediawiki延伸模組(增加 IDS這個標籤)的效果圖

詳細我寫在我維基文庫的個人頁,目前成像伺服器架在基金會的實驗伺服器裡。

歡迎大家來測試與討論,也請不吝給予在下建議。 --魔法設計師留言) 2016年6月21日 (二) 12:53 (UTC)

支持!--百無一用是書生 () 2016年6月22日 (三) 02:53 (UTC)
关于Biángbiáng面这个,对于Biáng是否属于字,似乎存在争议--百無一用是書生 () 2016年6月22日 (三) 02:54 (UTC)
關於這個,紙本時代,在漢字構成的技術觀點(六書裡的象形、指事、形聲、會意)上,只要用「四書」原則,寫得出來的話,應該就是一個字。看條目,Biángbiáng面是以會意的方式組合那些字根部件。其實對於漢字比較中立的認知,它就純粹是一個符號體系,甚至不見得字字都唸得出來。有相當數量的漢字還是特殊領域用字,只有受過訓練才理解與閱讀,比較有名的有傳統音樂譜:宋朝樂譜範例,還有清朝公文官員罵英國人,發明新字https://tools.wmflabs.org/idsgen/⿰犭英.png?字體=楷體,此外在台灣還有這個奇妙的戶政用字https://tools.wmflabs.org/idsgen/⿱⿰OK土.png?字體=楷體,是一個人的姓名,最後傳統中醫更是一大堆缺字,這些都是過去把古籍放到維基文庫卻步的大問題。--魔法設計師留言) 2016年6月22日 (三) 06:24 (UTC)
labs上的给个链接看看?Liangent留言 2016年6月22日 (三) 02:59 (UTC)
[2]--Antigng留言) 2016年6月22日 (三) 03:02 (UTC)
这个链接是坏的……Liangent留言 2016年6月22日 (三) 03:18 (UTC)
[3]服务有效?但是从nullpoint来看,是直接把整个站台做成API服务接口,输入参数来生成,然后没做好没参数输入的修正炸了?——路过围观的Sakamotosan 2016年6月22日 (三) 05:45 (UTC)
給大家一個使用範例:https://tools.wmflabs.org/idsgen/⿺辶⿴宀⿱珤⿰隹⿰貝招.png?字體=宋體,目前上游還沒有給傳空字串的結果,我會去發issue給他進行修正。--魔法設計師留言) 2016年6月22日 (三) 06:24 (UTC)
支持,可用于显示Unicode缺字,但Unicode有编码的汉字仍应使用标准字符为宜,以便于交流。—Chiefwei - ) 2016年6月22日 (三) 05:12 (UTC)
是的,盡可能用標準的,不得已才用這個,不過這個程式有資料庫,上游的程式作者有說過將來要加上反查有沒有已訂碼的unicode,有的話,就從IDS代換成已有的unicode碼(例如說輸入「⿰女子」,會變成unicode的「好」)。--魔法設計師留言) 2016年6月22日 (三) 06:24 (UTC)
<?php
/*
 * Author Shoichi Chou ( shoichi.chou@gmail.com )
*/

// 0614-2016 change server to https://tools.wmflabs.org/idsgen/
class IDS {
	static function onParserInit( Parser $parser ) {
		$parser->setHook( 'ids', [ __CLASS__, 'idsRender' ] );
		return true;
	}
	static function idsRender( $input, array $args, Parser $parser, PPFrame $frame ) {
	  /*
	  Example:
	  $ret ='<img alt="⿰電心" src="https://tools.wmflabs.org/idsgen/⿰電心.png?字體=宋體" width="16" height="16"  />';
	  */
	  $ret = '<img  align=middle alt=" ';
	  $ret .= $input;
	  $ret .= '" src="https://tools.wmflabs.org/idsgen/';
	  $ret .= $input;
	  $ret .= '.png?字體=宋體" style="height: 1em; width: 1em; vertical-align: middle; margin: 0.4em 0px 0.7em; "  />';
	  return $ret;
	}
}
把服务器地址,字体和宽度写死在代码里,而不是可以在localsettings.php里面设定,不好吧。--Antigng留言) 2016年6月22日 (三) 06:44 (UTC)
另外感觉这不科学,应该让后端去访问解析字体的服务器,并适当缓存,而不是让用户的浏览器去干这事。--Antigng留言) 2016年6月22日 (三) 06:47 (UTC)
我說明一下,關於extension目前是在測試,所以只有寫到這樣,的確還有很多可以改良的,我會改良成可以在localsettings.php裡面設定(或者pull給我也可以)。關於字體的寬度部份,是配合mediawiki的字形預設設定,讓組出來的缺字融入一般字的排版,至於字體部份,我打算讓ids標籤可以指定字體與大小。至於從mediawiki後端去visit,是不是算是要hacking mediawki的層級?--魔法設計師留言) 2016年6月22日 (三) 07:04 (UTC)
目前维基百科上所有的扩展都是从后端去访问的,比如mw:Extension:CirrusSearch会访问elastic search,mw:Extension:VisualEditor会访问mw:Parsoid。另外这个功能有没有php实现?如果有的话直接放到里面应该会比较好。--Antigng留言) 2016年6月22日 (三) 07:11 (UTC)
這個server是用java寫的,目前沒有php。我有空會來研究這兩個extension的代碼。--魔法設計師留言) 2016年6月22日 (三) 07:34 (UTC)
(?)疑問,有沒有提供「夾擊」組字?比如「左右夾擊」:一個部件居中,其他部件左右包夾。如「夾」、「坐」、「乘」等。--宇帆(留言·) 2016年6月22日 (三) 07:08 (UTC)
關於這個,unicode的IDC組字符有定義,是用這個「⿻」,不過引擎上遊還沒有實作。--魔法設計師留言) 2016年6月22日 (三) 07:30 (UTC)
這是蓋server的github,可以在發issue說,希望⿻夾擊的實作。--魔法設計師留言) 2016年6月23日 (四) 05:32 (UTC)
有可能输出成MathJax那样在客户端渲染的不……Liangent留言 2016年6月23日 (四) 04:24 (UTC)
動態組字在客戶端的render其實也有人發展過,但是在維基相關計畫的課題就是,那應該讓所有人不管瀏覽器有沒有裝插件,都可以看得到。好比一個數學式子,如果一個人瀏覽器有裝插件看得到,另外一個人沒有裝插件就看不到,這就不公平了。--魔法設計師留言) 2016年6月23日 (四) 05:27 (UTC)
话说这个github里的源码还是半中文办英文的。Liangent留言 2016年6月23日 (四) 09:37 (UTC)
看樣子維基百科可以有印章了[4][5] --Liuxinyu970226留言) 2016年6月23日 (四) 02:28 (UTC)
這樣更完整喔 https://tools.wmflabs.org/idsgen/⿴囗⿱⿰維基⿰百科.png?字體=楷體 「囗」裡面裝的東西可以自己換看看ː)--魔法設計師留言) 2016年6月23日 (四) 05:15 (UTC)
[6]这个为什么就到左边去了……Liangent留言 2016年6月23日 (四) 05:41 (UTC)
這個不行,必須是真的能包圍的部件才可以。□跟囗部是意思不同的部件。--魔法設計師留言) 2016年6月23日 (四) 07:31 (UTC)
(~)補充:另外想請問一下,會不會實作對現有文字可供操作的支援?比如說可以把文字部件鏡射或分割之類的,舉個例子:
澎湖西嶼古早名詩文 (外部圖像連結、位於澎湖西嶼二崁聚落)
乒 乓 一 隻 舟
缺字图片 缺字图片 水 中 流
𠁣 𠃛 搖 船 櫓
ㄔ 亍 到 揚 州
「水」字的左右切割之右邊
當中的缺字图片缺字图片,之類的,我想說的是,會不會提供這類幾何變換?如「鏡射」、「切割」、「旋轉」之類的?--宇帆(留言·) 2016年6月23日 (四) 08:31 (UTC)
關於鏡射或分割,引擎應該都不難做得到,課題是要先推新的IDC給unicode,引擎才能實作這個功能。--魔法設計師留言) 2016年6月23日 (四) 08:34 (UTC)
晚上補充,你說的分割,應該算是「減筆」,這個是處理完缺字的最後一哩路,就是要處理古代那些對的「故意的錯字」,例如說某某皇帝,所有人寫的字,字裡面有用到皇帝名諱的部件,統統要減筆。例如清朝康熙皇帝愛新覺羅氏燁的時代,漢臣寫到有「玄」這個部件的字(例如炫、玹等等)含玄本身,都必須減筆(通常是減一筆)表示避諱,而這個就真的要訂出一個新的IDC以及處理協定--魔法設計師留言) 2016年6月23日 (四) 14:53 (UTC)
另外一個(?)疑問:有沒有「偏旁自動縮小」功能,不然[7]這類型的字並沒有顯示得像「彣」,看起來只像文和鏡像氵字邊而不像「彣」.....。--宇帆(留言·) 2016年6月23日 (四) 08:21 (UTC)
這個問題是左下包圍右上的「包圍部件」還沒有實作到,就會暫時用左右組的模式。因為這跟上下組、左右組不同,「包圍部件」必須一個一個去coding,有些部件還必須要發生變形,例如你提到的這個「文」,這都需要寫特殊的設定,程式才知道如何render。目前台灣這邊開源社群有一位朋友針對「包圍部件」做了這個表格用提報制來處理,讓作者知道要設定調整哪些「包圍部件」,詳細請到作者的github那邊看相關issue。--魔法設計師留言) 2016年6月23日 (四) 16:59 (UTC)
抱歉,我剛才測試了一下我發現我錯了,程式是會自動處理左下包右上部件,並沒有代換左右組,問題是在於這個文應該要發生變形(最後一筆要拉長)。--魔法設計師留言) 2016年6月23日 (四) 17:05 (UTC)
@Shoichi::那麼....目前有解決方案嗎?--宇帆(留言·) 2016年6月28日 (二) 03:41 (UTC)
回報組字server的開發者請他處理,IDS還是按照正確的來描述即可,server更新上新功能時,就會生效--魔法設計師留言) 2016年6月28日 (二) 04:53 (UTC)
@Shoichi:可是現在不只「彣」[8]有問題,「翅」[9]、「讀音:讀音未明,字元描述:龜包毛[10]、「㔺」[11](下半部為「七」包「十」,七最後一筆應拉長但實際上沒有)、「㝽」[12]、「䶭」[13]、「尷」[14]、「尬」[15]、「鼬」[16]、「兡」[17]、「处」[18]、「甤」[19]、「甦」[20]、「飑」[21]、「瓸」[22]、「颱」[23]、「起」[24]、「麵」[25]、「毯」[26]等等...也都有問題[資料來源:新編辭海, 趙錫如編, 上友出版, ISBN 9867648358]
尤其「起」[27]最誇張,看起來好像「起」不來的感覺 囧rz...。這已經不是單獨提報問題,是要直接支援最後一筆拉長才能解決。--宇帆(留言·) 2016年6月28日 (二) 04:59 (UTC)
我的意思就是說透過程式去實作最後一筆拉長,這仍然需要提報案例,讓程式設計師可以彙整這些組合的特徵,來設計演算法。另外一個面向,目前動態組字技術上的定位,是作缺字顯示,補充傳統靜態字型顯示的不足。並非馬上要取代傳統字型顯示技術。而你列舉的這些狀況,主要是「寫法」上的美化,這些字在書上還是可以找到純粹左右組的版本,本來拉長是為了美觀的目的。而且他們在unicode都已經有定碼了。缺字處理的技術革新原則,是先求有,再求美,先能表達得出來最重要,英文在電腦上的顯示,一開始也是醜醜的,演化幾十年才到現在美觀。--魔法設計師留言) 2016年6月28日 (二) 08:11 (UTC)
@Shoichi:我的意思是,如果連現有的文字都無法正常顯示的話,要如何妥善顯示缺字呢?所以還是請修正尾筆拉長問題。--宇帆(留言·) 2016年6月28日 (二) 08:17 (UTC)
這是處理缺字的方案,不是顯示已編碼文字的方案,如果他可以非常美好的顯示一切已編碼文字,那舊技術就可以完全廢除了,所以這是一個「補破洞」的技術,雖然還不完美,但是已經可以補到可能百分之九十幾了,而且隨著程式改良跟unicode提出新spec,未來可以逼近百分之百解決問題。而關於缺字引擎改良,請整理匯報你發現的狀況到這個表格,有網友會定期提報給作者sih4sing5hong5的專案網站去,或者你也可以直接去request new feature,這才能解決問題,我只是引進這個技術,架設、測試這項服務,我並不是這個缺字引擎的開發者。--魔法設計師留言) 2016年6月28日 (二) 08:37 (UTC)
好的謝謝。@Shoichi:另外我要跟您道歉,我一直誤以為您是開發者又一直要你加入麻煩的功能支援,對不起。我只是希望他能顯示所有不在UNICODE的中文字包含異體字,例如這個字需要將草字頭的一半旋轉然後有四個——「讀音:kui2,字元描述:傾斜的四個屮」,還有尾筆拉長(有些異體字就是筆劃拉長後塞東西進入,上方是舉例只能用目前UNICODE有的字元來舉例,不然無法顯示應該顯示的樣子)等「異體字」支援,我希望的是這套功能有能支援所有「異體字」顯示,但是無理的要求給您添了麻煩,本人感到很抱歉,對不起。--宇帆(留言·) 2016年6月28日 (二) 12:12 (UTC)
沒有啦,不麻煩,還請你把這個好的念頭,下在對的地方(整理收集),與灌注到正確的人身上。此外技術上這個就是動態組字技術比較高的標竿的地方,因為有些東西,不是說筆劃想拉長就拉長那麼簡單。實務上,你看到這些漂亮的傳統造字技術做出來的,其實是靠另外準備的「變形版字根」達成。而這就會有麻煩的地方,因為這有不少是標準unicode沒有,而在各字型檔內自行定義的,這很容易發生可能收字大的甲字型檔內部有這變體,可是乙字型內部卻沒有這個「變形字根」,就算有,可能他們在兩邊的編號還不同,這方面的要怎麼處理?要用建表法或者自動演算法解決?作者他應該還是需要進一步研究。--魔法設計師留言) 2016年6月28日 (二) 13:25 (UTC)
葵之異體[1]
剛才會一直執著是因為我覺得,似乎大部分在右下角有最後一畫的字好像在實作「⿺」的時候都需要尾筆拉長。我們不知道何時處理缺字時還會遇到多少個在處理「⿺」時又遇到右下角有最後一畫的包圍部件,雖然有些字可以純粹左右組,但有時候應「⿺」的字,左右組看起來就是不太對勁,感覺怪怪的QQ。--宇帆(留言·) 2016年6月28日 (二) 14:21 (UTC)
你提的這個就是美的問題,但是在表意上,我看過文字學家的版本,有些其實是沒有拉長尾筆的。--魔法設計師留言) 2016年6月28日 (二) 14:41 (UTC)
敢問一下,現階段有組出葵的異體讀音:kui2,字元描述:傾斜的四個屮字的方案嗎(異體字典讀音:kui2,字元描述:傾斜的四個屮的頁面異體字也算是一種缺字吧......?!)--宇帆(留言·) 2016年6月28日 (二) 14:29 (UTC)
這個就難了,是的異體字也是一種缺字,處理漢字缺字最可怕的,就是有這種不是現代定義的漢字的漢字,這也是為何這個組字引擎也容許不是漢字的部件也可以組的原因。XD,這種我們會需要借其他語言的字母甚至標點符號來合成,不然這種的,就真的是必須要推進unicode的字了。--魔法設計師留言) 2016年6月28日 (二) 14:41 (UTC)
收回我剛才的話,這個字查中研院的國際電腦漢字與異體字字典,這個異體字已經在unicode裡了,這個組字引擎也可以顯示。--魔法設計師留言) 2016年6月28日 (二) 14:52 (UTC)
那....𦮙可以去掉草字頭嗎?--宇帆(留言·) 2016年6月28日 (二) 14:56 (UTC)
那就得查unicode有沒有收,碼多少,這個組字server裡面的字型,是CNS11643,跟最新的unicode很緊,而且互相給,收字非常完整(甲骨文都有),所以也可以純粹「當字型檔用」也可以。--魔法設計師留言) 2016年6月28日 (二) 15:03 (UTC)
其實我只是想詢問加入「旋轉」的可能性,如過不可能,直接跑去找原作者說也不好意思(雖然本例是轉45度,想像一下,如果可以旋轉90度,我們就可以上下顛倒反著寫字了~~~~),或許不用改現形IDS協定的定義,只要讓其可以「輸入參數」像是函數可以輸入引數之類的概念就可以了--宇帆(留言·) 2016年6月28日 (二) 15:09 (UTC)
(?)疑問:@Shoichi:那麼這東西可行性如何?如果可行又該如何提報?或該提到到哪去?又或者現階段不可行?類似這樣定義--宇帆(留言·) 2016年6月29日 (三) 14:40 (UTC)
提報給unicode組織,希望有新的IDC組字符以及新的缺字部件--魔法設計師留言) 2016年6月30日 (四) 05:30 (UTC)
@Shoichi:所以您不建議將這個替代字元「⬚」的IDC擴充定義(&)建議給上游引擎開發者?好吧,我這次可能太強人所難了。。。。。抱歉。--宇帆(留言·) 2016年6月30日 (四) 06:38 (UTC)
我前一句寫「提報給unicode組織」,IDC跟IDS是unicode的規格,不是我上游的「漢字組建」動態組字引擎或者是我發明的。所以,還請去了解這些技術規格,對正確的人或者單位提案,畢竟這個技術是要應用在維基相關計畫,有標準就得遵守。--魔法設計師留言) 2016年6月30日 (四) 12:52 (UTC)

(?)疑問:好像不支援康熙部首符號,怎麽回事?-- 2016年8月7日 (日) 06:44 (UTC)

另外跟大家報告,我已經跟基金會申請好動態組字的測試wiki站,在這裡,這個站有沙箱,大家可以盡量測試。--魔法設計師留言) 2016年6月28日 (二) 04:53 (UTC)


另外就是,这个技术有没有考虑处理繁简转换,还是需要中文维基自行处理转换。就算是交由中文维基自己的转换技术处理,由于繁简体字形规范不同,字体字形可能还是需要组字技术提供支持,因为我注意到,目前的范例无论是宋体还是楷体使用的都是台湾标准字形。—Chiefwei - ) 2016年6月28日 (二) 09:57 (UTC)

在組字的層面其實不考慮繁簡轉換。因為這個技術是要精確的呈現一個字形=哪一個部件加上哪一個部件,不能發生A+B卻變成C+D的結果。此外,可以組的部件其實並不限於所謂繁體字,有可能簡體字的部件+繁體字的部件+英文字母也是有可能。但是繁簡轉換技術有必要的話,可以從中文維基這邊作對照表,讓IDS組出來的某繁體字對應成某IDS組出來的簡體字,甚至對應成某個已經有unicode碼的字,再讓組字引擎進行render程序即可。--魔法設計師留言) 2016年6月28日 (二) 13:02 (UTC)
感谢回应,繁简转换交给中文维基自行完成没有问题。但是我的意思是,由于两岸字形规范不同,即使对于同一个码位的字符,不同规范的字体显示出来的字形也是不一样的。例如同样是宋体(明体),“艹”“辶”等部首在PMingLiu(新细明体,台湾规范)和SimSun(中易宋体,大陆规范)的字形笔画并不一致。这类差异是字形规范差异,而不是繁简差异。而这些缺字由于是以图片格式输出,所以都是用台湾规范显示的,在简体环境下会显得比较突兀。所以,建议进一步细化“宋体”、“楷体”这类字体称谓,或者说,引入更多不同地区标准的字体,以方便各地使用。—Chiefwei - ) 2016年6月28日 (二) 13:36 (UTC)
這個應該有可能以增加新字型檔達成。此外,即使是現有的字型檔裡,一樣有簡體的部件,以「辶」為例,其實有辶、⻌、⻍三種,在一般字型可能偷懶,你可能看到其中兩個都一樣,但是給這個組字引擎顯示出來,依序如下:(請按連結進去看)。所以可以用簡繁對照的技術,把某繁體版的IDS代換成簡體版的IDS(內中用簡體的部件),就可以達成。--魔法設計師留言) 2016年6月28日 (二) 14:32 (UTC)
恐怕未必所有部件能如此(再如SimSun条目内示例的「关」,凡此种种),建议考虑增加更多字体文件(字型檔)。—Chiefwei - ) 2016年6月28日 (二) 14:52 (UTC)
沒關係,這種狀況就可以用組的:,一個缺字如果裡面有這種部件,就可以有一個簡體版IDS,一個繁體版IDS。而更多的字體,將來一定是可以追加的,不過一樣的,我不是作者,所以還是要請你如同另外一位,到原作者的專案站,發issue,看看是不是加入文泉驛字型?(必須是自由文本授權的字型)--魔法設計師留言) 2016年6月28日 (二) 17:48 (UTC)

@Shoichi::感謝魔法設計師的專案,這對部分古代人名很有用,也在沙箱測試了一下,想問一下局火缺字.svg為何輸入<ids>⿸尸⿹𠃌火</ids>後顯示不了下面?謝謝--Tom...........留言) 2016年6月28日 (二) 15:54 (UTC)

這是因為包圍系列的實作,目前無法像左右上下組可以靠演算法全自動進行。現在是半自動,有些種類的包圍只能手動一個一個來加。遇到有狀況的,需要提報。提報的方法已經放在更新後的測試wiki主頁上,還請你移駕過去提報囉。--魔法設計師留言) 2016年6月28日 (二) 17:48 (UTC)
@Shoichi⿹𢦏異 是空白圖像....?! --宇帆(留言·) 2016年6月30日 (四) 17:15 (UTC)
我...不....是....作....者......請提報彙整給作者。--魔法設計師留言) 2016年7月1日 (五) 07:24 (UTC)
我昨天下午五點十分已經提交到表格去了可是 過... 了... 一... 日... 也... 沒... 修... 復...啊... 。。。。。。。。。。。。。。。。。。。。。。。。。。所以才發到這裡@Shoichi:--宇帆(留言·) 2016年7月1日 (五) 07:30 (UTC)
大家平時都要工作上班、上課,不見得時時都有空。想要今天回報,明天馬上就好,可能得高薪聘請作者來上班,專門維護這個引擎了,(敝人也是個窮忙魯蛇,有人要請我嗎? XD)。--魔法設計師留言) 2016年7月1日 (五) 12:38 (UTC)
@Shoichi:可以詢問大概多久才有網友將這個表格提報給作者sih4sing5hong5的專案網站去呢?已經一個月了,⿹𢦏異仍為一個空白圖像。-- 宇帆普通留言·Flow留言·) 2016年8月1日 (一) 03:06 (UTC)
請follow漢字組建專案的issues,還有目前維基測試server的更新狀況漢字組建是開源碼軟體,如果覺得進度不夠快,可以加入協作--魔法設計師留言) 2016年8月1日 (一) 05:28 (UTC)

動態組字測試wiki[编辑]

因為發在原來標題裡的,已經被埋掉了XD,應該不太好找。所以我另外發在這裡。就是除了上次的組字server以外,敝人也向基金會申請好這個測試wiki站了:

ids-testing.wmflabs.org,這個站有沙箱,當然也可以自己作新條目,歡迎大家來盡情測試。--魔法設計師留言) 2016年6月28日 (二) 13:41 (UTC)

做成mw插件的话,应该做成一套后台Web服务,mw获得指令(<id>包裹内容)后,通过在PHP调用WebServiceClient上传指令,获得图片,并且基于指令为键将图片在mw本地缓存,不要暴露后台服务。这样也能利用基金会的图片存储集群。参考mw:Extension:Math插件。——路过围观的Sakamotosan 2016年6月29日 (三) 03:34 (UTC)
太感謝了,extension我會往這個方向修改。--魔法設計師留言) 2016年6月29日 (三) 07:02 (UTC)
刚才我在那边发现一个问题,就是拼合⿱合一⿳人伊一二字的时候字形挨得太近;另外我觉得如果需要组合出⿰利爾⿰利尔这样的字的话,应该避免跟繁简转换工具发生冲突。-- 2016年8月5日 (五) 11:17 (UTC)
可能提報到這個表格或提報給作者sih4sing5hong5的專案網站比較會被看到吧,不然就開一個新的章節或ping,這個討論有些攏長。。。-- 宇帆普通留言·Flow留言·) 2016年8月14日 (日) 14:00 (UTC)

取得引入共識[编辑]

  • 總而言之,我們已經確定這個技術的可行與方便性,在這幾天討討論中除了詢問技術問題外無人反對,因此可以確定共識是可以引入,所以等你們完成到可以部屬就可以直接引入,有人有異議嗎?--宇帆(留言·) 2016年7月1日 (五) 07:38 (UTC)

这里面,在Parser extension tags裡面的

<ids>

就是,謝謝你的連結,我大概知道問題了,我會把extension 的php程式碼做更完備。--魔法設計師留言) 2016年7月2日 (六) 10:14 (UTC)

  • 這樣的話,會不會等到到時候該插件完成到可以供MediaWiki部屬了的時候還要再重新討論嗎???--宇帆(留言·) 2016年7月18日 (一) 05:32 (UTC)

是否能在中文維基這邊建立一個頁面介紹使用方式?(Help:XX 或是Wikipedia:YY)--Liaon98 我是廢物 2016年7月3日 (日) 13:23 (UTC)

請教各位管理員:@Liangent:、@Antigng:、@Jimmy Xu:、@Bluedeck:、@Shizhao:、@和平奮鬥救地球:對於可能會引入的技術但是目前還沒引入可以先撰寫其說明頁面(Help:XX 或是Wikipedia:YY)嗎?  如果可以的話就麻煩@Shoichi:您來撰寫了--宇帆(留言·) 2016年7月5日 (二) 10:06 (UTC)
沒看過有存在相關方針,不曉得可不可以。。。。。。。--宇帆(留言·) 2016年7月25日 (一) 02:00 (UTC)
可以的,比如WP:FLAGREV --达师 - 334 - 554 2016年8月6日 (六) 09:56 (UTC)
維基聚的討論結果是擱置。-- 宇帆普通留言·Flow留言·) 2016年8月24日 (三) 16:08 (UTC)

想多了解的,星期一晚上來線上聚吧[编辑]

魔法設計師在本頁面公布動態組字技術要引入維基平臺的消息,得到不少的回響。工作團隊在7/24 將要在台灣舉辦的一場 Hackathon 「萌典松」上繼續工作。為了方便作業進行,後天7/18(一)晚上7:00-8:00 (GMT+8) 之間,會有一場線上的會前會,會透過 Google Hangout 在線上討論工作需求,或者針對技術的疑問做回答。

想要參加的人請到報名頁留一下 Email (因為要有這個才能邀你進 Hangout),並且準時上線。--Reke留言) 2016年7月16日 (六) 12:21 (UTC)

建议全域化一些小工具、模板、帮助页面等内容[编辑]

我发现很多模板(例如Template:Delete)和小工具(例如MediaWiki:Gadget-hantsect.css)包括小工具的介绍文字需要用到几乎所有的wiki,因此需要搬运,但是这些内容更新很快,而且很多,不可能每一次到所有的wiki里去修改。同样,维基百科的一些帮助页面例如Help:魔术字Help:解析器函数完全可以全域到其他的维基中。这样就不需要去分别撰写了。所以,我建议将这些内容全域到所有wiki(包括其他语言的),显示的文字则可以利用{{int:}}等方法(这也有助于用户使用别的语言的wiki,虽然这不常见)。--SolidBlock讨论 2016年8月3日 (三) 09:25 (UTC)

是我没有解释清楚吗?我说的全域化是像wikia的帮助页面应用于所有的wiki、元维基的用户页应用于所有维基一样,内容都是自动保持同步。--SolidBlock留言因学习原因无法参加动员令 2016年8月11日 (四) 08:50 (UTC)
11天惨案?我觉得吧,因为每个地区的维护性模板内容并不一定相同,都有自己的本地化(例如en的SD代码和zh的是有差异),基金会和元维基只提供法律层面上的统一,这些反而不同可能统一下来。———以上未簽名的留言由Cwek對話貢獻)加入。2016年8月12日 (五) 02:25 (UTC)
我觉得{{navbox}}、{{LaTeX}}、MediaWiki:Gadget-hantsect.cssHelp:魔术字(除了少部分内容)等内容在每个地区或者大多数地区都一样。而且,全域化≠无法使用各自的地区呀。--SolidBlock留言因学习原因无法参加动员令 2016年8月12日 (五) 09:41 (UTC)
{{navbox}}和MediaWiki:Gadget-hantsect.css就有本地化的不同了,而且不能保证每个模板都会这样(至少排版方面有轻微差异)。一些功能帮助页的确可以考虑在mw中体现。——路过围观的Sakamotosan 2016年8月18日 (四) 00:50 (UTC)
@SolidBlock:如果您是想说全域模板、模块、小工具和各种搞基专用CSS/JS的话,我建议您看看phab:T121470。--Liuxinyu970226留言) 2016年8月27日 (六) 03:32 (UTC)

C & P:复制粘贴链接翻译工具[编辑]

每次翻译不同语言的维基百科,比如en->zh,都要手动点一遍en上的链接,寻找zh上对应的条目?又或者,只想翻译一小段内容,却要使用内容翻译Link Translator这种工具对全文中的链接进行翻译?

为了方便自己大家,我开发了一个利用复制粘贴进行链接翻译的小工具。只需要填入原文,点“Translate!”按钮,稍后提示“Done!”,就可以用“Cut to Clipboard”按钮剪切下来翻译好的文本了。可以用下边这段内容来试用:

[[Nottingham Castle]] is located in [[England]].

链接翻译后保留了原文中的条目名称,以便提供参考,同时保证参考文献仍以原文显示。另外有个隐藏的小功能,在Translate From中填yue(不是zh-yue),可以将粤语中的部分文字翻译成汉语,例如佢->他,冇->没有

欢迎给我留言反馈意见。

--哪位维基人能够一下打死五个? 2016年8月13日 (六) 06:14 (UTC)

时不时就HTTP 503我也是醉了。--Liuxinyu970226留言) 2016年8月14日 (日) 07:10 (UTC)
(:)回應:日志记录到了,但是无法复现--哪位维基人能够一下打死五个? 2016年8月15日 (一) 15:43 (UTC)
想到了User:Liangent/Gadgets/Toolkit/linktranslator.uncompressed.js。--Jimmy Xu 2016年8月14日 (日) 07:56 (UTC)
function replace2($translate, $content) //替换粤语
        {
                $find = array("哋","呢","係","佢","乜","嘅","嬲","系","咁","唔","睇","啲","冧","冇","惗","嘎","咩","嚟","叻","喱","咪","梗","喺","抦","啵","俾","嘈","噏
","掟","囖","揾","嗮","攞","咗","疴","拗","乸","撩","拎","啖","憇","呃","掂","唓","嘢","瞓");
                $replace = array("们","这","是","他","什么","的","生气","是","这样","不是","看","的","陶醉","没有","想","啊","什么","来","很棒","那","不要","当然","在","殴打","吧","给","吵","唠叨","扔","咯","找","浪费","拿","了","拉","矛盾","雌性","挑","拿","口","哄","骗","完结","呸","东西","睡");
                return str_replace($find, $replace, $content);
        }

真的可以这样吗?yue:荔枝#同佢有關嘅詩:“日啖荔枝三百顆,不辭長作嶺南人。” ->“日吃荔枝三百顆,不辭長作嶺南人。”???--Antigng留言) 2016年8月14日 (日) 07:54 (UTC)

其实是“日口荔枝三百顆,不辭長作嶺南人”--哪位维基人能够一下打死五个? 2016年8月15日 (一) 15:43 (UTC)
按了“Translate!”完全沒有反應。--Ai6z83xl3g留言) 2016年8月14日 (日) 07:57 (UTC)
已修复,浏览器兼容问题--哪位维基人能够一下打死五个? 2016年8月15日 (一) 15:43 (UTC)

翻譯草稿:閔致久的時候試用此工具,[[조선 철종|철종]]會變成[[朝鮮哲宗|조선 철종|철종]]--Robert Huang留言) 2016年8月20日 (六) 05:33 (UTC)

好东西,已收藏。 --Dqwyy討論C回復請ping 2016年8月27日 (六) 03:03 (UTC)

启用$wgAllowCopyUploads功能[编辑]

这将允许用户从Url上直接上传文件。此功能将方便:

  1. 从其他语言版本的维基百科搬运文件时的操作;
  2. 将文件缩小时的操作(只需点击文件下的“本预览的尺寸:……。 其他分辨率:……。”并从中选择一个合适的尺寸)。

我认为此功能应向全体自动确认用户开放。由于影响重大,特此提交请求,望社群采纳。-- Stang 300 2016年8月13日 (六) 13:13 (UTC)

本地查得严,应该问题不大…… --达师 - 334 - 554 2016年8月14日 (日) 11:21 (UTC)

仅限upload.wikimedia.org。--Antigng留言) 2016年8月15日 (一) 01:18 (UTC)
可以,$wgCopyUploadsDomains。——路过围观的Sakamotosan 2016年8月15日 (一) 03:15 (UTC)
可以考虑,是不是已经有3人支持了?
具体设置值:
//申请时不保留注释
$wgGroupPermissions['autoconfirmed']['upload_by_url'] = true; //用户权限开放
$wgAllowCopyUploads = true; //功能开关
$wgCopyUploadsFromSpecialUpload = true; //允许上传页使用URL上传
$wgCopyUploadsDomains = array( 'upload.wikimedia.org' ); //限定上传源域名

——路过围观的Sakamotosan 2016年8月15日 (一) 03:20 (UTC)

  • (+)支持啟用此功能及上述提案內容。--Bowleerin留言) 2016年8月15日 (一) 07:08 (UTC)
已报。-- Stang 298 2016年8月15日 (一) 13:54 (UTC)
什么时候起才两天就能达成共识的?--Jimmy Xu 2016年8月15日 (一) 14:01 (UTC)
抱歉可能头脑有些发热…… 擱置一周。-- Stang 298 2016年8月15日 (一) 14:31 (UTC)

+1--流星依旧留言) 2016年8月16日 (二) 03:40 (UTC)

  • 只限制在维基媒体计划里应该没问题,(+)支持。--Kuailong 2016年8月18日 (四) 18:50 (UTC)
似乎T142991#2556332里说无法实现?-- Stang 294 2016年8月19日 (五) 00:55 (UTC)
要不光整上前3行,最后一行暂时抹去,日后再谈?--Liuxinyu970226留言) 2016年8月19日 (五) 13:54 (UTC)
觉得可能不行吧……可以看到有用户认为这可能会被滥用。-- Stang 293 2016年8月20日 (六) 15:31 (UTC)
  • (+)支持:支持四行一起上线,不太赞成在第四行功能无法正常运作时开启 URL 上传。--南瓜留言 | 贡献) 2016年8月19日 (五) 15:16 (UTC)

Tech News: 2016-33[编辑]

2016年8月15日 (一) 19:37 (UTC)

  • 欧盟又要热闹了。 --达师 - 334 - 554 2016年8月16日 (二) 11:28 (UTC)
    放心,闹的再大也不如singular their那件事大。--Liuxinyu970226留言) 2016年8月17日 (三) 21:59 (UTC)
刚刚收到消息,“中文WebFont的支持,以解决生僻字的显示”被Nikerabbit拒绝了,原因可能是santhosh那句话。--Liuxinyu970226留言) 2016年8月19日 (五) 00:46 (UTC)

Star Trek[编辑]

  • 星际旅行,action=purge 後,「相關條目」、「外部連結」等以下文字,於zh-hk或zh-tw下,皆未正常「繁簡轉換」!!!Orz(請求修復)--111.250.28.46留言) 2016年8月18日 (四) 14:39 (UTC)
(~)補充 各種 browser / win7 環境下。--111.250.28.46留言) 2016年8月18日 (四) 14:55 (UTC)
已修复. Liangent留言 2016年8月18日 (四) 19:58 (UTC)

维基百科app 中文版的bug[编辑]

Wikipedia app for chinese.png

维基百科app 中文版里的新闻动态存在bug。很明显,app的设计是参照en:Portal:Current events开发的,而中文版的Portal:新聞動態和英文版的排列顺序正好相反,所以造成了app里中文版新闻动态一个月才更新一次的问题。

那么,现在应该如何修复这个问题呢?是提交bug,让app专门为中文版自动/手动调整顺序,还是Portal:新聞動態这边去手工/自动调整顺序来适应app?--百無一用是書生 () 2016年8月19日 (五) 12:54 (UTC)

额,大意了,看了一下英文版的app,新闻动态是en:Template:In the news的数据,不知为何中文版没有抓到Template:Itn的数据....另外,英文版app的探索维基百科里有显示特色条目,中文版却没有--百無一用是書生 () 2016年8月19日 (五) 13:11 (UTC)
不止中文,好多语言都没有特色条目- I am Davidzdh. 2016年8月21日 (日) 15:29 (UTC)

内链的繁简问题(续)[编辑]

所以我这里讲的这个“某种中文变体显示的条目上的内链点进去后,显示的不再是之前强制的那种中文变体”的问题需要提交issue么?另外,我用archive.org发现,2009-2011年时,两个简体版本有这个问题(即内链都是/wiki/),两个繁体版本没有这个问题(即内链都是理想的/zh-tw/或/zh-hk/),而现在都有这个问题:

@Cwek @Waihorace --Tomchen1989留言) 2016年8月19日 (五) 17:08 (UTC)

或许是phab:T134967?--Liuxinyu970226留言) 2016年8月20日 (六) 22:31 (UTC)
不是,和我说的不一样,我说的是普通网页版和手机网页版。这个讲的应该是iOS的app,其他语言列表的选项中只有笼统的一个“中文”,而没有各种中文变体(简繁地区)的选择。这个问题在普通网页版和手机网页版中不存在。(另外我试了下Android app,比他说的iOS的app要好些,在非中文条目下,列表中显示简体和繁体的选项(无区域),不过在中文条目下,无法从简体切换到繁体(反之亦然))--Tomchen1989留言) 2016年8月22日 (一) 19:14 (UTC)

中国大陆用户,请教诸位~[编辑]

各位,目前维基百科中文版在中国大陆全线封禁,那么目前访问应该通过代理破网。那么问题来了,
①匿名代理(比如自由门,无界浏览)已被管理员封禁,比如在我所在地方使用自由门等ip被jimmy_bot封禁,请问这样如何才能编辑维基百科?,

②好吧,不编辑咯。可是不能发表任何讨论,该如何申诉ip解禁?,

许多用户应该和我一样,那么就无法为中文维基百科做出贡献。该怎么办?

④学业为重,我只能偶尔编辑几次。可是自从维基百科被封禁后,所有代理又被封禁,请问我(偶尔编辑)能申请ip解封吗?
真的不想拿手机开电脑视图!!!Talkative Sun 2016年8月21日 (日) 09:01 (UTC)

1.改hosts,参见Help:如何访问维基百科,可以不用申请LIPE,2.需要使用NOP类的话,可以申请LIPE(本地IP封禁豁免)。发信到unblock-zh@lists.wikimedia.org,包括代开账户外加申请。——路过围观的[akamotosan 2016年8月21日 (日) 13:34 (UTC)
楼上说得已经很清楚了,我再说明一下吧,修改host文件无疑是最简单的,因为如果申请IP封禁例外的话,要等待审核(当然这个审核时间也不会很久,大概一天内就可以完成)。如果找不到host,可以找我要。我现在就是通过修改host文件的,同时我现在也是拥有IP封禁例外权。 --Dqwyy談笑風生微小工作 回復請ping 九十大壽+1s 2016年8月22日 (一) 11:57 (UTC)
也有很多免费VPN、SSH等可以翻墙。--Gqqnb留言) 2016年8月27日 (六) 01:06 (UTC)

來源請求模版手機版頁面依然顯示為黃色[编辑]

(之前投票說該模版底色要用灰色,在桌面瀏覽時也轉了,但zh.m.wikipedia.org剛看到還未轉)——C933103(留言) 2016年8月22日 (一) 18:27 (UTC)

可能是服务器缓存的问题。purge一下试试。--SolidBlock留言因学习原因无法参加动员令 2016年8月25日 (四) 11:14 (UTC)

Tech News: 2016-34[编辑]

2016年8月22日 (一) 21:17 (UTC)

覆盖重定向的问题终于解决了? --达师 - 334 - 554 2016年8月25日 (四) 01:56 (UTC)

除此之外,EasyTimeline问题究竟有木有解决,某些人吵吵着要字体他们那帮Ops们也装好了。--Liuxinyu970226留言) 2016年8月27日 (六) 03:26 (UTC)

不曉得出了什麼問題[自動評級東南亞條目]突然冒出來出現在移動請求的分類中,且頁面近900個[编辑]

連結在此,目前搞不清楚狀況,如果有知道問題出在哪邊的就麻煩處理一下。--健康欠安 (留言) 2016年8月23日 (二) 13:17 (UTC)

維基語錄的citation[编辑]

q:模块:Citation/CS1在更新後有些問題,Cite web的格式顯示跟維基百科的不一樣,例如date置於author後。cite news和cite journal變成了斜體。在那邊也有議題但貌似已沉...所以這裡再發一遍,希望幫助解決。另@Liuxinyu970226:--578985s留言) 2016年8月25日 (四) 14:05 (UTC)