維基百科討論:機械人/存檔

頁面內容不支援其他語言。
維基百科,自由的百科全書

機械人好像不合適,叫智能程序不錯--Dersonlwd 08:42 2004年1月7日 (UTC)

不是管理員也能投票麼?

不是管理員也能投票麼?LiDaobing 16:02 2004年9月16日 (UTC)

可以呀--百無一用是書生 (Talk) 16:09 2004年9月16日 (UTC)

Interlanguage specialities at eo:

最近見過機械人們 :-P

User:Robbot

User:Chobot User:Hashar User:Palica User:Yurik User:Zwobot

--Isnow 12:12 2005年7月25日 (UTC)

對啊,這些是那裏來的啊?有沒通過申請啊?還是說在其他維基申請過的也可以?--Ffaarr 01:13 2005年7月26日 (UTC)

這些是沒有註冊為機械人的,因為怕修改錯了,所以沒有註冊,這樣在最近更改中就有體現,方便核查。--zy26 was here. 01:26 2005年7月26日 (UTC)
主要是因為最近的interwiki bot 軟件支持多語言的修改。例如我在中文版運行bot,那麼通過跨語言連結我可以同時對其他語言版本的跨語言連結進行修正(當然必須在其他語言版本中有註冊賬號,不能匿名編輯),因此造成bot成堆的局面--百無一用是書生 () 01:51 2005年7月26日 (UTC)

又見到一個:User:CyeZBot。--Isnow 18:15 2005年7月26日 (UTC)

I'm asking for permission to use KocjoBot (Python Wikipedia bot) on this WP. Primary mission will be updating interwiki links of all WP. So far the bot was and is running on :sl, :en:, :bs, :hr and :sr. If there is no objections to it, I will request a bot-flag on meta and started to run it here (it's contribs on: :bs, :en, :hr, :sl, :sr). Regards, --Klemen Kocjancic 00:26, 25. 11. 2005 (UTC)

已經授權--百無一用是書生 () 02:15 2005年12月7日 (UTC)

Support

  1. - Moses01:44 2005年11月29日 (UTC)
  2. --ffaarr (talk) 08:57 2005年11月29日 (UTC)

en: I am asking permission to run an interwiki bot under the account User:Chlewbot. I have already tested under my own account on controlled conditions. I plan to run the bot only on pages originated in Spanish language Wikipedia. I am also asking for bot status on meta. — Chlewey 14:59 2005年11月30日 (UTC)

Support

  1. It seems OK. Moses 08:00 2005年12月5日 (UTC)
已經授權--百無一用是書生 () 02:46 2005年12月9日 (UTC)


For my project INTERWIKI-LINK-CHECKER i use FlaBot to set interwikis. Come and take part of my Link-Checker .. you will get new Interwiki. If somebody wants to transfer the Interface of my programm pse mail me. Greetings de:Benutzer:Flacus owner of User:FlaBot

I requested a botflag for my robot RoboDick to do multilogon interwiki. nl:User:Dutchy-Dick 13:50 2006年1月21日 (UTC)

Request at meta will wait for local ZH approval. Jcb 14:21 2006年1月21日 (UTC)
Support - Moses
Support, I know it's well configured. Jcb 12:02 2006年1月29日 (UTC)
Support, other pywikipedia bots has ran here without problem. --Vina 02:57 2006年1月30日 (UTC)

Botflag has been granted by a steward. Jcb 01:38 2006年2月2日 (UTC)

機械人問題

from Wikipedia:互助客棧/技術

請問在大陸操作機械人怎樣設置代理伺服器,我在瀏覽器中設置145.97.39.140為代理,能夠瀏覽。但是使用pywikipedia登錄不上。錯誤如下:

C:\pywikipedia>login.py
Checked for running processes. 1 processes currently running, including the curr
ent process.
Password for user Vipbot on wikisource:zh:
Logging in to wikisource:zh as Vipbot
Traceback (most recent call last):
  File "C:\pywikipedia\login.py", line 218, in ?
    main()
  File "C:\pywikipedia\login.py", line 214, in main
    loginMan.login()
  File "C:\pywikipedia\login.py", line 167, in login
    cookiedata = self.getCookie()
  File "C:\pywikipedia\login.py", line 119, in getCookie
    conn.request("POST", pagename, data, headers)
  File "C:\Python24\lib\httplib.py", line 804, in request
    self._send_request(method, url, body, headers)
  File "C:\Python24\lib\httplib.py", line 827, in _send_request
    self.endheaders()
  File "C:\Python24\lib\httplib.py", line 798, in endheaders
    self._send_output()
  File "C:\Python24\lib\httplib.py", line 679, in _send_output
    self.send(msg)
  File "C:\Python24\lib\httplib.py", line 646, in send
    self.connect()
  File "C:\Python24\lib\httplib.py", line 630, in connect
    raise socket.error, msg
socket.error: (10060, 'Operation timed out')

請各位幫忙找找原因。謝謝--維游 《@_@》 15:30 2006年5月10日 (UTC)

這可能是因為interwiki bot不支持代理可以參考Pywikipedia bot on non-Wikimedia projects進行設置。但是我不知道在python上,對https協議如何處理?我試了幾次,都因為https的緣故,不能連接--百無一用是書生 () 15:39 2006年5月10日 (UTC)

那你的bot現在也不能登錄嗎?--維游 《@_@》 15:49 2006年5月10日 (UTC)
是呀。--百無一用是書生 () 16:07 2006年5月10日 (UTC)
那應該向開發技術人員申請開通bot可通過使用維基媒體基金會的代理,用https即使能實現也恐怕會太慢--維游 《@_@》 16:28 2006年5月10日 (UTC)
我可以去問一下bot開發人,有沒有一種技術可以支持代理。我在美國,有什麼需要運行的機械人我可以來。--Vina 19:24 2006年5月20日 (UTC)

如何通過https進行bot操作

如何通過維基百科的https連結進行bot操作?例如使用python編程的interwiki bot,如何能夠實現這個功能?python可有什麼庫可以調用?--百無一用是書生 () 15:35 2006年5月10日 (UTC)

請教幾個機械人問題

  1. 元維基上面說,若該語言的維基計劃已有bureaucrats,則不需要再到元維基上申請為bot,那是否要在中文維基百科執行機械人的話,獲得投票通過後直接找User:Shizhao申請嗎?
  2. 除了用python寫的pywikipediabot以外,還有別的bot程式嗎?

--Ellery 17:49 2006年5月31日 (UTC)

是的,Shizhao 可以加bot。別的bot也有,但是您需要自己寫。可以用pywikipediabot為基礎加別的,我在英文維基上也看到有用Perl寫的。--Vina 08:06 2006年6月1日 (UTC)
我的機械人User:STcatBot就是用Perl寫的。-下一次登錄 06:40 2006年11月24日 (UTC)

機械人用戶框

我做了一個用戶框用以說明這用戶是個機械人:Template:User robot 請問你們有興趣或意願將這個用戶框用於機械人嗎?=_="--KOS-MOS 17:21 2006年8月10日 (UTC)

中文維基至今為止還沒有能"新增條目"的機械人啊?

先讓我聲明,我支持中文維基要擴大規模的宗旨是「質、量並重」(否則又有一堆人要來說『提高現有條目水準才重要』)。言歸正傳,中文雖然號稱是世界上最多人使用的語言,但是中文維基條目新增的速度--每天一兩百個--實在有待增加,雖然中共封鎖維基和其他種種因素都是造成此現象的原因,但要增加條目數量也是要靠現有維基人的努力。像是英文維基中有幾個機械人能夠將某些現有資料庫以「小條目」的方式自動新增大量的條目(像是大量新增印度城市的小條目等),我們中文維基到目前為止似乎沒有能自動新增條目的機械人,大家有什麼點子是能找到一些現有資料,以機械人大量新增後再讓有興趣的人去改寫提昇水準,這應該也是個不錯的方法。--嘉禾 06:03 2006年10月22日 (UTC)


對阿!支持支持!Wikipedia的宗旨是要包攬全人類的所有知識!要是不增加更多條目的話,怎麽會有人去修改這些條目呢?我極力推薦大家製作可以增加條目的機械人,但是最可惜的就是我自己不會製作機械人!有人可以教我嗎?鋼琴小子 2007年9月14日 (五) 10:47 (UTC)

有沒有那種根據百科中存在的條目自動在內容添加連結的機械人?

現在這裏還有沒有人討論啊?

--66.230.200.227 10:53 2006年10月25日 (UTC)

關於機械人的問題

移自wikipedia:詢問處

剛剛翻譯出一個新條目,我知道有在不同語言相關條目之間建立連結(即左邊菜單下部『其他語言』部分)的機械人,但是如果不想等二到三個晝夜,要馬上啟動機械人在比較短時間內作出那些跨語言連結行嗎? Coolant 2007年5月7日 (一) 07:07 (UTC)


Sandbot機械人

建議參考en:user:Sandboten:Wikipedia:Sandbox製造一個Sandbot機械人,可以在一段特定時間自動reset沙盒,亦可以人手reset沙盒--L!tt|eTung?\2oO7=] 2007年5月13日 (日) 10:36 (UTC)

bot請求

現在沙盒機械人和歡迎機械人都有現成的程序可以使用:

  • 歡迎機械人原始碼:[1]
  • 沙盒機械人原始碼:[2]

但是可能在中文版上使用需要稍微修正一下程序。

如果有人感興趣,可以申請機械人賬號運行:wikipedia:機械人--百無一用是書生 () 2007年6月25日 (一) 16:48 (UTC)

都是python的,我這裏感興趣,但目前沒時間。過一個月後的說。— fdcn  talk  2007年6月26日08:51 (UTC+8 6月26日16:51)

工具伺服機(toolserver)

長遠提議:德國維基媒體協會有其 Toolserver [3] , m:toolserver,很多常用的 interwiki機械人及工具(如大家常用之編輯計算工具)都在其中運行。中文維基社羣的相應協會(如中華民國、香港、星加波。。。)有無打算(將來)設立工具伺服器,以利中文維基社羣發展機械人及其他重要工具?* : -) ---Hillgentleman | | 二零零七年七月二十二號(星期日)格林尼治 10時42分33秒。

大致來講,Toolserver會定期從維基媒體的主資料庫中取得一份資料庫(而這就是導致editcount等數據會有延遲時間的原因),然後利用這份備份來進行各種數據的分析。但在維基server日漸壯大的情況下(ex:enwiki),要養這樣的設備需要龐大的預算吧 Orz。--笨笨的小B | 20巷 2007年7月22日 (日) 12:31 (UTC)
德國維基媒體協會的Toolserver,硬件是由昇陽(Sun Microsystem)捐助的。若懂Mediawiki相關的程式設計,可自行在該處申請帳號來放程式。—Ellery 2007年8月7日 (二) 14:00 (UTC)

執錯字機械人

from Wikipedia:互助客棧/技術 Template:RFC error

我想問問:我見在英語維基經常都人執錯字的機械人在活動。在中文維基能否作出類似的東東?經常在這裏看到很多因為打錯字或手寫版而引起的問題。若經常要人手處理的話,又未必經常有空。常見錯字如下:

  • 玆 --> 茲
  • 彊土 --> 疆土
  • 曰 --> 日 (例如:若「曰」字之前是數字,又或是在超連結內,可以假設是日期)
  • 己 --> 已 (例如:己經 --> 已經)

--石添小草 (talk to me) 2007年7月25日 (三) 07:28 (UTC)

可能算法上不好寫,英文可以改錯字是因為單詞之間都有空格,而中文行文之間沒有空格,不好判斷這個字是屬於前一個詞還是後一個詞的。可能得要有某些突破才可以。—Ksyrie(Talkie talkie) 2007年7月25日 (三) 07:43 (UTC)
但若是「疆土」、「已經」的話,基本上只要可以配詞就可以替代,不用處理空格。--石添小草 (talk to me) 2007年7月25日 (三) 09:12 (UTC)
實行上有很大的危險,必須謹慎評估。參考方案︰先利用可靠工具(如Google)找出要修改的詞(如「己經」),注意其前後文是否有錯改的危險(可由多人檢查),檢查完畢後若確認可行,則一次性修改完畢(可縮小執行範圍減輕工作),機械人停止工作,進入下一次的循環。盡量不要讓機械人自動修改,改錯了很麻煩。改錯例︰「……XX一己經XX方式……」「一曰︰XXXXX,二曰︰XXXXX」除此之外,還要注意繁簡之間可能帶來的問題--Hiaeoupyc 2007年7月26日 (四) 00:55 (UTC)
其實這正是我現時的做法。不過,做多了就會覺得很累,因為現時太多學生參與,所以寫錯字的頻率很高。一直由人來做的話會很累。--石添小草 (talk to me) 2007年7月26日 (四) 03:45 (UTC)
中文字的組合性太強了,任何組合都有可能出現,我以前偷懶,想要用工具快速修正一堆文字檔案的誤字,後來發現非常容易改錯,就不這樣做了。看看現在的簡繁轉換,不也有同樣的問題--經常轉錯。說到這,罷了,罷了。--Hiaeoupyc 2007年7月26日 (四) 23:39 (UTC)
疆土不太可行把,比如一個句子中有邊疆土地疆土到底是屬於那個詞是個問題,而且添字後意思又會變化,那邊疆土地廣人稀,究竟怎麼判斷?—Ksyrie(Talkie talkie) 2007年7月26日 (四) 01:01 (UTC)
這對我來說完全不要緊,我只是不想再看到有「邊彊」、「彊土」就足夠了。只要集齊全套有「疆」字的詞語,再把這些詞語裏的「疆」打錯成「彊」的情況換置就可以。--石添小草 (talk to me) 2007年7月26日 (四) 03:45 (UTC)
還是留給維基人來處理吧,中文很複雜,這方面不適合給機械人做。--一葉知秋切磋 2007年7月26日 (四) 10:00 (UTC)
『只要集齊全套有「疆」字的詞語』←關於這點……「邊疆」、「苗疆」、「新疆」、「疆場」、「疆界」、「疆域」……夠不夠?—Xtctjames 2007年8月26日 (日) 16:33 (UTC)
舉個例子把,如果有人有這樣的句子 那邊彊敵之類的詞語,你用這個機械人改為那邊疆敵,豈不在製造錯誤。—Ksyrie(Talkie talkie) 2007年7月26日 (四) 14:17 (UTC)
剛剛想到一個好辦法,把條目的全部內容貼到Microsoft Word裏面,然後讓它來糾錯,如果有明顯的錯字,它會用紅色的下劃線來提示。—長夜無風(風語者) 2007年7月26日 (四) 16:59 (UTC)
那也要中文版的Word才可以。我現在用的Word不是中文版,經常把標點自動改掉,每次拷過來要預覽好幾遍才放心。我覺得維基人還是看到了順手改掉比較好。中文實在是浩大精深,機械人的算法沒有那麼智能的。—木木 2007年7月26日 (四) 21:09 (UTC)

本百科經常亂碼 請看新會區,此條目經常亂碼. —臏臏 2007年7月28日 (六) 12:05 (UTC)

還有很多錯別字,比如說:根據/跟據、藉/籍、仕/士、飢/饑、號召/號招、佔/占、辨/辦、份/分,我一直在努力中,但這些錯別字條目數量之多,實在嚇人,憑我一人之力,實在修正不了那麼多:(
即使不能用機械人,也得想想別的辦法,因為這情況實在很影響維基的質素—Xtctjames 2007年7月28日 (六) 17:06 (UTC)
用Microsoft Word來改錯,當把文字再轉貼回編輯頁面時,人名間隔號會自動由「·」轉成「‧」的,這會令內連結失效,也令參考資料消失,造成莫大困擾。
我就是曾經長時間犯了這個錯,所以我知道:P—Xtctjames 2007年7月28日 (六) 17:22 (UTC)
不如趙SIR發起一隊執錯別字小組,由趙SIR指揮,有計劃地按需要和人力資源(願意參與小組工作的人手),大家分工合作,監察和清理堆積如山的錯字條目吧,大家以為如何?—Xtctjames 2007年7月29日 (日) 06:59 (UTC)
其實我一直在做這方面的修改,我已經改過的有:毫/亳、侯/候、迴/迥、刺/剌、侯/候、疆/彊、蜥蝪/蜥蜴、訴/訢,現在,這幾個字的混用情況少了些了,如果大家發現還有的話,請參與我的工作,一起修正—Xtctjames 2007年7月29日 (日) 11:01 (UTC)
匯報:截至這個發言這一刻,我已經把所有「跟據」改為「根據」(花了幾天時間^^"),大家一起來見證一下,看看多少天之後,中文維基又再出現「跟據」充斥的情況。這可作為人力監察和修正的成效的一個量度—Xtctjames 2007年7月30日 (一) 07:58 (UTC)
坐言不如起行,我現在開始修改「跟本/根本」的混用,然且這只是「跟」和「根」混用的例子的其中一個而已,做了這麼久,修正了的只是冰山一角而已—Xtctjames 2007年7月30日 (一) 08:30 (UTC)
匯報:截至這個發言這一刻,我已經把所有「決擇」改為「抉擇」,把所有「蜥蝪」改為「蜥蜴」。—Xtctjames 2007年7月31日 (二) 09:29 (UTC)
用OpenOffice如何?也許沒有這問題- Shack  Talk  2007年8月16日 (四) 04:39 (UTC)
我沒有Open Office,沒試過:P—Xtctjames 2007年8月17日 (五) 15:17 (UTC)
將內容複製到OpenOffice,存檔後再打開貼回原條目,比對功能顯示結果無異。測試條目為胡安·塞巴斯蒂安·貝隆。--RalfX2007年8月26日 (日) 22:20 (UTC)

在正常的行文中,不會把強字強行寫成彊字。我想除了古文外,凡用彊字的多數是使用者打錯字。--Hello World! 2007年8月1日 (三) 17:03 (UTC)

匯報:我已經把部分「疆」和「彊」混用的情況清除,計有「彊土」、「彊界」、「彊域」、「彊場」、「苗彊」、「新彊」裏的「彊」都改回為「疆」了,還有哪些混用的用例,請提點小弟,在還沒有改錯字機械人(和改錯字同袍)前,我會繼續當人肉機械人,試圖愚公移山^^"Xtctjames
回上,占是佔的簡化字,會否改錯改過龍?--Hello World! 2007年8月2日 (四) 16:52 (UTC)
對,「佔」的簡化形式是「占」。
因此,在顯示方面,「佔」在簡體版會顯示成「占」。
但「占」在繁體版好像不會顯示成「佔」。
在繁體字裏,「占」和「佔」各有分工,在某些方言裏,「占」跟佔更不同音,因此在某些方言區裏,人們絕對不會把兩字搞混來唸。
因此,我主張把「占領」改成「佔領」,因為這對簡體字使用者不會造成影響,但對繁體字使用者來說,就糾正了一個字誤。
不過,我也明白這有爭議性,因此,我還沒開始動手大舉改動「占」和「佔」的混用情況。
再說,只得我一個人,「大舉」得來麼?:)
所以需要多些人集思廣益囉:)
我試過把「決擇」改成「抉擇」,都有人不高興,把我的改動徹回(更不用說「大相逕庭」和「大相徑庭」了)^^",因此,現在,我只敢改動一些「低爭議性」的字誤(不敢說「沒爭議性」^^"),譬如說「書藉→書籍」、「蜥蝪→蜥蜴」等。
我沒主動找「份」和「分」的字誤來改,因為,似乎已經有朋友在專職從事這個分工了,是吧?
還是那句,有哪位有興趣加入「愚公移山」的行例嗎?^_^—Xtctjames 2007年8月3日 (五) 11:32 (UTC)
剛才找到了一個「跟據」。(笑)—木木 2007年8月9日 (四) 20:54 (UTC)
七月三十日清理完畢,八月九日已找到「跟據」了,說明了清道夫的工作是要每天做的:P—Xtctjames 2007年8月10日 (五) 07:32 (UTC)

執錯字人肉機械人隊伍

經常在這裏看到很多因為打錯字或手寫版而引起的問題。若經常要人手處理的話,又未必經常有空

做多了就會覺得很累,因為現時太多學生參與,所以寫錯字的頻率很高。一直由人來做的話會很累

趙Sir正在做的事,其實我也一直在做^_^

不如這樣吧,就由趙Sir發起組織一支改錯隊伍,招募成員,商討並選擇哪些常出現字誤的詞彙,分派給隊伍成員定時監察及修正,字誤不太多的詞彙可以一個人修正及定時監察,甚至一個人監察幾個詞彙,字誤太多的詞彙則可以由幾個人一起修正及定時監察,這樣既不會累壞某幾個個別改錯手,又可以讓維基條目的字誤得到有策略、有系統的維護,趙Sir以為如何?—Xtctjames 2007年8月16日 (四) 14:13 (UTC)

不知閣下們有沒有使用過AWB呢,這工具倒是很有用的。--Shinjiman 2007年8月16日 (四) 16:04 (UTC)
沒有喔,其實我來這裏沒多久,很多維基的規條和功能都不懂,望前輩指教^_^
其實小弟有某類的學障,有某類資料小弟是沒能力閱讀的…… -_-
不過,不怕見笑,小弟有個構想,如果有足夠的志同道合的朋友,有一個小組的工作頁面,我們可以商討出要定時監察和即時維護的錯別字或詞的清單,並共商工作指引、守則,然後開始分配工作。
第一類工作是按清單分配人手即時修正需維護的有字誤條目,清單上需要人手負責的字詞,由組員自願「認頭」負責修正,如果字誤條目特多的字或詞,則由數人共同修正該個字或詞。已完全清除的字誤則撥入監察清單
第二類工作是分配人手負責定期巡視監察清單上的詞條有沒有復現(有些常見字誤,即使已完全清除了,也復現得很快),工作分配也是用一詞一人的方法。
不過,即使沒朋友響應,小弟還是會獨力繼續「愚公移山」下去的:)
期待着良性互動……^^"—Xtctjames 2007年8月17日 (五) 10:31 (UTC)
按趙Sir最初的建議,我試着到Wikipedia:機械人/提議提出初步建議了
如果大家當真覺得這是一件好事,過去Wikipedia:機械人/提議聲援一下或發表改善建議吧—Xtctjames 2007年8月18日 (六) 13:48 (UTC)

剛想到還有一個詞語:「熟悉」和「熟識」。有沒有「熟識」這個詞語?--Hello World! 2007年8月22日 (三) 16:31 (UTC)

有,[4]。--RalfX2007年8月22日 (三) 16:39 (UTC)
我還以為這項目已經沒人看的了,原來還是有的,真好^_^—Xtctjames 2007年8月22日 (三) 17:03 (UTC)

不如先弄一個wikipedia:常見別字列表吧。Stewart~惡龍 2007年8月25日 (六) 17:30 (UTC)

Wikipedia:機械人/提議←我在這裏提出的,差不多等如是常見別字列表了,因為裏面的內容都是我在條目中大量發現過有出錯的(大都已整修過了)—Xtctjames 2007年8月26日 (日) 13:37 (UTC)
先別提編輯百科全書那麼大條,我們平時寫東西給人家看,「不要寫錯字」即使不是第一個要求、首要要求,也是起碼要求之一了,但更多時候,「不要寫錯字」卻成了最後都沒達到的要求…… -_- —Xtctjames 2007年8月26日 (日) 16:33 (UTC)
我被Xtctjames執了兩次錯字,真丟臉。另外,Xtctjames君,感謝你的幫忙,謝謝。--すぐる@武蔵×桂言葉 2007年8月26日 (日) 16:38 (UTC)
幸勿見怪^^"—Xtctjames 2007年8月31日 (五) 10:28 (UTC)
再有一個:粵語使用者常把小字當作少字來用-Hello World! 2007年8月26日 (日) 19:19 (UTC)
有趣的是,甲骨文小少也常互換,意形尚未明確分化。HenryLi (留言) 2008年1月12日 (六) 16:09 (UTC)

機械人緊急停止按鈕

是不是已登入的維基用戶才能按?若否,很可能會有惡意按停機械人的匿名用戶。若能把程式修改至已登入的維基用戶才能按按鈕,那用不用規定凡已註冊之機械人也必須要在用戶頁加上此按鈕呢?此外,也建議按按鈕後,連結至另一頁面,需要用戶再次確定要按按鈕,以防有用戶因手誤而按停機械人。機械人緊急停止按鈕例子:DragonBotWelcomebotAngelalive (留言) 2008年3月20日 (四) 07:55 (UTC)

只有管理員才能使用。其實這就是封禁用戶功能--百無一用是書生 () 2008年3月26日 (三) 15:23 (UTC)

錯別字修正機械人

目前由本人操作的機械人P-bot可以提供錯別字修正的功能,如果您發現了需要進行大規模修復的錯別字,請前往User:P-bot/錯別字修正表提交。—菲菇維基食用菌協會 2008年6月8日 (日) 12:23 (UTC)

不太懂怎樣提交…你可否親自加一個上去(e.g.「改篇」→「改編」),我看看歷史差別就會明白了。YunHuBuXi 2008年6月9日 (一) 08:20 (UTC)
現在已經跑了一陣子了,其實如果看不懂正則表達式或者不懂得該怎麼寫的話,直接寫在上面或者放在我的討論頁都可以(機械人並不是直接從User:P-bot/錯別字修正表上獲取需要修正的錯字的,那上面只是方便透明與提交),只要能讓我看懂我就可以改成需要的表達式。—菲菇維基食用菌協會 2008年6月11日 (三) 09:37 (UTC)

幾個和字詞轉換相關的機械人程序

最近P-bot開始運行了幾個新的機械人程序,基本上都與字詞轉換有關:其一為Fdcn兄幫忙出了大力氣完善的字詞轉換代碼標準化(幾乎完全重寫了我先前的純正則代碼),因為Fdcn兄的幫忙,這個程序在轉換代碼的標準化(主要就是實現重新排序,以便於以後通過機械人對轉換代碼進行進一步的整理(比如說把zh-hans中誤填寫的繁體內容轉換為簡體,或者補填必填但未填的部分))方面已漸趨完善,前幾日試跑的時候總會有那麼幾個條目要犯下錯(比如多加幾個分號),有一些我沒發現的錯誤編輯也麻煩了好幾位維基人到我討論頁提醒,不過現在應該已不會了。另外,轉換代碼標準化程序中還帶有針對NoteTA的功能,可以直接把分散在文中的-{}-與-{A|}-(均帶有至少一個轉換標籤,如zh-hans)整理到NoteTA中——但目前這個還在測試當中,也犯了一些錯……不過基本上都被我馬上抓着回退了>.<,因為-{}-中裝的東西太複雜,相信即使是以後要跑NoteTA的功能,也只有半自動操作,隨時人工盯着機械人;或者是自動模式下只把-{A|}-抓到NoteTA中。

此外,還有一個可以進行自動簡繁重定向的機械人,使用了這裏Xie Yanbo編寫的python繁簡轉換程序,而這個程序的繁簡映射表還來自於MediaWiki。因為簡繁重定向相對比較簡單,因此程序寫好後(話說還是俺第一次寫python程序)便測試了十多個頁面,確定沒有問題後現在已處於自動運行狀態。

最後,錯別字修正經幾名維基人提醒發現還有不足之處,而且打算用fixes.py來兼容所有的UTF-8字符,現在已暫時停跑,不過依然歡迎提交錯別字報告。—菲菇維基食用菌協會 2008年6月14日 (六) 21:15 (UTC)

可向現有機械人申請工作指令嗎

現存很多條目在引用百度百科香港網絡大典作外部連結時,規格很不一致。對此,我參考了Template:Imdb name的做法,製作了Template:BaidubaikeTemplate:Evchk以作外部資源之用,效果如下:

輸入:

{{Baidubaike|id=71120|name=電子地圖}}

將會顯示:





另外,輸入:

{{Evchk|id=陳冠希}}

則會顯示:

Template:Evchk

已把部份現存條目換上了此兩個模版,但只佔所有條目中的冰山一角。現存不合規格的條目太多了(特別是百度百科的外部連結),逐條人手更換累人不已。有現有機械人是做類似工作的嗎?可向該機械人的創建者申請,增加此兩項工作指令嗎?銀狐 (留言) 2008年6月26日 (四) 05:06 (UTC)

很顯然您的這個請求應該會被駁回,事實上,針對您所創見的這些外連結模板是否適合放在維基百科上,在此處正發起討論中,也歡迎您前往參與。迄今為止參與討論的用戶,大都抱持禁止增添此模板的意見。—泅水大象 訐譙☎ 2008年6月26日 (四) 14:36 (UTC)
從技術上,我可以說pywikipedia本身的某個工具可以不經修改便能完成上述操作,然而我個人對將百度百科以及香港網絡大典的連結加入維基百科持保留態度。如果方針那邊的討論共識最後決定可以這麼做,我可以幫忙運行一下機械人,但我說的前提必須滿足。—菲菇維基食用菌協會 2008年6月26日 (四) 16:24 (UTC)

P-bot機械人竄改條目用字

  • 看過維基上的資料,P-bot機械人似乎應是執行一些編輯任務的,但在我的條目中發現P-bot機械人竄改我的用字,而且有違維基的原則。在童話槍手小紅帽登場人物中,P-bot進行的「機械人:字詞轉換代碼NoteTA化」裏,有以下問題:
1.最先撰寫人以繁體字來撰寫,以繁體為準,並用TA模版支援簡體轉換。但P-bot機械人改行把轉換表,全都改為以簡體行先、以簡體為準,違反尊重用戶原來繁簡字的做法。
2.條目內文的譯名中,使用繁體中文的譯名為準,其他地區譯名以TA模版的列表支援轉換。當中有些在條目中不常提及,只出現一兩次的名字,則不列入模版,直接在相關地方用TA轉換。P-bot機械人改為把這些地方都列入開頭的列表中,但在對應內文時,就修改為用簡體地區譯名為準。這做法違反譯名先到先得原則,我看過有許多其他維基人否決他人的譯名,就是聲稱先到先得的。
綜合來說,看到這個修改(類似的情況,看過有人以破壞來描述),本來我想馬上還原。但由於P-bot機械人是執行編輯任務,害怕會得罪人或者反被指我是破壞,因此先行詢問:我可否還原,取消它的修訂(破壞)。然而,如果真的不允許取消其修訂(破壞),我會覺得維基是個雙重標準,令人不悅的地方,本來維基給人表面上的印象是開明的,但若親身參與過後發現原來是假象,我亦似乎沒有什麼理由,繼續支持一個假象的地方。--TVBdata1 (留言) 2008年6月21日 (六) 17:20 (UTC)
我覺得太過斤斤計較了,轉換沒錯就好了,noteTA列表中zh-hans排前面還是zh-hant排前面沒關係吧。至於內文用字的話,你要改回你原本優先使用的繁體也可以,對轉換結果也沒影響。--百楽兎 2008年6月22日 (日) 00:12 (UTC)
原則上這個情況我支持您這樣做,否則真的會有壞規矩的風險。不過都希望閣下不要追究些什麼,始終這個是機械人。—街燈電箱150號 開箱維修(搶修) 抄錶 檢驗證明 2008年6月22日 (日) 03:53 (UTC)
最近有維基人使用我的條目一詞。我的看法是不應該有誰的條目。否則如果有人離開維基,那他的條目又變成誰的條目了。當然,如果你覺得轉換不當可以和機械人的主人聯繫。—不想放棄 (留言) 2008年6月22日 (日) 06:22 (UTC)

對轉換variant進行排序僅僅是為了讓算法能判斷有沒有重複的轉換項,因為合併noteTA會產生重複轉換項。我個人覺得:

  • 這首先不要指責是想傷害你的先得權利,算法並沒有去想這些事,如果你願意,以後完全可以考慮把hant排在前面,但算法上想統一一下這個順序。在noteTA中或T轉換A轉換中的詞彙順序其實是很不重要的,如果沒有很乾擾你的感情,不妨認可機械人的排序吧。
  • 其次只有一兩個TA轉換也最好改成noteTA,因為可以提供給讀者更多信息;
  • 合併-{}-到noteTA時,留在原地的詞你認為應當留哪一個好呢?是書寫的第一個還是某種順序排下來的第一個?機械人沒有去想誰更合適,僅是依照一個順序選了第一個有效的。這一點上,如果認為機械人沒有尊重你的意願,完成可以把留下的這個詞恢復成你希望的地區字彙,機械人不太好判斷哪一地區詞是作者的心儀,還是關心它的人來做吧。我想,恢復機械人的選擇,大家也不會認為你的恢復是破壞,但請保留機械人的主要工作。

 fdcn  talk   — 2008年6月22日 (日) 16:56 (UTC+8) — 2008年6月22日 (日) 08:56 (UTC)

而且我也發現現時P-bot將NoteTA的問題簡單化,忽略了一些特殊例子。有些條目的引言是「 -{zh:繁體名稱;zh-hant:繁體名稱;zh-hans简体名稱}-,又稱-{zh:簡體名稱;zh-hant:簡體名稱;zh-hans:繁体名稱}-,是......」,在繁體環境下先顯示繁體名稱,再顯示簡體名稱(簡體環境則相反)。P-bot卻將這些轉換統一在NoteTA,令這些條目的引言出錯。例如光害條目中,出現「光害,又名為光害」(繁體)或「光污染,又名為光污染」(簡體)的滑稽句子(原文在繁體環境下理應顯示為「光害,又名為光污染」,簡體則相反)。 -- Kevinhksouth (Talk) 2008年6月22日 (日) 11:05 (UTC)

我注意到菲菇並沒有操作P-bot去替換非A轉換到noteTA。關於光害出錯,是因為把特殊說明之後的A轉換提前到最頂處的noteTA時造成,A轉換之前並沒有用-{zh:繁體名稱;zh-hant:繁體名稱;zh-hans简体名稱}-(如果用了反而不會出錯了)。這個應當人來修正,也建議手動轉換有A標籤時,這些特殊說明用-{}-來避免轉換。— fdcn  talk   — 2008年6月22日 (日) 20:48 (UTC+8) — 2008年6月22日 (日) 12:48 (UTC)
最開始原文無論在簡繁體情況下均為「光害,又名為光污染」(參見此處)。—菲菇維基食用菌協會 2008年6月23日 (一) 10:53 (UTC)
謝謝大家的回應,我現在才知道機械人是程式來的,這點之前不知道。另外我也沒有我的條目這種概念,我知道維基是大家都可以撰寫和編輯的。只是就在個人看到的一些條目,就看到不少把別人撰寫的譯名打回頭,指責別人破壞了或者不尊重他先到先得譯名的做法之例子,這些例子又包括了維基編輯。現在看到P-bot這樣做,所以就覺得標準莫衷一是。以我這還算新的人來看,無所適從。--TVBdata1 (留言) 2008年6月22日 (日) 16:51 (UTC)
起初通過機械人對轉換代碼進行重新排序的目的,不僅是為了通過整理除去重複的項目(如有兩個zh-hans),而且還是進一步編寫更多的字詞轉換自動程序的前提。比如說,現有的zh-conversion-to-noteta機械人可以在noteTA中合併轉換內容完全相同的轉換代碼,例如把"zh-hant:xxx;zh-hans:yyy"與"zh-hans:yyy;zh-hant:xxx"合併為同一個,但是這必須要建立在兩段字符串完全相同的情況下,因此這就需要對兩段字符串中的轉換代碼先進行排序,然後再進行比較。以上便是一個需要排序的應用。以後還會有更多的字詞轉換處理程序出現,肯定還會有用到這種排序的情況。—菲菇維基食用菌協會 2008年6月23日 (一) 10:34 (UTC)

由於之前全局機械人的問題,現在參照meta上的標準bot方針,在原有內容上進行了大量的補充和修訂。此外,Wikipedia:機械人作為中文版申請bot權限的方針已經行之多年,故此加上了正式方針的模板。對於新增加的內容,看還有什麼需要修訂的地方沒有?—百無一用是書生 () 2008年10月7日 (二) 19:12 (UTC)

機械人申請的審查和通過標準

本人一直對中文維基百科的機械人申請頗感不滿。本人早曾申請一機械人,無人反對(曾有反對者,但討論後均轉爲同意或中立)。如今已過去了三個多月,審查方面毫無消息,本人只申請就此荒廢在那裏。維基百科:機械人沒有列明主持機械人申請事宜的行政員名單,也沒有明確的通過步驟,甚至連通過要求也沒有。這樣一來,申請人便不知自己申請的機械人是否達到了要求,或還須如何改進,更不知道行政員是否有真正理會過機械人申請,或被莫名其妙地拒絕。而且,沒有客觀標準,會使行政員有太大的權力控制機械人上臺或下臺,往往會導致「公報私仇」問題的出現。本人很希望維基社群共同提出客觀的通過標準,促進日後自動化編輯的發展。謝謝。鋼琴小子 (留言) 2009年3月22日 (日) 10:34 (UTC)

應修改成

自動批准

中文維基百科允許bot的操作者直接向監管員請求授權,本地社群將視為授權給監管員而自動批准。對於自動批准的bot,必須符合下列要求:
  • bot須先申請bot試運行權限,以此權限於中文維基百科至少編輯一周或至少編輯100次,用以演示其運行過程。
  • bot只能用於維護跨語言連結和修復重定向