維基百科:機器人/申請/MizBot
外觀
< Wikipedia:机器人 | 申请
- 狀態: 已過期
- 操作者: 水樹美月(留言)
- 提請時間: 2012年10月10日 (三) 16:27 (UTC)
- 程式語言:目前使用Pywikipediabot
- 用途:目前使用半自動方式替換日本俗字為漢語規範漢字(User:水樹美月/中日不同形漢字),不知未來能否自動化。
- 討論內容連結: 參見維基百科:互助客棧/技術#是否有必要做一個機器人自動化地把那些日本俗字改為漢語規範漢字?、維基百科:自動維基瀏覽器/任務#「収録」→「收錄」
- 編輯時段及頻率:應該是間歇性的,幾個月拿出來改一輪。
- 每天受影響頁面:
- 遵守Bots模板:這個不懂……
- 於其它語言所獲權限:無
- 是否有測試?Ben.mq 2012年10月10日 (三) 17:48 (UTC)
- 目前沒有自動化,只是類似於「自動維基瀏覽器(AWB)」的半自動,我想還需要慢慢研究吧……總之先在這裡通報一下,不知道什麼時候能做得好。--水樹美月(留言) 2012年10月11日 (四) 11:01 (UTC)
- ref也應該skip.....卍田卐JC1 2012年10月11日 (四) 05:34 (UTC)
- 有道理。--水樹美月(留言) 2012年10月11日 (四) 11:01 (UTC)
- 另外既然是半自動,為甚麼不直接使用AWB?還有,機器人根本就不應該在全自動的情況下改錯字。卍田卐JC1 2012年10月11日 (四) 15:31 (UTC)
- AWB似乎是WindowsOnly的,所以不用。--水樹美月(留言) 2012年10月11日 (四) 15:36 (UTC)
- 你的意思是你不是用windows?--一個正常人 ☎ ✉ 2012年11月10日 (六) 14:36 (UTC)
- 機器人根本就不應該在全自動的情況下改錯字
有道理。應該這麼說:未來要變得更智能些(例如學年別漢字配當表直接跳過),不過替換前還是需要人檢查確定一下。--水樹美月(留言) 2012年10月11日 (四) 15:41 (UTC) - 這個用skip list就可以...卍田卐JC1 2012年10月13日 (六) 06:15 (UTC)
- 原來如此……謝謝您的提示~--水樹美月(留言) 2012年10月14日 (日) 10:59 (UTC)
- 原本也是(+)支持的,可惜Ben.mq摧毀了這一切。--一個正常人 ☎ ✉ 2012年11月9日 (五) 03:53 (UTC)
- 謝謝,不過我目前似乎也不是很需要bot權限,所以這個更像是給社群的通知吧。--水樹美月(留言) 2012年11月9日 (五) 11:35 (UTC)
- 原本也是(+)支持的,可惜Ben.mq摧毀了這一切。--一個正常人 ☎ ✉ 2012年11月9日 (五) 03:53 (UTC)
- 原來如此……謝謝您的提示~--水樹美月(留言) 2012年10月14日 (日) 10:59 (UTC)
- AWB似乎是WindowsOnly的,所以不用。--水樹美月(留言) 2012年10月11日 (四) 15:36 (UTC)
- 另外既然是半自動,為甚麼不直接使用AWB?還有,機器人根本就不應該在全自動的情況下改錯字。卍田卐JC1 2012年10月11日 (四) 15:31 (UTC)
- 有道理。--水樹美月(留言) 2012年10月11日 (四) 11:01 (UTC)
- ref也應該skip.....卍田卐JC1 2012年10月11日 (四) 05:34 (UTC)
- 一個月了,目前進展怎麼樣?先前的測試跑的太快了。如果沒那麼頻繁的話還是可以接受的--Ben.mq 2012年11月9日 (五) 12:23 (UTC)
- 那只是我按Y按得很快而已……誒?我一分鐘最多5~6個吧?--水樹美月(留言) 2012年11月9日 (五) 12:58 (UTC)
- 你怎麼把它封掉了……這又不是要天天改,看到某些條目有日語模板之後我已經斷了自動化的念頭了,估計一輪改完下一次改也得很久以後了,--水樹美月(留言) 2012年11月9日 (五) 12:58 (UTC)
- 因為對於具體的「半自動」方法是什麼方法不清楚,所以當時對於涉及字詞修改的機器人先行封禁,因為機器人改字理論上應該避免。目前已經解封,如果有新的測試計劃或者說有什麼其他新的計劃請提出來--Ben.mq 2012年11月9日 (五) 21:57 (UTC)
- 謝謝解封。它是一個上百行的批處理,每一行都是類似於「python replace.py -ns:0 拠 據 -search:拠」這樣的。現在我把它列在了User:水樹美月/中日不同形漢字後面。執行之後會提示,再對要改的條目按Y,不要改的按N,就可以了。其次,我當時已經在客棧進行了討論[1],有管理員也做過同樣的操作維基百科:自動維基瀏覽器/任務#「収録」→「收錄」,我早就在「討論連結」那裡註明了。
- 因為對於具體的「半自動」方法是什麼方法不清楚,所以當時對於涉及字詞修改的機器人先行封禁,因為機器人改字理論上應該避免。目前已經解封,如果有新的測試計劃或者說有什麼其他新的計劃請提出來--Ben.mq 2012年11月9日 (五) 21:57 (UTC)
維基百科:機器人說:沒有社群的批准,bot不能用於拼寫檢查和糾正錯字,以及處理繁簡轉換問題;但是我顯然經過了社區討論。當時的討論中,大家都認為中文版(除了介紹「日語中的漢字」之類的特殊條目之外)不應有日語漢字,不過對於使用什麼技術有分歧而已。--水樹美月(留言) 2012年11月10日 (六) 08:28 (UTC)
另外對於「歴 歷 曆 暦」的繁簡轉換我有點疑問。台灣正體可以用「教育部國語辭典」確認台灣正體是異於日語漢字的(日語漢字裡面兩個木,台灣正體裡面兩個禾),但是很奇怪,簡中模式下,歴 歷 曆都能轉成歷。暦不可以轉成歷。您切換一下字型,用「不轉換」「簡體」「繁體」分別看看就知道了。
此外,港澳繁體有什麼字型上的規範可以參看?港澳的「歷」字莫非有所不同?--水樹美月(留言) 2012年11月10日 (六) 08:58 (UTC)
- 歷、曆皆可簡化成历。--一個正常人 ☎ ✉ 2012年11月10日 (六) 09:22 (UTC)
- 謝謝指教。那麼歷 曆就是繁體中文的正字,歴 暦是日本戰後的新字體了。--水樹美月(留言) 2012年11月10日 (六) 11:37 (UTC)
- 來試一下:把Wikipedia:AutoWikiBrowser/Sandbox的內容改掉。--卍田卐JC1 2012年12月22日 (六) 15:56 (UTC)
- 有沒有測試來說一聲,不測試的話三天後存檔。卍田卐JC1 2013年3月2日 (六) 12:52 (UTC)
- 來試一下:把Wikipedia:AutoWikiBrowser/Sandbox的內容改掉。--卍田卐JC1 2012年12月22日 (六) 15:56 (UTC)
- 謝謝指教。那麼歷 曆就是繁體中文的正字,歴 暦是日本戰後的新字體了。--水樹美月(留言) 2012年11月10日 (六) 11:37 (UTC)