維基百科机器人

维基百科:机器人/作业请求

维基百科,自由的百科全书
跳到导航 跳到搜索


Crystal Clear action run.svg
快捷方式
WP:BOTR
WP:BOTREQ
# 需求 進度 發言 參與 最新發言 最後更新(UTC+8) 最新機器人操作者 機器人操作者更新(UTC+8)
1 一些小修正 3 3 Tang891228 2018-02-20 01:29 Gabrielchihonglee 2018-01-15 17:27
2 自动化去除stub标记 4 2 Artoria2e5 2017-03-10 00:20
3 半自动任务:将误用作标题的dt元素转为h4 Symbol declined.svg 不建議 4 2 Artoria2e5 2018-01-10 14:09 Kanashimi 2017-10-22 19:15
4 修正由于简繁不符匹配而失效的章节标题 3 2 Artoria2e5 2017-09-25 10:28
5 可否为小作品自动标记模板? 2 2 Gabrielchihonglee 2018-01-15 17:26 Gabrielchihonglee 2018-01-15 17:26
6 協助維護清理Category:本地链接的维基共享资源分类与Wikidata不同 3 2 Willy1018 2017-06-08 19:26
7 中国大陆行政区划相关 1 1 Snghrax 2017-11-04 12:30
8 關於大量未有Wikitable的問題 未完成 3 2 Arnie97 2018-03-31 18:39 Arnie97 2018-03-31 18:39
9 删除中国高速公路标识的位图,统一替换为规范的 SVG 版本 1 1 Arnie97 2017-07-11 16:06 Arnie97 2017-07-11 16:06
10 批量在重建或恢复的页面的讨论页上面挂Old vfd multi 2 2 Kanashimi 2017-09-02 06:30 Kanashimi 2017-09-02 06:30
11 內連替換 完成 2 2 Xiplus 2018-05-15 19:23 Xiplus 2018-05-15 19:23
12 自动标记条目 4 4 小躍 2018-05-17 11:02 Arnie97 2018-03-31 18:42
13 Lint 錯誤 1 1 Xiplus 2018-04-01 00:49 Xiplus 2018-04-01 00:49
14 将部分行政区划条目中的表格替换为信息框 3 2 Arnie97 2018-05-14 13:04 Arnie97 2018-05-14 13:04
15 字詞轉換處理 1 1 Tang891228 2018-05-14 00:13
16 處理HAM的存檔問題 完成 3 2 Xiplus 2018-06-18 08:49 Xiplus 2018-06-18 08:49
17 批量连接模板 Yes check.svgY 完成 2 2 Kanashimi 2018-06-05 17:07 Kanashimi 2018-06-05 17:07
18 定期更新维基百科:特色列表/列表和维基百科:典範條目/列表 1 1 Gakmo 2018-06-11 01:47
19 Wikipedia:管理员通告板/3RR 完成 2 2 Xiplus 2018-06-18 08:49 Xiplus 2018-06-18 08:49

本頁面用來請求機器人協助完成一些相對簡單而重複的作業,任何請求都必須符合機器人政策。想查看現有的機器人,請參見Wikipedia:机器人/列表

對於某個機器人的問題,請向其擁有者詢問。若發現機器人運作不良,請直接提醒該用戶,或至当前的破坏報告。

許多請求被拒絕的原因,可能是因為作業內容過於複雜,或是請求項目需要獲得社群共識

假設,如果您請求的機器人作業是把所有的條目討論頁加上一個专题标志模板以將其特定分類或子分類,請非常謹慎地檢查以確定其分類樹中沒有任何非目標的子分類:例如您可能沒留意到Category:第二次世界大战其實是Category:泰國的子分類,但事實上機器人在修改後者時將會波及前者。因此,我們提出要求時應提供完整的分類清單,以供機器人作個別處理,而非提供一個大分類再讓機器人修改所有相關分類而因而陷入遞迴。以下是英語版維基的一個成功請求,以及一個不良請求(及其造成的爛攤子)。中文維基的爛攤子例子見此

关于专题,请参看维基百科:专题委员会/技术支持

流程[编辑]

提出請求[编辑]

  • 請求者必須說明作業的內容、範圍與理由。如果曾在他處討論,也請附上連結。
  • 在作業前可能會有用戶提問,視內容可能會被判斷為不適合機器人作業。
  • 提出請求建議先經過討論,可以利用BOTREQ記號模板。更動範圍過大或與現行方針指引有出入的修改應該先在互助客棧或相關專題討論。
  • 在作業完成的報告後,請確認作業內容是否符合預期,並在本頁面回報。


接受請求[编辑]

  • 擁有機器人的用戶,請在進行作業前在本頁面表明接受請求,以免多个用戶同時作業而出現衝突。{{BOTREQ}}可以用來方便回應。
  • 任何相關疑問請在本頁面或適當討論場所提出。
  • 當機器人作業完成之後,請在本頁面回報,說明完成的內容,並在作業確認完成後存檔。

请求区[编辑]


一些小修正[编辑]

  • 间隔号的不当使用:• => ·
  • 数学公式中微分算子的不当斜体:(\<math\>.*?)d([xyz].*?\<math\>) => \1\\mathrm{d}\2,以及\frac{d}{d[xyz]}这种也要修。当然不局限于xyz,细节再说吧。

其他的,想到再补充。AWB和bot其实都可以。 --砜中嘌呤的白磷萃取 打谱 2017年3月4日 (六) 14:55 (UTC)

@WhitePhosphorus: 可以各舉例子嗎?謝謝--Gabriel Chi Hong Lee (找我算账) 2018年1月15日 (一) 09:27 (UTC)
  • 看了幾個頁面:微分算子達布積分三角換元法,大概有這些情形:
    1. <math>dx</math> → <math>\mathrm{d}x</math>
    2. <math>d\theta</math> → <math>\mathrm{d}\theta</math>
    3. <math>\frac{d}{dx}</math> → <math>\frac{\mathrm{d}}{\mathrm{d}x}</math>
    4. <math>d \over dx</math> → <math>\mathrm{d} \over \mathrm{d}x</math>
    5. <math>\frac{d^n y}{dx^n}</math> → <math>\frac{\mathrm{d}^n y}{\mathrm{d}x^n}</math>
-- tang891228 留言 2018年2月19日 (一) 17:29 (UTC)

自动化去除stub标记[编辑]

我在VPP里面那个DYK标准的讨论中提到了一个较为可靠的机器字数统计方式,即只处理内容部分的第一级段落。按照这个条件,机器数起字数只会少(漏掉列表或者是隐藏的内容)、不会多,因此可以较为安全地判断可以移除的模板。按照伪代码形式,过程描述如下:

求字数:

  1. article 为输入条目名
  2. htmlarticle 对应 HTML 页面,即 "https://zh.wikipedia.org/wiki/" + article 下载的结果
  3. dom 为解析 HTML 所得的 DOM(文档结构)树
  4. paras 为在 dom 上执行 CSS 选择器 #mw-content-text > p(正文区域下每个直接下属的段落(不含标题、代码框等元素))的结果
  5. 对于 paras 中的每个元素 p,将其:
    1. 检索所有 sup.reference 引用标签,去除之
    2. 檢索所有 span:not(:lang(zh)) 的外文內容,去除之(應該可以免疫一些輕小說攻擊)
    3. 檢索所有 span.noprint 的不打印內容,將其一併去除。
    4. 如果正在處理第一個 p,則檢索第一個b粗体文字,將其去除(輕小說標題)
    5. 將現在數出内文长度记为 len(p.text)
      • 在 beautifulsoup 中,元素内文所对应的属性为 text
      • 在 JavaScript DOM API 中,元素内文对应的属性为 innerText
      • len 操作应当考虑 UTF-16 代理对拆分的情况。如果使用的语言为 JavaScript,应当使用 [...str].length(或使用Array.from)而非 str.length 计算长度。Java和C#也有类似的问题。
      • len 操作应对字符串执行 NFC 标准化,以便近似用户可见的“字符”数量。要完全近似“字符”数量,可以使用perl 6、python等语言的“字素群”(grapheme)处理功能。(中文用到这种东西的概率不高。)
      • 在处理 len 之前或许应该去除各种不可见字符,避免用户恶搞。(我好像把人类想得太坏了?)
  6. 返回所有 len(p.text) 之和

主程序:

  1. 对于Category:小作品的每一个条目 a
    1. 如果 a 的名字空间为 0,且 a 的字数大于标准的 1.25 倍
      1. sa 的源码
      2. s 里面的模板都看一遍
        1. 把所有属于Category:小作品模板的去掉(这一步建议预置列表,不要每次都找一遍)
      3. 提交编辑

感谢User:老陳提供灵感。——Artoria2e5 保持讨论完整直接{{ping}}我回复 2017年3月9日 (四) 15:56 (UTC)

这个去和User:Jimmy Xu说。--Antigng留言) 2017年3月9日 (四) 15:59 (UTC)
另,1-3没有必要,直接使用api就好。--Antigng留言) 2017年3月9日 (四) 16:11 (UTC)
API给出的text属性只是直接提供了mw-content-text的内容而已,p还是得再跑选择器。用那玩意还要重新组织东西喂进DOM做选择,不像直接取页面有一步到位的东西……——Artoria2e5 保持讨论完整直接{{ping}}我回复 2017年3月9日 (四) 16:20 (UTC)

半自动任务:将误用作标题的dt元素转为h4[编辑]

维基百科似乎有不少将WP:LIST#定義列表的“词汇”部分当作小标题用的地方。这样做既不符合Wikitext语义(Wikipedia:備忘單en:Help:Wiki_markup)及生成的HTML标签(dl“定义列表”、dt“定义的词汇部分”、dd“定义的词义部分”)的定义,也对于目录处理有弊无利。建议创建一个半自动任务,搜索正则表达式形如 \n(;([^:\n]+))\n([^:]?) 的Wikitext成分,并视情况决定是否转换为\n==== $2 ====\n$3的第四级标题。(表达式解释:一行由 ;开始,但不含:,且紧接的一行不以:开始。正则可以使用网页上的“高级”编辑工具类匹配到,但其对\n的处理不正确。)

如果条目内本来没有第四级标题,操作者应考虑在首段末尾加一个{{TOCLimit|3}}模板,以防目录过度膨胀。——Artoria2e5 保持讨论完整直接{{ping}}我回复 2017年3月20日 (一) 17:43 (UTC)

手动操作范例:修正标题缩短目录。——Artoria2e5🔧 讨论要完整回复请用ping 2017年3月21日 (二) 15:43 (UTC)
Symbol declined.svg 不建議 恐怕有許多需要手動判別的例子。 --Kanashimi留言) 2017年10月22日 (日) 11:15 (UTC)
多虑了。dt 不误用的情况有且只有在后面有定义 (dd) 或者更多 dt 的情况。并且“半自动”是有人的。驳回 badidea。——Artoria2e5 讨论要完整回覆请用ping 2018年1月10日 (三) 06:09 (UTC)

修正由于简繁不符匹配而失效的章节标题[编辑]

在维基百科上可以使用[[条目#章节]]的格式,链接到一个页面的某个章节。可是这个功能要求章节部分和相应的anchor位置包括完全匹配,显然是很难做到(除非这群人把phab:T160952“创建各种简繁ID”修了)。

假定有一个可以列出一个字符串 s 简单转换繁简后各种结果 cc[] 的函数 allVariants,我建议设计一个小工具和一个机器人任务解决这种问题(前者可用于编辑器内检查,后者可用于清理积压错误):

修复。给定 Wikitext wt,返回一个新的 Wikitext ret
retwt
wt 中搜索所有长得像链接的东西,令得到的字符串列表为一个集合 links。搜索的准确程度决定这个任务能不能做成全自动任务。
对于 links 中的每个页面 link
link 拆分为页面名称 page、章节位置 section、显示文字 display 三部分。
如果没有 section,继续检查下一个 link
section 编码为页面上会看到的 id 值。
参考anchorescape Parser function的实现,或按照这个瞎写的实现
获取page的HTML部分(HTML就够了),解析为dom树。
如果dom树上存在一个 ID 为 id 的节点,继续检查下一个 link
否则,将 section 进行繁简转换,得到一堆字串 ccsections
cc 中每个 ccsection 字串:
ccsection 进行 anchorescape 编码,得到 ccid
dom 数上寻找 ID 为 ccid 的节点。
如果找到,则将 ret 中的每一个 link 换为 "[[{link}#{ccsection}|{display}]]"的形式。也就是把section换成实际上存在的ccsection。
不知道原来的章节标题是怎么来的。大喊大叫,然后继续检查下一个 link
返回 ret

——Artoria2e5 讨论要完整回复请用ping 2017年3月23日 (四) 04:08 (UTC)

貌似有点儿意思啊,想接手看看。不过机器人怎么找这种有错的页面呢,看脸么…… --砜中嘌呤的白磷萃取 打谱 2017年5月6日 (六) 12:14 (UTC)
@WhitePhosphorus:猜对了,看脸!或者是先只盯RC/DYKC/FA/GA之类的……——Artoria2e5 讨论要完整回覆请用ping 2017年9月25日 (一) 02:28 (UTC)

可否为小作品自动标记模板?[编辑]

针对小作品,是否可以借助脚本,自动标记模板{{stub}},条目内容少于600字节且多于150字节的条目为重点;如果条目少于150字节,则标记小小作品模板{{Substub}}。注1,条目中如果有#REDIRECT [[主条目]]等标签,则排除这些重定向条目(一般重定向条目多数少于150字节);注2,如果条目有{{disambig}}、{{hndis}}、{{Geodis}}或{{dabclean}}等消歧义模板,也予以排除。

对于已经明确分类的条目,可以根据Category:条目分类判别。对小作品分类或许实在太繁琐,如果脚本难以处理,可否先行标记{{小作品}}和{{Substub}}的模板,以便于更好归类。 --抗议人类将地球外生命都称外星人+- 2017年4月8日 (六) 20:44 (UTC)

@如果我不是外星人: 你是指想用 bot 自動對頁面加減 {{stub}}, {{Substub}}?--Gabriel Chi Hong Lee (找我算账) 2018年1月15日 (一) 09:26 (UTC)

協助維護清理Category:本地链接的维基共享资源分类与Wikidata不同[编辑]

如題。-- Willy1018(留言) 2017年5月7日 (日) 14:19 (UTC)

@Willy1018:打算接手,但感觉机器人只能修正本地链接的分类是空的的情况……谷戻り留言) 2017年6月6日 (二) 00:21 (UTC)

User:Tanimodori了解。不過我不擅長技術層面,所以只能請求大師嘍。-- Willy1018(留言) 2017年6月8日 (四) 11:26 (UTC)

中国大陆行政区划相关[编辑]

希望能有机器人完成以下动作:

  1. 为中文维基百科中国大陆行政区划条目添加图片和地图(图片可参考日语维基百科)
  2. 在讨论页挂相关专题模板

—— 呆呆|ω・`) 捕捉 | 爪迹 2017年11月4日 (六) 04:30 (UTC)

關於大量未有Wikitable的問題[编辑]

請求將

{| border=1 

轉換成

{| class="wikitable" 

主要是維基化,以及大量頁面認為過時的設計,需要更新。 以上請求建立機器人。 --1233|點此與此廢青展開激情對話 | 千錯萬錯都是阿道夫的错! 2018年1月9日 (二) 15:08 (UTC)

  • 处理中……居然有几个页面把祖传表格当做信息框用 囧rz...——Arnie97留言) 2018年3月28日 (三) 20:30 (UTC)
    • 未完成,需处理的不同情况较多,并不能不经检查直接替换,我放弃了。——Arnie97留言) 2018年3月31日 (六) 10:39 (UTC)

删除中国高速公路标识的位图,统一替换为规范的 SVG 版本[编辑]

这项工作本应在 commons:Bots 提议,但除删除图片外,还涉及到对中文维基百科及全域其他站点中引用的替换,因此暂在此讨论。

工作内容包括:

  • 已有 SVG 标识:删除其对应的位图版本,并修改链入链接
  • 尚无 SVG 标识:根据给定文字生成 SVG 标识(现有的这些 SVG 是如何制作的,是否已有相关的半自动工具?),之后按上一条处理

相关条目包括:

——Arnie97留言) 2017年7月11日 (二) 08:06 (UTC)

批量在重建或恢复的页面的讨论页上面挂Old vfd multi[编辑]

批量在被页面存废讨论删除后重建或恢复的页面的讨论页上面挂{{Old vfd multi}}。参见en:User:AnomieBOT/source/tasks/NewArticleAFDTagger.pm。--GZWDer留言) 2017年9月1日 (五) 21:55 (UTC)

要我做的話,連著結束討論、自動把頁面刪除或者保留的功能一起做會更好。 --Kanashimi留言) 2017年9月1日 (五) 22:30 (UTC)

內連替換[编辑]

中国省级行政区地区生产总值列表現在是一個消歧義頁面,唯現在指向這頁面的內連幾乎均應指向中华人民共和国省级行政区地区生产总值列表,且涉及數量較多,建議使用機器人全部替換。--【和平至上】💬📝 2018年2月21日 (三) 11:51 (UTC)

完成。--Xiplus#Talk 2018年5月15日 (二) 11:23 (UTC)

自动标记条目[编辑]

可否使用机器人自动为条目加上清理模板,如{{onesource}}、{{wikify}}、{{fansite}}。可让机器人自动读取条目中的来源、语气信息,判断条目存在的问题。--徐亦樵已改成了! 2018年3月12日 (一) 18:30 (UTC)

  • 避免使用機器人用於巡查。--Zest 2018年3月12日 (一) 19:24 (UTC)
  • 不反对,但担心准确性和必要性(比如几千字的条目因为一句话而被挂上模板)。制作为列表(于用户页面)更利于各项维护。--YFdyh000留言) 2018年4月1日 (日) 18:23 (UTC)
  • 若不必在條目列模板,可以用個列表持續更新狀態是最好的。--小躍撈出記錄) 2018年5月17日 (四) 03:02 (UTC)

Lint 錯誤[编辑]

請在下方表格填寫製作機器人的狀況,以免重複。

任務 機器人/操作者/其他連結
高優先級
應被刪除的表格標籤
在HTML5和HTML4中對錯誤嵌套的標籤有不同的渲染
其他Tidy替換問題
清單裡多行表格
多處未閉合格式化標籤 User:星耀晨曦 BRFA
可以解決的段落換行錯誤
自封閉標籤 沒有或極少錯誤
涉及字體標籤包裹連結的Tidy錯誤 User:WhitePhosphorus BRFA
Tidy空格錯誤
標題中未閉合引用 沒有或極少錯誤
中優先級
有問題的檔案選項 User:Kanashimi BRFA
表格中不合法內容
未嵌套標籤
多餘的冒號 沒有或極少錯誤
低優先級
缺少結束標籤
過時的HTML標籤
被忽略的標籤

製表紀錄。--Xiplus#Talk 2018年3月31日 (六) 16:49 (UTC)

将部分行政区划条目中的表格替换为信息框[编辑]

包括但不限于这些搜索结果。——Arnie97留言) 2018年5月5日 (六) 14:26 (UTC)

改成這樣嗎? [1] 還是有其他方式,例如套用行政編號什麼的。--Zest 2018年5月14日 (一) 04:26 (UTC)
大致是这样,但请注意这个信息框自带面积和人口的单位,填数字即可。——Arnie97留言) 2018年5月14日 (一) 05:04 (UTC)

字詞轉換處理[编辑]

  1. 去除與公共轉換組重複的轉換規則(例如[1]
  2. 去除與全文轉換重複的內文轉換(例如[2]

-- tang891228 留⁠言 2018年5月13日 (日) 16:13 (UTC)

處理HAM的存檔問題[编辑]

請求User:Jimmy Xu的Jimmy-bot對Wikipedia:元維基用戶查核協助請求的頁面定期存檔。存檔的方式和以前在WP:RFCU的方式是一樣的。--1233( T / C 2018年6月4日 (一) 15:21 (UTC)

或者任何存檔機器人皆可。--1233( T / C 2018年6月9日 (六) 10:35 (UTC)
完成Wikipedia:机器人/申请/A2093064-bot/12。--Xiplus#Talk 2018年6月18日 (一) 00:49 (UTC)

批量连接模板[编辑]

(*^__^*) 嘻嘻,我又来啦。{{中国经济}}--虫虫超能研究所实验志愿者报名入口 2018年6月5日 (二) 04:57 (UTC)

Yes check.svgY 完成: User:Cewbot/log/20160628。若您不嫌棄,請不吝提供些意見,謝謝。 --Kanashimi留言) 2018年6月5日 (二) 09:07 (UTC)

定期更新维基百科:特色列表/列表维基百科:典範條目/列表[编辑]

定期更新维基百科:特色列表/列表维基百科:典範條目/列表(例如兩星期一次)。更新辦法參閱其頁面說明頁。兩頁面的資料用作首頁中「典範條目」欄目中「其他典範條目」和「其他特色列表」的展示,請參閱[2]。--Gakmo留言) 2018年6月10日 (日) 17:47 (UTC)

Wikipedia:管理员通告板/3RR[编辑]

請求任何存檔機器人對Wikipedia:管理员通告板/3RR的頁面定期存檔。存檔的方式和WP:AIV一樣。--MCC214強烈要求維基條目寧缺勿濫#我做了甚麼? 2018年6月16日 (六) 10:58 (UTC)

完成Wikipedia:机器人/申请/A2093064-bot/13。--Xiplus#Talk 2018年6月18日 (一) 00:49 (UTC)