本页使用了标题或全文手工转换

维基百科:机器人/作业请求

维基百科,自由的百科全书
跳到导航 跳到搜索
Crystal Clear action run.svg

本頁面用來請求機器人協助完成一些相對簡單而重複的作業,任何請求都必須符合機器人政策。想查看現有的機器人,請參見Wikipedia:机器人/列表

對於某個機器人的問題,請向其擁有者詢問。若發現機器人運作不良,請直接提醒該用戶,或至当前的破坏報告。

許多請求被拒絕的原因,可能是因為作業內容過於複雜,或是請求項目需要獲得社群共識

假設,如果您請求的機器人作業是把所有的條目討論頁加上一個专题标志模板以將其特定分類或子分類,請非常謹慎地檢查以確定其分類樹中沒有任何非目標的子分類:例如您可能沒留意到(在英文维基百科中)Category:第二次世界大战其實(曾经)是Category:泰國的子分類,但事實上機器人在修改後者時將會波及前者。因此,我們提出要求時應提供完整的分類清單,以供機器人作個別處理,而非提供一個大分類再讓機器人修改所有相關分類而因而陷入遞迴。以下是英語版維基的一個成功請求,以及一個不良請求(及其造成的爛攤子)。中文維基的爛攤子例子見此

关于专题,请参看维基百科:专题委员会/技术支持

流程[编辑]

提出請求[编辑]

  • 請求者必須說明作業的內容、範圍與理由。如果曾在他處討論,也請附上連結。
  • 在作業前可能會有用戶提問,視內容可能會被判斷為不適合機器人作業。
  • 提出請求建議先經過討論,可以利用BOTREQ記號模板。更動範圍過大或與現行方針指引有出入的修改應該先在互助客棧或相關專題討論。
  • 在作業完成的報告後,請確認作業內容是否符合預期,並在本頁面回報。

接受請求[编辑]

  • 擁有機器人的用戶,請在進行作業前在本頁面表明接受請求,以免多个用戶同時作業而出現衝突。{{BOTREQ}}可以用來方便回應。
  • 任何相關疑問請在本頁面或適當討論場所提出。
  • 當機器人作業完成之後,請在本頁面回報,說明完成的內容,並在作業確認完成後存檔。

请求区[编辑]

# 需求 進度 發言 參與 最新發言 最後更新(UTC+8) 最新機器人操作者 機器人操作者更新(UTC+8)
1 一些小修正 擱置 9 7 Q28 2022-05-19 12:21
2 自动化去除stub标记 10 8 QiuLiming1 2022-06-06 12:29 Kanashimi 2021-12-12 12:29
3 自动为文档加入{{缺乏中文说明}} 9 6 GUT412454 2022-02-12 21:15
4 为使用Template:Information模板而非专用模板、以致被判定为无合理使用依据的非自由版权图像进行模板替换 Symbol possible vote.svg 可行 20 10 Willy1018 2022-06-04 23:40 Willy1018 2022-06-04 23:40
5 罗马尼亚乡份按县分类 擱置 15 5 Q28 2022-05-19 12:45 Willy1018 2020-09-21 12:17
6 清理Template:Short description用法錯誤 3 3 YFdyh000 2022-05-23 00:19 YFdyh000 2022-05-23 00:19
7 字词转换处理 擱置 5 4 Q28 2022-05-19 12:47 -Zest 2020-07-22 16:09
8 把{{coord}}的信息转移到wikidata 擱置 2 2 Q28 2022-05-19 12:44
9 希望以機器人自動維護中國大陸行政區劃條目及相關數據 13 4 Kanashimi 2021-11-28 15:36 Kanashimi 2021-11-28 15:36
10 添加{{lang}}模板 1 1 Jonathan5566 2021-05-09 02:48
11 请求自动为已上新闻动态的条目的讨论页添加{{ITNtalk}}模板 8 2 Kanashimi 2022-06-24 07:28 Kanashimi 2022-06-24 07:28
12 使用Template:文物保护单位替换Template:四川省文物保護單位、Template:重慶市文物保護單位 1 1 猫猫的日记本 2022-01-16 15:44
13 使用条目中的Speciesbox中的数据,自动整理Category:植物小作品中的条目至子分类 1 1 GUT412454 2022-02-12 21:04
14 把WebCite链接替换为Wayback Machine链接 1 1 Txkk 2022-04-16 17:26
15 地铁相关条目用词不当替换 Symbol merge vote.svg 須經討論 3 3 YFdyh000 2022-06-03 12:20 YFdyh000 2022-06-03 12:20
16 大型歌唱選秀節目 Symbol merge vote.svg 須經討論 3 3 YFdyh000 2022-06-04 23:54 YFdyh000 2022-06-04 23:54
17 更新COVID-19数据 Symbol neutral vote.svg 已有機器人处理 2 2 Willy1018 2022-06-10 18:24 Willy1018 2022-06-10 18:24
18 同步SPI中监管员的查核结果 4 3 LuciferianThomas 2022-06-22 09:39 LuciferianThomas 2022-06-22 09:39
19 更新中国大陆各省、市、县人口以及GDP数据,目前很多还停留在2015年 5 3 Xyy23330121 2022-06-09 14:02 YFdyh000 2022-06-08 11:22
發言更新圖例
  • 最近一小時內
  • 最近一日內
  • 一週內
  • 一個月內
  • 逾一個月
特殊狀態
已移動至其他頁面
或完成討論之議題
手動設定
當列表出現異常時,
請先檢查設定是否有誤



一些小修正[编辑]

  • 间隔号的不当使用:• => ·
  • 数学公式中微分算子的不当斜体:(\<math\>.*?)d([xyz].*?\<math\>) => \1\\mathrm{d}\2,以及\frac{d}{d[xyz]}这种也要修。当然不局限于xyz,细节再说吧。

其他的,想到再补充。AWB和bot其实都可以。 --砜中嘌呤的白磷萃取 打谱 2017年3月4日 (六) 14:55 (UTC)[回复]

@WhitePhosphorus: 可以各舉例子嗎?謝謝--Gabriel Chi Hong Lee (找我算账) 2018年1月15日 (一) 09:27 (UTC)[回复]
  • 看了幾個頁面:微分算子達布積分三角換元法,大概有這些情形:
    1. <math>dx</math> → <math>\mathrm{d}x</math>
    2. <math>d\theta</math> → <math>\mathrm{d}\theta</math>
    3. <math>\frac{d}{dx}</math> → <math>\frac{\mathrm{d}}{\mathrm{d}x}</math>
    4. <math>d \over dx</math> → <math>\mathrm{d} \over \mathrm{d}x</math>
    5. <math>\frac{d^n y}{dx^n}</math> → <math>\frac{\mathrm{d}^n y}{\mathrm{d}x^n}</math>
-- tang891228 留言 2018年2月19日 (一) 17:29 (UTC)[回复]
tang891228不對額,我學的數學沒聽過variable斜體的。我看的數學書中的dy/dx都是全斜體的。ꓢꓯꓠꓟꓳꓢꓮ 2020年1月27日 (一) 12:12 (UTC)[回复]
WhitePhosphorus數學上variable才使用斜體的證據是?ꓢꓯꓠꓟꓳꓢꓮ 2020年1月27日 (一) 12:13 (UTC)[回复]

参考資料

  1. ^ Thompson, Ambler; Taylor, Barry M. Guide for the Use of the International System of Units (SI) — NIST Special Publication 811, 2008 Edition — Second Printing (PDF). Gaithersburg, MD, USA: NIST. March 2008: 35. 

自动化去除stub标记[编辑]

我在VPP里面那个DYK标准的讨论中提到了一个较为可靠的机器字数统计方式,即只处理内容部分的第一级段落。按照这个条件,机器数起字数只会少(漏掉列表或者是隐藏的内容)、不会多,因此可以较为安全地判断可以移除的模板。按照伪代码形式,过程描述如下:

求字数:

  1. article 为输入条目名
  2. htmlarticle 对应 HTML 页面,即 "https://zh.wikipedia.org/wiki/" + article 下载的结果
  3. dom 为解析 HTML 所得的 DOM(文档结构)树
  4. paras 为在 dom 上执行 CSS 选择器 #mw-content-text > p(正文区域下每个直接下属的段落(不含标题、代码框等元素))的结果
  5. 对于 paras 中的每个元素 p,将其:
    1. 检索所有 sup.reference 引用标签,去除之
    2. 檢索所有 span:not(:lang(zh)) 的外文內容,去除之(應該可以免疫一些輕小說攻擊)
    3. 檢索所有 span.noprint 的不打印內容,將其一併去除。
    4. 如果正在處理第一個 p,則檢索第一個b粗体文字,將其去除(輕小說標題)
    5. 將現在數出内文长度记为 len(p.text)
      • 在 beautifulsoup 中,元素内文所对应的属性为 text
      • 在 JavaScript DOM API 中,元素内文对应的属性为 innerText
      • len 操作应当考虑 UTF-16 代理对拆分的情况。如果使用的语言为 JavaScript,应当使用 [...str].length(或使用Array.from)而非 str.length 计算长度。Java和C#也有类似的问题。
      • len 操作应对字符串执行 NFC 标准化,以便近似用户可见的“字符”数量。要完全近似“字符”数量,可以使用perl 6、python等语言的“字素群”(grapheme)处理功能。(中文用到这种东西的概率不高。)
      • 在处理 len 之前或许应该去除各种不可见字符,避免用户恶搞。(我好像把人类想得太坏了?)
  6. 返回所有 len(p.text) 之和

主程序:

  1. 对于Category:小作品的每一个条目 a
    1. 如果 a 的名字空间为 0,且 a 的字数大于标准的 1.25 倍
      1. sa 的源码
      2. s 里面的模板都看一遍
        1. 把所有属于Category:小作品模板的去掉(这一步建议预置列表,不要每次都找一遍)
      3. 提交编辑

感谢User:老陳提供灵感。——Artoria2e5 保持讨论完整直接{{ping}}我回复 2017年3月9日 (四) 15:56 (UTC)[回复]

这个去和User:Jimmy Xu说。--Antigng留言) 2017年3月9日 (四) 15:59 (UTC)[回复]
另,1-3没有必要,直接使用api就好。--Antigng留言) 2017年3月9日 (四) 16:11 (UTC)[回复]
API给出的text属性只是直接提供了mw-content-text的内容而已,p还是得再跑选择器。用那玩意还要重新组织东西喂进DOM做选择,不像直接取页面有一步到位的东西……——Artoria2e5 保持讨论完整直接{{ping}}我回复 2017年3月9日 (四) 16:20 (UTC)[回复]
我记得API有出纯文本的(我记错了?)。另外,我一向认为小作品不单单是字数问题,并不是超过了1个字符就一定不是小作品了--百無一用是書生 () 2018年9月12日 (三) 09:02 (UTC)[回复]
@Shizhao:是,加?action=raw--Wiki emoji | 😷🅔🅜🅞🅙🅘🅦🅘🅚🅘😷 祝百毒不侵~ 2021年2月28日 (日) 09:18 (UTC)[回复]
小作品的定义是“任何正文内容超过50字并少于200字的条目”,而与条目的品质没什么关系。如果要防止这种情况,可以在去掉{{stub}}之后再添加专题评级横幅。--GUT412454留言) 2022年3月24日 (四) 00:37 (UTC)[回复]
@Artoria2e5 在python shell里模拟了一下您的步骤,您看我理解对了吗
from bs4 import BeautifulSoup
b = BeautifulSoup(page_content)
count = len(b.find_all('sup', class_='reference'))
for i in count:
  b.find('sup', class_='reference').decompose()
l = 0
for i in b.find_all('div', id="mw-content-text"):
for j in i.find_all('p'):
l += len(j.text)--QiuLiming1留言) 2022年6月6日 (一) 04:29 (UTC)[回复]

这个东西这么好,怎么2年没动静?--Key to Sky遠い空へ讨论贡献) 2020年7月6日 (一) 05:33 (UTC)[回复]

看起來Jimmy-bot有在幫忙清理分類:字數已超過3000位元組的小作品--Kanashimi留言) 2021年12月12日 (日) 04:29 (UTC)[回复]

自动为文档加入{{缺乏中文说明}}[编辑]

目前有大量的模板文档和模块文档是英文的,但很多都没有挂上{{缺乏中文说明}}。——SolidBlock留言 2019年10月26日 (六) 23:42 (UTC)[回复]

模板文檔或模組文檔可能會出現使用其他語言的模板使用說明或模組使用說明(如法文日文)--林勇智 2019年10月27日 (日) 12:32 (UTC)[回复]
按理来说,这些文档也应该挂{{缺乏中文说明}}。--SolidBlock留言 2019年11月1日 (五) 11:03 (UTC)[回复]
讀起來不像中文的就掛{{缺乏中文说明}}--林勇智 2019年12月4日 (三) 12:10 (UTC)[回复]
有誰會中文信息处理的?讀起來不像中文的文檔就掛{{缺乏中文说明}}--林勇智 2019年12月4日 (三) 12:50 (UTC)[回复]
「讀起來像不像....」的判斷可能無法使用機器人自動判斷。分類器的分類例外問題無法排除。-- 娜娜奇🐰鮮果茶(宇帆·☎️·☘️) 2019年12月4日 (三) 12:50 (UTC)[回复]
不在CJKV区域的字符比例过高就挂模板,不用管日语和汉语的相同字形。--jingkaimori留言) 2020年4月7日 (二) 11:40 (UTC)[回复]
掛上去,不一定會有人去翻吧?
我認為沒有甚麼實質效益--死灰留言) 2021年9月19日 (日) 11:17 (UTC)[回复]
这个模板就是为了让人们去翻译文档的,而且挂了又没有害处(而且确实有一点点好处)。--GUT412454留言) 2022年2月12日 (六) 13:15 (UTC)[回复]

为使用Template:Information模板而非专用模板、以致被判定为无合理使用依据的非自由版权图像进行模板替换[编辑]

相关讨论见Wikipedia:互助客栈/其他#关于图片合理使用依据清查此次清查被判定为无依据的合理使用图像中有较大一部分条目使用Template:Information模板而非专用模板、以致被判定为无合理使用依据。鉴于Template:InformationTemplate:Non-free use rationale 2的关键参数可以互通。因此提议:

| Portion = 圖片的使用是为了传达图像本身所含有的意义和信息,且避免让读者误解该图像所欲传达的原始意义和信息。 
| Minimality = 本图片的尺寸和分辨率既能确保图片品质以资辨识,又避免了不必要的过高分辨率。 
| Purpose = 见授权协议。
| Replaceability = 由于本图片几乎并没有相同的免费或自由版权来源。任何非衍生作品的替代图片将无法传达本图片原本的含意,可能会造成对于条目描述主题的误解。
| Commercial = 该使用不会取代原始版权媒介所具有的市场作用。

本提议所涉的文件均位于Category:没有合理使用依据的文件分类内,数量为至多1000个。 Jyxyl9批判一番 2020年1月23日 (四) 07:30 (UTC)[回复]

(+)支持不过如果合理使用档案被使用于超过一个条目,就为每个条目新建一个使用依据?廣九直通車留言) 2020年1月23日 (四) 12:22 (UTC)[回复]
嗯,如果技术上无法实现可以人工调整。毕竟这种情况比较少。Jyxyl9批判一番 2020年1月24日 (五) 09:43 (UTC)[回复]
这种情况并不少,有超过1400个非自由图片用于多个条目,请见列表。--Wcam留言) 2020年1月24日 (五) 22:46 (UTC)[回复]
你列出的是全zhwiki所有用于多个条目的非自由图片。而本次涉及的只是因清查而提删的一千条左右条目,相信符合此标准的数量不会很多。Jyxyl9批判一番 2020年1月28日 (二) 12:55 (UTC)[回复]
(+)支持。—— Eric Liu 留言留名學生會 2020年1月23日 (四) 16:25 (UTC)[回复]
倾向(-)反对WP:NFCC#10c规定合理使用依据必须与每一次使用确切相关,使用如此空泛含糊、放之四海而皆准的合理使用依据文字进行批量替换,虽可使图片免受快速删除,实则直接违反WP:NFCC#10c规定。不同类型的非自由档案,例如标志、封面海报、历史图片等,在条目中起到的作用不尽相同,其符合WP:NFCC10条标准的理由也不尽相同,有时需要结合具体的非自由档案和具体条目进行说明(例如File:Alan Kurdi lifeless body.jpg)。--Wcam留言) 2020年1月24日 (五) 23:04 (UTC)[回复]
(+)支持。整件事情就是有用戶大量提請F9(本來是沒問題的),但是由於速度太快、量太多,社群根本承受不了。除非管理員同意暫緩執行F9一段比較長的時間,否則這机器人作业请求必須執行Sanmosa 2020年1月26日 (日) 07:11 (UTC)[回复]
請參見Wikipedia:互助客栈/其他/存档/2020年3月#非自由圖片的使用理據及其處理Sanmosa 2020年1月26日 (日) 07:16 (UTC)[回复]
(+)支持。另请参见删除方针:“管理员应依照本方针执行删除和还原操作。删除决定不应轻易地做出,如果社群对一个页面是否应当删除存在争议,则该页面通常不应删除。我们应该尽量保留所有合乎百科全书目标的页面,删除应该是最后的选择。在把页面提交删除流程之前,请仔细考虑其他非删除的手段是否能改善页面。”大量提删一些因为错误使用{{Information}}导致理据出现瑕疵图片,严格意义上是严重违反方针的扰乱行为。--人类的悲欢并不相通,我只觉得他们吵闹 2020年1月26日 (日) 07:20 (UTC)[回复]
(+)支持:敝人實在不想一個個去做更正。--Qqkuro66541留言) 2020年1月26日 (日) 10:30 (UTC)[回复]
(!)意見:如果不希望一个个去更正,至少应根据图片类型做出一个粗略的细分,按类型替换,且部分专用合理使用依据模版本身已包含详细的依据文字。目前已有的专用合理使用依据模版和版权标签对应关系如下:
--Wcam留言) 2020年1月26日 (日) 13:45 (UTC)[回复]
@Wcam:关于之前Wcam提出的的问题,也许可以在机器人暂时更正的同时再在档案描述页中加个临时分类(例如Category:需要复检使用用途的合理使用档案之类的),那也可以把需要人手复检的档案再检视一次?廣九直通車留言) 2020年1月27日 (一) 06:10 (UTC)[回复]
不反對。那些使用{{Non-free use rationale 2}}的,遲下加個{{logo}}或類似的模板就OK,也不是一定要用專用模板。ꓢꓯꓠꓟꓳꓢꓮ 2020年1月27日 (一) 11:49 (UTC)[回复]
授權協議的種類標誌跟海報應該不會放錯,可從模板分類下手,Category:標誌Category:合理使用海報。 --Qqkuro66541留言) 2020年1月27日 (一) 16:38 (UTC)[回复]
(+)傾向支持:若技术上能实现,个人支持。Jyxyl9批判一番 2020年1月28日 (二) 12:55 (UTC)[回复]
  • 另外关于连Template:Information等可机读资料模板都没有的合理使用档案(这种我也查了不少,例如User:Galaxyharrylion这种人),会不会同时也用机器人加个维护分类,以便人手处理/删除(无来源档案)?谢谢。廣九直通車留言) 2020年1月31日 (五) 06:32 (UTC)[回复]

現時已經有千多個檔案被刪除了,是不是沒有人幫手做呢?--Wpcpey留言) 2020年11月10日 (二) 00:35 (UTC)[回复]

擱置长时间无讨论。--Q28建议大家多多关注诗佛诗魔诗瓢 2022年5月19日 (四) 04:42 (UTC)[回复]
Symbol possible vote.svg 可行,但是沒有想像這麼簡單,有些Information模板被替換引用,沒有像沒有直接對應如此簡單。 Willy1018留言) 2022年6月4日 (六) 15:40 (UTC)[回复]

罗马尼亚乡份按县分类[编辑]

是否可以帮助将分类:罗马尼亚乡份中的条目,按照分类:罗马尼亚县份分类:罗马尼亚行政区划进行分类呢?谢谢。--Aronlee90 Bashing Commies: A Good Cockroach is A Dead Cockroach. 2020年6月12日 (五) 12:25 (UTC)[回复]

@Aronlee90:其實沒懂您意思。--Hamish 2020年6月12日 (五) 12:27 (UTC)[回复]
就是罗马尼亚乡份这个内含条目过多,按照罗马尼亚的行政区划,不同的乡隶属于不同的县,所以是否可以用机器人完成把所有乡按照隶属的县的方式进行分类?比如类似这个:分类:戈尔日县乡份。--Aronlee90 Bashing Commies: A Good Cockroach is A Dead Cockroach. 2020年6月12日 (五) 12:30 (UTC)[回复]
所以是要機器人從條目中提取屬於哪個縣,然後再進行分類,對嗎?--Hamish 2020年6月12日 (五) 12:35 (UTC)[回复]
对,比如刚才那个例子,已经有template:Covasna County,里面已经分类好了,按这个就可以,参见Category:羅馬尼亞行政區劃模板。每个乡的条目内应该也有所隶属的县。--Aronlee90 Bashing Commies: A Good Cockroach is A Dead Cockroach. 2020年6月12日 (五) 12:43 (UTC)[回复]
@Aronlee90:您可以直接在縣模板加入縣分類資訊,這樣能省很多工。可參考模板:戈爾日縣, 薩馬里內什蒂鄉。 --Kanashimi留言) 2020年6月18日 (四) 14:01 (UTC)[回复]
非常感谢。--Aronlee90 Bashing Commies: A Good Cockroach is A Dead Cockroach. 2020年6月18日 (四) 14:29 (UTC)[回复]
@Aronlee90:此請求是否還有需要?-- Willy1018留言) 2020年9月14日 (一) 03:54 (UTC)[回复]
有的,您有什么好方法吗?--Aronlee90留言) 2020年9月14日 (一) 03:57 (UTC)[回复]
修改模板,例如將Template:Prahova County加入分類到羅馬尼亞普拉霍瓦縣,然後將所有聯入到此的模板含有Category:羅馬尼亞鄉份分類的於條目移除。-- Willy1018留言) 2020年9月14日 (一) 04:09 (UTC)[回复]
  • 处理中…… Willy1018留言) 2020年9月18日 (五) 04:00 (UTC)[回复]
  • (?)疑問:@Aronlee90:這是不是要依據城市、鎮、鄉進行細分?像是鄉份對應英文版布澤烏縣鄉category:Communes in Buzău County。 Willy1018留言) 2020年9月21日 (一) 02:08 (UTC)[回复]
    • 是,是需要细分,现在“罗马尼亚乡份”下面的条目有2,669个之多,最好可以按照县展开分类,如分为“普拉霍瓦縣鄉份‎”、“布澤烏縣鄉份”进行进一步细分,以便于阅览。涉及到其他定居点的,可以按照县份归类,如“罗马尼亚各县聚居地”。--Aronlee90留言) 2020年9月21日 (一) 02:18 (UTC)[回复]
  • 擱置:如果需要細分,修改模板是不合適的,長遠目標是編程,依據模板裡的城市、鎮、鄉進行細分,但我不會,故請求他人處理或是手工完成。-- Willy1018留言) 2020年9月21日 (一) 04:17 (UTC)[回复]
    还有人处理这件事吗?--Q28建议大家多多关注诗佛诗魔诗瓢 2022年5月19日 (四) 04:45 (UTC)[回复]

清理Template:Short description用法錯誤[编辑]

Template:Short description僅在英文維基中使用,若內容與維基數據相同則移除,剩下以人工檢查,彙整至維基數據。 Willy1018(留言) 2020年6月22日 (一) 06:39 (UTC)[回复]

字词转换处理[编辑]

批量转换音乐录影带为“音樂錄影帶”,已知简体版本会使得Module:CGroup/Music中的相关项无法正确转换。--百战天虫留言

  • 請問簡體的音乐录影带在簡體中文中是沒有使用的嗎? 在錄影帶條目的轉換是录影带,在音樂錄影帶的轉換是音乐录像,Module:CGroup/Music則是音乐视频,wikidata是音乐影片。-Zest 2020年7月22日 (三) 00:17 (UTC)[回复]
    • “音乐录影带”一般是台湾那边的讲法吧,大陆通常说“音乐视频”。--百战天虫留言) 2020年7月22日 (三) 04:34 (UTC)[回复]
      • 建議先送WP:VPD後再申請任務。-Zest 2020年7月22日 (三) 08:09 (UTC)[回复]
擱置长时间没有回复--Q28建议大家多多关注诗佛诗魔诗瓢 2022年5月19日 (四) 04:47 (UTC)[回复]

把{{coord}}的信息转移到wikidata[编辑]

大家好!我最近建立了不少北京通州的条目,并且放上了坐标。发现地图无法显示。原因是地图的数据来源是wikidata。请问能否帮忙把我创建的条目的坐标批量转移到wikidata,并且将条目原有模板的坐标删除(删除后,模板会自动使用wikidata的数据)。如果可以,也可以把所有条目都这样处理。--維基小霸王留言) 2020年12月16日 (三) 07:48 (UTC)[回复]

擱置 久无回应。--Q28建议大家多多关注诗佛诗魔诗瓢 2022年5月19日 (四) 04:44 (UTC)[回复]

希望以機器人自動維護中國大陸行政區劃條目及相關數據[编辑]

  1. 我偶爾會發現一些中國大陸行政區劃條目有錯誤,例如「Talk:永安坝水库#請問下面這兩個條目是否相同」,其問題出於中國大陸國家統計局數據更新,但維基這邊沒跟上。
  2. 又用模板語法產生的消歧義頁面也會出錯,例如梅岭镇條目,此條目中一個有連結一個沒有是我刻意作的對比,梅嶺鎮 (詔安縣)修復後因為連結正確可以正常顯示,梅嶺鎮 (南昌市)則因連結到重定向的維基數據頁面而出錯),想請問有沒有可能自動化維護,謝謝大家。--迴廊彼端留言) 2021年4月16日 (五) 15:06 (UTC)[回复]
這一系列當初是Liangent花費心力處理的。您可提交互助客棧以獲得更廣泛的可行性、實際運作機制是否要大幅改版的討論。 --Kanashimi留言) 2021年4月16日 (五) 22:00 (UTC)[回复]
@Kanashimi:感謝您的回應,我先前有在技術客棧提起過,因為無人回應,我想說這是純粹技術問題就拿過來了。前者我不確定有沒有可能,但後者單純把維基數據重定向頁修正為直連應該是必要而且可行性高,要不是我之前有碰過相關模板,看到沒實際消歧義功用、又沒辦法直接調整的頁面還真的會傻眼,何況這類條目甚多(單單此頁面上級分類Category:三字中国镇名消歧义就有兩千多個,還有鄉名、二字、四字等等)根本無法以人力一一檢查,所以採用機器人處理恐怕是唯一有效解法。
又方便的話也希望@Liangent:瞭解一下相關狀況,並處理Gerrit:667374,謝謝辛苦。--迴廊彼端留言) 2021年4月17日 (六) 14:13 (UTC)[回复]
這邊是覺得現在的運作機制不易維護。假如想方便修改,可能得改變運作機制。不過這傷筋動骨非常麻煩,也還沒想出什麼好的運作機制。--Kanashimi留言) 2021年4月17日 (六) 21:39 (UTC)[回复]
行政区划的变动往往需要人工判断,尤其是一些冷门的区划调整,根据现有资料难以开展机器人维护,建议驳回此案。不过我倒是建议可以开一个行政区划错误反馈的计划页面,以收集错误报告。—MintCandy♫ 欢迎参加浙江专题 台州专题 2021年4月18日 (日) 01:16 (UTC)[回复]
@MintCandy:后面这个提议不错。--Hamish with w. 2021年4月25日 (日) 23:34 (UTC)[回复]
感謝各位回應,我本來是想說看有沒有什麼辦法自動定期取得中國大陸國家統計局那邊的數據(例如用網址檢查各地區代碼是否存在?),並即時更新,如果有技術困難就算了。不過也想請各位討論一下我的提案二,這種修復重定向的機器人之前已有,只是我不確定能不能做到跨維基計畫的層級。--迴廊彼端留言) 2021年4月26日 (一) 07:24 (UTC)[回复]
刚刚花了半个多小时,大概是摸透了这个模板的运作机制,自动定期取得数据是可行的,但是即时更新似乎有点不太行,因为如果存在变动,需要人工判断是不是同一个行政区划,毕竟官方那边只给你变动前后的数据,而不会给其对应之前的数据是哪个,如果要改,用机器人改,就只能光更新prc admin list那边的数据,而无法跟条目内做到更新,其本质上是一样的,就算能够自动检测引用了废弃区划代码的页面,亦是需要人工去做修改,而达不到自动更新的目的,除非国家那边能给出对应差异,或者有人能够坚持人工维护,不然这个提案基本不会成功。--Hamish with w. 2021年4月28日 (三) 00:27 (UTC)[回复]
@迴廊彼端:另外您的第二条是指做这类更改吗?--Hamish with w. 2021年4月28日 (三) 00:32 (UTC)[回复]
@Hamish:謝謝辛苦,雖說有這樣的限制,但對於使用大量模板建立的條目(例如永安坝街道)還是挺有助益的,建議至少可以透過機器人定時更新列出「引用廢棄代碼的頁面」清單,甚至可以進一步分省讓各省主題小組去處理。
第二部份確實是做類似的修改沒錯,不過 wikidata-original-name 參數我在想要不要動,因為 Wikidata 那邊規定標籤「不放主空間條目名稱中的消歧義括號」,帶括號的名稱未來可能仍須修改。--迴廊彼端留言) 2021年4月28日 (三) 01:38 (UTC)[回复]
@迴廊彼端:第一个如果是要建立这种清单分类也可以,我可以尝试着做,而且应该也能做得出(我不鸽的话lol),第二个嘛,已经在做了,但是我只会修改wikidata这个参数,wikidata-original-name我的想法是目前先不动,之后再说。--Hamish with w. 2021年4月28日 (三) 01:43 (UTC)[回复]
@Hamish:那真是太棒了,建議第一個清單可以採取類似User:Cewbot/需要修正的跨語言連結的格式不要用分類,不然分類一次只能看兩百個有點麻煩;第二項我與你想法相同,期待您的成果:)--迴廊彼端留言) 2021年4月28日 (三) 02:22 (UTC)[回复]
相關討論: 維基百科:互助客棧/條目探討#中国乡级行政区模板的严重问题! --Kanashimi留言) 2021年11月28日 (日) 07:36 (UTC)[回复]

添加{{lang}}模板[编辑]

希望能在https://zh.wikipedia.org/wiki/Special:%E7%94%A8%E6%88%B7%E8%B4%A1%E7%8C%AE/Trymybestwikipedia 這些頁面中加入{{lang}}模板──以上未簽名的留言由Jonathan5566討論貢獻)於2021年5月9日 (日) 02:48‎加入。

请求自动为已上新闻动态的条目的讨论页添加{{ITNtalk}}模板[编辑]

请问各位维基人,是否可以自动为上了新闻动态的条目的讨论页添加Template:ITNtalk{{ITNtalk}}模板。谢谢大家!——Zzhtju留言) 2021年5月16日 (日) 13:19 (UTC)[回复]

@Zzhtju 每一則新聞往往有多個連結,難以判斷應該是哪個文章該標上這個模版。有的時候甚至有兩個以上的文章需要標此模板,例如2021年11月8日。 --Kanashimi留言) 2021年11月28日 (日) 07:30 (UTC)[回复]
已经上新闻动态的条目,不是已经确定到底哪个或者哪些条目是主要新闻动态的条目了吗?就是加粗的那个。--Zzhtju留言) 2021年11月29日 (一) 11:31 (UTC)[回复]
看起來並不是所有申請都採用{{Itn}}... e.g., 維基百科:新聞動態候選/存檔/2018年10月 --Kanashimi留言) 2021年11月29日 (一) 11:54 (UTC)[回复]
能麻烦您解释一下吗,我没太看懂。--Zzhtju留言) 2021年11月29日 (一) 13:16 (UTC)[回复]
假如所有新聞動態申請都採用了相同的格式,那機器人就能很容易做出判斷。但假如採用的是複雜的格式,可能就涉及必須解析wikitext的問題。雖不是不可能,但這樣的機器人比較容易出錯,並且會複雜得多。--Kanashimi留言) 2021年11月29日 (一) 20:57 (UTC)[回复]
那请问为最通用相同的格式的添加也不太现实吗,另外请问一下2018年10月的存档格式好像也没有区别。--Zzhtju留言) 2021年11月30日 (二) 04:15 (UTC)[回复]
不曉得Jimmy-bot存檔的時候為什麼要展開模板。由於格式較紊亂,這邊沒打算動手。--Kanashimi留言) 2022年6月23日 (四) 23:28 (UTC)[回复]

使用Template:文物保护单位替换Template:四川省文物保護單位Template:重慶市文物保護單位[编辑]

前者1391个页面,后者421个页面,累计1812个页面。

溫泉寺为例,修改前的效果见现状,修改后的效果如右侧所示:

温泉寺
重庆市文物保护单位
所在北碚区澄江镇北温泉內
分类古建筑
时代明代、清代
编号1-53
登录2000年9月7日
保护历史
1962年2月18日 重庆市文物古迹保护单位
1992年3月19日 重庆市文物保护单位(市级)

要点:保留最后一个模板(即当前的保护等级),其余模板内容转入保护历史,初定名单相当于征求意见稿,以最终公布的正式名单为准,无需列入。重庆早年为省辖市(相当于地级市),后来是直辖市,省辖市级文物保护单位相当于市级,直辖市级文物保护单位相当于省级,为作区分,可在原省辖市级文物保护单位后括注(市级)。

--猫猫的日记本留言) 2022年1月16日 (日) 07:44 (UTC)[回复]

使用条目中的Speciesbox中的数据,自动整理Category:植物小作品中的条目至子分类[编辑]

如题。只整理有Speciesbox的条目。--GUT412454留言) 2022年2月12日 (六) 13:04 (UTC)[回复]

把WebCite链接替换为Wayback Machine链接[编辑]

WebCite下线了,其保存的网页不能查看了,显示报错信息“DB Connection failed”。--Txkk留言) 2022年4月16日 (六) 09:26 (UTC)[回复]

地铁相关条目用词不当替换[编辑]

近期创建的一些地铁条目,当中出现了“于2019年12月25日开业”字眼。地铁不应使用“开业”字样,而应该使用“开通”字样。故申请将其替换为“于2019年12月25日开通”。--Q28ꓐꓰ ꓧꓮꓑꓑꓬ~建议大家多多关注诗佛诗魔诗瓢 2022年5月28日 (六) 12:30 (UTC)[回复]

加註:香港地區詞更多使用「通車」而非「開通」。近期通車的港鐵東鐵綫過海段媒體報道當中,使用「開通」千餘則使用「通車」七千餘則,若是處理可考慮同時處理地區詞。--西 2022年5月31日 (二) 16:09 (UTC)[回复]
Symbol merge vote.svg 須經討論 2014年就有人写“开业”。应讨论后逐一而非批量替换。“开业”的确怪怪的。开通、通车等不错,不过是否会牵扯到隧道打通、试车、试运营等歧义概念?“投入营运”的说法可能不错,或者“通车运营”。--YFdyh000留言) 2022年6月3日 (五) 04:20 (UTC)[回复]

大型歌唱選秀節目[编辑]

請求批量移除(insource:大型歌唱選秀節目)中的大型二字。該字詞明顯違反中立性方針,且被多次加入。 長遠建議設立過濾器。--1233 T / C 2022年6月2日 (四) 18:46 (UTC)[回复]

Symbol merge vote.svg 須經討論依據機器人方針上下文有關的修訂:「機器人不應以全自動方式進行上下文有關的修改。這類修訂應於人類編輯的監督下進行。...或社群同意該任務在不受監督的情況下運行(如回退某人的所有編輯,不論好壞),則屬例外。」故請至互助客棧討論後再提請。-- Willy1018留言) 2022年6月4日 (六) 15:35 (UTC)[回复]
  1. 先前讨论。个人赞成移除,但全自动恐怕做不到。搜索结果似乎不稳定,"大型歌唱"约60个。星动亚洲 (真人秀节目)“大型偶像养成类真人秀节目”、"大型选秀节目"等类似。"大型谈话" 3条。
  2. 其实未尝找不到来源或某些定义,但这种修饰词主要目的应该还是宣传。“央视大型节目制作中心”“北京广播电视台新闻中心大型节目组”。
  3. 题外话,"中型购物中心""大型购物中心"是否因存在某些明确定义、通常是规模而非宣传性而豁免?但定义也并不统一、可能不可靠,并仍有宣传性。[1]按面积,[2]按租户数量,且两者非可靠来源。--YFdyh000留言) 2022年6月4日 (六) 15:54 (UTC)[回复]

更新COVID-19数据[编辑]

请求使用机器人更新Template:COVID-19 data/data,英文版机器人的源码在meta:User:TolBot/Task 5#Source,只需微调即可用于中维。--BlackShadowG Slava Ukraini! 2022年6月5日 (日) 13:35 (UTC)[回复]

Symbol neutral vote.svg 已有機器人处理Wikipedia:机器人/申请/TolBot/5 Willy1018留言) 2022年6月10日 (五) 10:24 (UTC)[回复]

同步SPI中监管员的查核结果[编辑]

目前本站依赖监管员进行用户查核,而监管员查核完毕(或拒绝查核)后的结果并不会自动显示在本站的SPI相关请求页面,长期以来需要其他用户进行搬运。如果有一个可以同步监管员查核处理结果的机器人,岂不是很好。

机器人应监听m:SRCU页面的修订,如果一发修订由监管员做出,且修改了CU request模板的status参数,获取该监管员在请求末尾添加的处理结果,并添加到其在本地所对应的SPI请求页面(对应章节的)末尾。SPI请求页面可以从对应请求的discussion参数中获取(某个permalink -> 某个页面),怎么判断对应章节没想好怎么做。 Stang 2022年6月5日 (日) 23:51 (UTC)[回复]

( ✓ )同意,我研究一下如何寫這個。--西 2022年6月9日 (四) 14:05 (UTC)[回复]
是否可以翻譯過來?如果照貼過來,那還不如靠「人」翻譯。 Willy1018留言) 2022年6月10日 (五) 10:22 (UTC)[回复]
@Willy1018:我接了之後忘了註明一下。Wikipedia:机器人/申请/LuciferianBot/4。--西 2022年6月22日 (三) 01:39 (UTC)[回复]

更新中国大陆各省、市、县人口以及GDP数据,目前很多还停留在2015年[编辑]

数据库来源已找到:https://www.hongheiku.com ,想请会代码的朋友帮忙编写,本人不会写代码 --以上未簽名的留言由Occocc08討論貢獻)加入。

该网站非可靠来源--YFdyh000留言) 2022年6月8日 (三) 03:22 (UTC)[回复]
http://www.stats.gov.cn/ 这个权威--Occocc08留言) 2022年6月8日 (三) 03:27 (UTC)[回复]
我认为可以通过更新模板来进行更新。
我先建立一个Draft:Template:中国各地区人口,并把国家统计局第七次全国人口普查报告的信息加入进去。对于各市、县、区的人口,应当参照各地区统计局的网站并加入。
由于本人不会加入参数、然后显示不同于参数的内容:
  • 比如模板输入“北京”、“万”和“2”,显示“2189.31万人”
  • 就算读了模板相关指引也一样不会
希望其他人帮助。--XYY23330121 2022年6月8日 (三) 03:46 (UTC)[回复]
省一级的更新不难因为数量不大,市县级的量太大人工很难完成--Occocc08留言) 2022年6月8日 (三) 07:33 (UTC)[回复]
试着继续阅读了一些指引,比如Wikipedia:LUA。写出了一个不能运行的东西。
请各位帮忙查错。--XYY23330121 2022年6月9日 (四) 06:02 (UTC)[回复]