維基百科机器人

维基百科:机器人/申请

维基百科,自由的百科全书
跳转至: 导航搜索
快捷方式
WP:BRFA
WP:RFBOT
WP:RFBA

在未獲批准之前就使用機械人可能會被封禁。

You may be blocked for running a bot without approval.

  • zh: 本維基允許使用全局机器人。您可向監管員申請使用此類機械人的權限;而其他機械人的申請則須於下方提出(新申請請置於頁底)。
  • en: This wiki conforms to the standard bot policy, and allows global bots. You can ask for permission of such bots from stewards. Other bots must be requested below. Please add your request at the bottom of this page.
  • BOTREQ記號模板

申请机器人 Request for bot status


Antigng-bot 3[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2015年9月10日 (四) 14:58 (UTC)
  • 程式語言C,自动
  • 用途:在主名字空间中 [[:en:XXX|YYY]] -> {{link-en|YYY|XXX}},[[:en:XXX]] -> {{link-en|XXX|XXX}}
  • 編輯時段及頻率:不定
  • 每天受影響頁面:大量
  • 遵守Bots模板不相关,只在主名字空间工作
  • 於其它語言所獲權限:
  • @Antigng:同时也应该考虑[[YYY]]([[:en:XXX|XXX]])和[[YYY]]([[:en:XXX]])的情况。--GZWDer留言) 2015年10月5日 (一) 12:29 (UTC)
    • @GZWDer:,这在技术上可以实现,但必须是[[YYY]]紧跟着([[:en:XXX]]),否则我没有信心保证不误判。--Antigng留言) 2015年10月5日 (一) 12:34 (UTC)

Antigng-bot 6[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2015年10月1日 (四) 02:05 (UTC)
  • 程式語言C,自动
  • 用途:操作系統->作業系統 作业系统->作業系統 ->作業系統
  • 討論內容連結: Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項
  • 編輯時段及頻率:依赖于网速,一般不超过每分钟2200页面
  • 受影響頁面:共500
  • 遵守機器人規範不相关
  • 於其它語言所獲權限:
    • 测试结果见此。--Antigng留言) 2015年10月1日 (四) 04:06 (UTC)
      • 是特指处理这个词吗?请不要用机器人做错别字修正,google:"自动作业系统"Liangent留言 2015年12月13日 (日) 16:38 (UTC)
        • [1]--Antigng留言) 2015年12月14日 (一) 00:38 (UTC)
          • 那么这样,[2]2624(提示26,实际计数只有24)个结果,其中有若干个不是“操作系统”的含义。对于此项只同意编辑FreeBSDMS-DOS多线程行動作業系統深度操作系统内核错误IBM AIXIfconfigBc (编程语言)Windows Nashville对Internet Explorer的批评格式化C (消歧義)D (消歧义)Smartisan T1科摩多网络安全套装夏語遙FL Studio魔法科高中的劣等生用語列表PunBBLiangent留言 2015年12月15日 (二) 03:16 (UTC)
          • 再说一下,我原来只是想说这个“作业系统”明显会有较高的误触发率,我不认为对这样的词自动替换会很适合。我一直觉得MW的搜索有时(很)不靠谱,既然你觉得搜索靠谱那我就按搜索结果解读吧:(1)24个结果中有4个不是,1/6的错误率我觉得挺高了,不应当开机器人工作;(2)只有20个条目需要改,手动看着一个个改一下就改完了没必要费劲申请了开机器人。Liangent留言 2015年12月15日 (二) 03:26 (UTC)
            • 操作系統->作業系統,那一项非常多。我认为一次处理超过100个条目就需要申请了。--Antigng留言) 2015年12月15日 (二) 04:28 (UTC)
              • 操作系統得问繁体使用者,看有没有叫“操作系統”的其他常见东西。Liangent留言 2015年12月15日 (二) 05:22 (UTC)
                • 还有,人工把zhwiki下下来查源码做不到。我现在处理一个1MB的条目大约耗时0.04秒,zhwiki有30GB,这样全读一次就要20分钟,如果要做一些复杂的检查时间会更长,数据还不是实时的,根本不现实。--Antigng留言) 2015年12月15日 (二) 10:08 (UTC)
                  • 我是“就按搜索结果解读”,你认为搜索结果能包含全部内容(否则不会用搜索结果证明站内没有“自动作业系统”一词,虽然我也不知道到底有没有),那么人工操作的步骤就是执行搜索然后对搜索结果中列出的20个页面进行修改,而不是把30GB全读一遍。Liangent留言 2015年12月15日 (二) 23:21 (UTC)
                    • 我只是在讨论如果不用搜索结果该如何寻找相关页面。你之前有给我留言:“另外如果要大批检查源码,去[28]下载文件后本地查,以及,在Labs上有公共的这些文件,在/public/dumps/public/zhwiki”--Antigng留言) 2015年12月16日 (三) 00:40 (UTC)
                      • 所以你现在到底是不是用搜索的……Liangent留言 2015年12月16日 (三) 06:15 (UTC)
                          • 早写的程序用搜索,不想改了,晚写的不用。--Antigng留言) 2015年12月16日 (三) 06:45 (UTC)

顺便多说一句,有时这种繁简错的很可能是侵权的文本,来源是第三方写的内容,作者使用了机器转换并把转换结果贴上来。Liangent留言 2015年12月15日 (二) 03:31 (UTC)

Antigng-bot 7[编辑]

Antigng-bot 8[编辑]

给个清理的网址列表吧,我之前想做,一直没心情整理。Liangent留言 2015年11月11日 (三) 02:21 (UTC)
@Liangent:,几十个网址,比较多的:
  1. big5.xinhuanet.com
  2. big5.cri.cn
  3. big5.china.com
  4. big5.ifeng.com
  5. www.voafanti.com
  6. big5.huaxia.com
  7. big5.chinabroadcast.cn
  8. big5.cctv.com
  9. big5.cntv.cn
  10. big5.southcn.com

我这个程序只查http(s)://.../gate/big5/ 形式的,也不需要这个表。--Antigng留言) 2015年11月11日 (三) 15:16 (UTC)

  • (※)注意,还有反过来转码的网关,测试结果有错,新测试。--Antigng留言) 2015年11月12日 (四) 04:24 (UTC)
    • 小心过度清理……Liangent留言 2015年11月14日 (六) 05:44 (UTC)
      • @Liangent:,这些页面中的问题网址列在User:Antigng-bot/url。为避免过度处理,已忽略url中带q=cache的和带http:/的--Antigng留言) 2015年11月15日 (日) 13:16 (UTC)
        • @Antigng:某些網站會用像「http://big5.example.com/gate/big5/about.htm」一樣存放網頁,一經User:Antigng-bot處理過後像「http://about.htm/」,但「http://about.htm/」出現HTTP 404之類的錯誤--林勇智 2015年11月22日 (日) 08:34 (UTC)

Antigng-bot 10[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2015年12月2日 (三) 09:54 (UTC)
  • 程式語言C
  • 用途:移除页面中连续的三个值为-30 -128 -142 -114的字符
  • 編輯時段及頻率:不详(不知道这类页面的占比)
  • 受影響頁面:不详
  • 遵守機器人規範不相关
  • 於其它語言所獲權限:
    • 测试编辑:[4]。我不知道这三个字符连在一起代表什么,但是好像不显示,也影响搜索功能。--Antigng留言) 2015年12月2日 (三) 09:54 (UTC)
  • 此字符有功能:en:Zero-width space。虽然大部分使用都是无意,但有可能有实际使用的地方,不建议无差别全部移除。Liangent留言 2015年12月2日 (三) 10:06 (UTC)
      • 模板或内链或长度小于100字节的行中不需要换行分割,可以移除。--Antigng留言) 2015年12月2日 (三) 13:45 (UTC)
    • 其实我很好奇为什么有人编辑的时候会把这个字符放进去,是有什么浏览器或输入法会自动生成吗?Liangent留言 2015年12月2日 (三) 10:11 (UTC)
      • 如果有人要用的话也是用& #8203;的吧,像这样看不见摸不着应该不是人为加入的。--Antigng留言) 2015年12月2日 (三) 10:17 (UTC)
        • 所以我问是怎么加入的嘛……Liangent留言 2015年12月2日 (三) 10:18 (UTC)
          • 我查看了几个条目,都是很早以前加入的,在模板或内链中占绝大多数。。--Antigng留言) 2015年12月2日 (三) 13:45 (UTC)
      • 我经常会拿ZWSP替代<​nowiki>啊,比如左边这样。其实问题更大的是\u200e。参见Special:AbuseFilter/180Wikipedia: 机器人/申请/Jimmy-bot/8。--Jimmy Xu 2015年12月2日 (三) 14:56 (UTC)
        • 主名字空间里面需要这样用么?——查了一下,\u200e占比这个差不多。--Antigng留言) 2015年12月2日 (三) 15:16 (UTC)

其实我想做的是\u200e。写到labs上面的时候代码写错了。重新测试--Antigng留言) 2015年12月3日 (四) 02:21 (UTC)

Antigng-bot 11[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2015年12月10日 (四) 08:32 (UTC)
  • 程式語言C
  • 用途:修正cite 模板里面的日期
  • 編輯時段及頻率:
  • 受影響頁面:未知
  • 遵守機器人規範不相关
  • 於其它語言所獲權限:
现在哪个效果是最终版本……Liangent留言 2015年12月10日 (四) 08:35 (UTC)
测试编辑。它会尝试读取cite模板里面date,year,day,month参数,如果有年无月无日则使用year=xxxx ,如果有年有月无日则使用date=xxxx.x,如果有年有月有日按照date=xxxx-xx-xx的格式整理。尝试读取的方法见User:Antigng-bot/date。如果在这过程中有错,可以将错误信息输出,见此例--Antigng留言) 2015年12月10日 (四) 08:35 (UTC)
我的意见是:(1)不要在无关的地方做出修改,比如各处移除空格;(2)不出错的我不太想改(比如|date= 2012年6月19日->|date=2012-06-19,或者|date=2015->|year=2015,enwiki反而建议使用date),这个等等看别人意见;(3)不建议在wikitext里添加注释错误信息,有错的cite模板本身就会输出错误了;(4)你的源码太难读了,难怪那么多bug。Liangent留言 2015年12月10日 (四) 08:42 (UTC)
如果写一个month=Apr|date=2015-5-7,cite并不会输出错误。--Antigng留言) 2015年12月10日 (四) 08:47 (UTC)
这个会输出month参数未知嘛,这种不清理就是了。[5]为什么把|date=203-04-13|移除掉了;date=1999-09这类不要推定成1999年9月,这一个还好,有人2001年-2002年写date=2001-02……你也挺会利用我这边机器人清理,直接输出“.”了。Liangent留言 2015年12月10日 (四) 08:51 (UTC)
2001-2002是怎么回事,来源的产生时间还会有个范围?另外直接输出x年y月也可以。--Antigng留言) 2015年12月10日 (四) 08:55 (UTC)
[6]这里面都有一项range了,zh这边没有那么详细的指引,但明显有人会从en搬内容。就是因为这类各种可能太多,我觉得应该能不改的、不确定的尽量不改为好。我开的那个任务现在就只是如果同时year和month了把他们合并成date,如果有day了再加进去,别的都不管。你去帮我那个找茬呗,只是我后来改了些,当时跑的测试编辑有些不对了。Liangent留言 2015年12月10日 (四) 08:59 (UTC)
不管也不是个办法,所以我才想把错误信息写到注释里面,让人来清理。--Antigng留言) 2015年12月10日 (四) 09:17 (UTC)
注释既不比直接在页面上生成错误信息更可见,也没跟踪分类供逐个检查……Liangent留言 2015年12月10日 (四) 09:19 (UTC)
再挂个维护模板?--Antigng留言) 2015年12月10日 (四) 09:20 (UTC)
没必要吧,不过我个人本来就是不喜欢到处挂维护模板的。Liangent留言 2015年12月10日 (四) 09:24 (UTC)
现在不删空格和换行符了,代价是浪费了一点内存。“date=203-04-13”拿掉是因为不认为203是个合法的年份,这样就成了没年份的月和日,不输出。--Antigng留言) 2015年12月10日 (四) 11:18 (UTC)
又不是写嵌入式系统,有必要考虑那点内存嘛,别的地方占用的多了。话说203年怎么不合法了,还是之前的意见,不认识的尽量别动,尽可能保留所有原始信息以便后续人工处理。Liangent留言 2015年12月10日 (四) 11:40 (UTC)
[7] 102行,那不还在删空格呢……Liangent留言 2015年12月10日 (四) 11:43 (UTC)
解决了,但是如果你这么写:date=2015 - 6 -whatever- 8 我肯定要处理成date=2015-06-08。--Antigng留言) 2015年12月10日 (四) 12:29 (UTC)
還在競爭中......--Engle躍】 2015年12月10日 (四) 11:47 (UTC)
直到L君给我留言我才发现当天晚上他自己就写了一个,不过这两个用处不完全相同。--Antigng留言) 2015年12月10日 (四) 12:29 (UTC)
你这个基本相当于我的16+19合一起了吧,16我给的条件很严格的,基本是完全没有其他可能的才会去改。当时CS1我发现有两种主要问题要清理了,以为month/day的没啥就说放着谁爱写谁写去,后来你来说了一句问题挺大,我就动手弄了个。对我那种在框架上搭的做法,其实没几行代码……Liangent留言 2015年12月10日 (四) 12:39 (UTC)
民国记年的支持也做好了。--Antigng留言) 2015年12月13日 (日) 14:33 (UTC)
做了一个简单的工具,例如: https://tools.wmflabs.org/antigng-bot/cgi-bin/date.cgi?%E6%97%A5%E6%9C%AC --Antigng留言) 2015年12月13日 (日) 03:11 (UTC)
500。--Jimmy Xu 2015年12月13日 (日) 03:28 (UTC)
首页源码里面没cite,程序没任何输出。--Antigng留言) 2015年12月13日 (日) 03:34 (UTC)
为什么把z都urlencode了……--Jimmy Xu 2015年12月13日 (日) 03:40 (UTC)
真要命,小于号和小于等于写错了。看来我所有的程序都得重新编译一遍了。 已修复--Antigng留言) 2015年12月13日 (日) 03:46 (UTC)

Antigng-bot 12[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2015年12月13日 (日) 15:26 (UTC)
  • 程式語言C,自动
  • 用途:给最近更改中带contenttranslation标签的条目讨论页挂{{Translated_page}}
  • 討論內容連結: WP:VPP
  • 編輯時段及頻率:全天候工作。由于必须从上到下依次处理,这个程序是单线程的。
  • 受影響頁面:User:Antigng-bot/ct
  • 遵守機器人規範不相关
  • 於其它語言所獲權限:
这个应该没啥问题,但注意不要在用户反复编辑时挂上多个{{Translated_page}}。Liangent留言 2015年12月13日 (日) 16:33 (UTC)
(&)建議:在使用{{Translated_page}}时希望能够有oldid参数。虽然我人工加的时候常常因为比较懒而不加,其实应该加上的。--1=0欢迎参与WP:哲学专题 2015年12月14日 (一) 00:37 (UTC)
这里面有oidid参数,由于某些原因我无法给出测试结果。--Antigng留言) 2015年12月14日 (一) 01:17 (UTC)
感觉直接给CT交个bug更好点?--Jimmy Xu 2015年12月14日 (一) 08:25 (UTC)
不是所有语言的维基百科都有这种模板的吧。--Antigng留言) 2015年12月14日 (一) 12:09 (UTC)
至少应该可以实现嘛,搞个界面消息什么的。--Jimmy Xu 2015年12月14日 (一) 12:11 (UTC)
Jimmy的想法挺好,我做了个小工具,可以考虑设为默认,如果如此挂上模板是“必须”的话。Liangent留言 2015年12月16日 (三) 22:11 (UTC)
(?)疑問,如果一个条目有多个版本翻译自外文条目怎么处理比较好呢?能不能让{{Translated_page}}支持多个版本参数?--Antigng留言) 2015年12月17日 (四) 08:33 (UTC)
用CX较晚翻译的版本会完全覆盖早期版本,也就是说条目的当前内容只会包含最后一个来源版本的内容,我觉得直接用最后一个就行。Liangent留言 2015年12月18日 (五) 00:42 (UTC)

Antigng-bot 13[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2015年12月19日 (六) 09:19 (UTC)
  • 程式語言C
  • 用途:模板代换 infobox_people -> infobox_person Infobox; Politician Basic -> Infobox officeholder
  • 討論內容連結: WP:VPP
  • 編輯時段及頻率:不超过 100编辑/秒
  • 受影響頁面:1600 + 2200
  • 遵守機器人規範不相关
  • 於其它語言所獲權限:

Antigng-bot 14[编辑]

  • 操作者: Antigng留言
  • 提請時間: 2016年1月12日 (二) 14:58 (UTC)
  • 程式語言C
  • 用途:挂csd f6的文件,如果已被条目使用,则删除模板
  • 編輯時段及頻率:自动工作。检查的频率会高一些,但是执行操作的频率会很低
  • 受影響頁面:
  • 遵守機器人規範不相关
  • 於其它語言所獲權限:
其实这种东西让人看一下有时候能抓出来破坏。--Jimmy Xu 2016年1月13日 (三) 05:08 (UTC)