维基百科讨论:字詞轉換處理/公共轉換組

维基百科,自由的百科全书
跳到导航 跳到搜索

關於公共轉換組[编辑]

--1k1p3 (留言) 2009年6月11日 (四) 10:56 (UTC)

最近閱讀了一些七龍珠人物的條目,發現這些條目掛的NoteTA模板內容重複甚多,似乎可以公共轉換組代替。海賊王類條目也是一樣。可是我已經複製好要轉的字詞,卻不知道要如何建立新轉換組(Template:CGroup/doc沒有提到如何建立)。請問有什麼快捷的方式可以建立新轉換組嗎?我印象中先前有逛過某個有建立新轉換組的按鈕的頁面,可是名稱早就忘記了。請問是那個名稱?--RekishiEJ (留言) 2009年5月20日 (三) 04:07 (UTC)

我是在条目中先输入{{noteTA|G1=XXXX}},然后再显示预览,这样就可以在noteTA中找到创建的链接了。--菲菇维基食用菌协会 2009年5月20日 (三) 08:01 (UTC)
Wikipedia:字詞轉換處理/公共轉換組頁面中間。剛用它來創建了麻將的快速轉換初稿。—Altt311 (留言) 2009年5月22日 (五) 04:52 (UTC)

公共轉換組似乎壞了[编辑]

剛測試包括電影(Movie)和藝人(Show)兩個轉換組似乎都無法正常運作--Gonbom留言) 2012年6月26日 (二) 07:36 (UTC)

IT转换组哪个地方也有问题,导致很多条目被归入Category:公共轉換組模板···--FanglongzongT‿T 2012年6月26日 (二) 10:02 (UTC)
IT转换组的分类已用<noinclude>处理了——路过围观人士 2012年7月3日 (二) 07:10 (UTC)

分类有问题,Category:體育公共轉換組模板[编辑]

什么原因呀?--Berthe留言) 2013年1月10日 (四) 21:41 (UTC)

公共轉換組是否不會轉換分類?[编辑]

注音文這一條目使用了模块:CGroup/IT,但台灣正體模式下的分類仍顯示「網絡文化」而非「網路文化」。--KRF留言) 2016年12月26日 (一) 10:24 (UTC)

抗议把“台湾词汇-陆标正字法”和“大陆词汇-台标正字法”视作破坏的行为[编辑]

这叫强行更改他人习惯,而且是无关于百科内容的,对得起“自由的百科全书”里的“自由”两字吗?

“自由”应当允许每位贡献者以自己喜欢的方式贡献。--七个点 (留言 Flow留言 个人的黑名单) 2017年5月26日 (五) 15:35 (UTC)

在模組頁面顯示description[编辑]

我不確定在模块:CGroup/My_Little_Pony類似的模組網頁中顯示內容是否用的{{CItem}}或是其它的。在模組頁面中我經常使用description參數,但卻不會在模組頁面中直接顯示出來。例如:

{ type = 'item', original = 'Twilight Sparkle', rule = '暮光闪闪=>zh-cn:紫悦;暮光闪闪=>zh-tw:紫悦;暮光闪闪=>zh-hk:紫悦;', description = '根據「名從主人」命名原則,應統一使用「紫悦」這一官方譯名' },

這樣的代碼在模組頁面是否能顯示出:原文:Twilight Sparkle;暮光闪闪⇒大陆:紫悦;暮光闪闪⇒台灣:紫悦;暮光闪闪⇒香港:紫悦;當前顯示為:紫悦;註釋:根據「名從主人」命名原則,應統一使用「紫悦」這一官方譯名

就是模組頁面中是否能加入紅色部分?--eflyjason (留言) 2017年8月6日 (日) 14:48 (UTC)

有关于公共字词转换组的若干讨论[编辑]

最近在编辑页面时,我发现许多字词在公共字词转换组中都没有出现。并且在阅读公共字词转换组时,我感觉许多公共字词转换组列表的分类有重叠。所以同样的字词有可能会出现在多个不同的公共字词转换组中,有些字词却又没有出现在任何字词转换组中。另外,当我想要转换一个特定词汇,要在长长的转换组列表中找到我要转换的字词的时候,我觉得非常不便。所以我提出如下一些建议:

  1. 制作通过字词搜索转换组的功能,从而能够让编者方便知道某个字词出现在哪一个转换组中;
  2. 制作字词与转换组对应关系的统计功能,从而能够方便得知哪些转换组之间的内容有重叠;
  3. 撰写有关于字词转换组分类的共识或方针,并且加入字词转换组的帮助页面中,使得其他编者得以了解字词转换组的分类方式;
  4. 设置专门的字词转换组分类的兴趣小组,从而可以更加统一地管里字词转换组的分类。

在Telegram群中,我与其他的维基百科编者对此问题进行过一些简单的交流。由此也获得了不同的看法与声音:

  1. 这项工程规模浩大,人力资源不足,无法实施。
  2. 分类大多数是以“图”的拓扑学结构出现的,而并不是“树”的结构出现的,所以某些字词很难将其分类到某一个字词转换组中。

对以上的两个问题,我的思考如下:

  1. 某些人力资源不足的情况可以用插件,甚至是外部工具的方式来替代。例如“通过字词搜索转换组”的功能,就可以考虑做成TG以及IRC(举例仅供参考)的bot。有了这些工具的辅助,我相信即便对现状改善没有直接的帮助,我们也会对字词转换组这个问题有一个更加深入的了解。
  2. 关于字词分类的拓扑学结构,我想一旦我们有了一个字词与转换组目前对应关系的列表,对照列表进行探讨,我们或许会得到更好的结论。所以我个人认为在对这个问题没有一个更加深入的了解之前,要得出一个完美的分类结论是不太现实的。一旦我们对现状有了了解,我们可以根据现状,得到对条目破坏程度最小的解决方案。届时我们可以通过达成共识与方针的方式加强这套解决方案,并且通过设置兴趣小组的方式来实施这套方案。

由于我对维基百科的管理、流程、历史以及各项细节不甚了解,如有不切实际之处,或是错误之处,还望不吝指正。

感谢!

西瓜玩偶留言) 2019年11月12日 (二) 13:20 (UTC)

  • 如果想轉換個別特定詞彙,用全文轉換似乎已經足夠?--【和平至上】別人罷工是不上班,香港暴徒「三罷」是不讓人上班、要别人閉嘴💬📝 2019年11月12日 (二) 15:30 (UTC)
    • 您好,感谢您的意见。由于我个人近期编辑摩托车/电单车/机车的条目较频繁,有一些转换词汇需要在二至三篇条目中拷贝。我个人认为这样做效率有些低下、容易出错,并且需要新添加转换字词时,就需要在二至三篇条目中逐一添加。故我个人认为有一套方便的可供大家使用的全局转换组是一件方便的事情。然而我对目前的公共转换组的现状并不是非常满意,故提出以上建议。西瓜玩偶留言) 2019年11月12日 (二) 15:51 (UTC)
我曾经有过类似想法,在wmflabs上建一个项目,对所有的字词转换可以进行搜索查询。技术上应该不难实现--百無一用是書生 () 2019年11月13日 (三) 08:38 (UTC)
  • 如果分类不是树状而是图状,一般来说是分类本身有问题,可以拿来讨论修正。分类是很重要的。 --ᡠᠵᡠᡳUjui ᡠᠵᡠUju ᠮᠠᠨᡩ᠋ᠠᠨMandan 2019年11月13日 (三) 09:14 (UTC)

公共轉換組/重複字詞報告[编辑]


先前討論:Wikipedia:互助客栈/其他/存档/2019年11月#有关于公共字词转换组的若干讨论

@西瓜玩偶和平至上ShizhaoUjuiUjuMandan:做了個Wikipedia:字詞轉換處理/公共轉換組/重複字詞報告Wikipedia:字詞轉換處理/公共轉換組/各頁面包含字詞,歡迎提供建議。 --Kanashimi留言) 2019年12月2日 (一) 09:19 (UTC)

(+)支持非常感谢您的努力!我前些时间比较忙,一直没有在这方面继续跟进,没想到有人看到并且已经完成了我的想法!唯一想要提的一点是想问下这些重复的字词是从何而来呢?当时发现字词转换除了在公共转换组模块以及公共转换组模版中存在之外,还在Wikipedia的php代码中,以及全局转换组中存在。如果能再将其加入列表中的话就再好不过了!不过即便是不加入全局转换组以及php代码中的静态转换,目前的列表已经可以用来参考制定字词转换组的规则。不知@Kanashimi:阁下是否对此有初步的建议。——西瓜玩偶留言) 2019年12月2日 (一) 15:55 (UTC)
 已修复 --Kanashimi留言) 2019年12月3日 (二) 08:30 (UTC)
非常感谢!我快速地浏览了一下您的Wikipedia:字詞轉換處理/公共轉換組/重複字詞報告这个页面。我目前正在陆续零散地把我和其他一些人的意见记录在我的用户页面中,欢迎深入讨论。——西瓜玩偶留言) 2019年12月3日 (二) 16:35 (UTC)
假如放在Wikipedia:字詞轉換處理/公共轉換組的討論頁或許會更好?公共轉換組應該個包含嵌入其他公共轉換組的功能。另外 MediaWiki:Conversiontable/* 包含的詞彙有些也太偏頗了。 --Kanashimi留言) 2019年12月3日 (二) 22:16 (UTC)

Module转换组定义转换项时,能否不用填写 type = "item" ?[编辑]

目前定义转换项时,需要填写type = "item",比如:

{ type = "text", text = "=== 硬體用語 ===" },
{ type = "item", original = "computer", rule = "计算机=>zh-tw:電腦; 计算机=>zh-hk:電腦; 计算机=>zh-mo:電腦;" }, -- 大陆亦常用“电脑”,故用单向
{ type = "item", original = "memory", rule = "zh-cn:内存; zh-tw:記憶體;" },
{ type = "item", original = "port", rule = "zh-cn:端口; zh-tw:埠;" },

这样会让定义项比较长,如果后面有注释容易导致显示上换行。而且Module大部分内容都是在定义转换,所以能否考虑将type = "item"作为缺省设置,可以省略不填?就像:

{ type = "text", text = "=== 硬體用語 ===" },
{ original = "computer", rule = "计算机=>zh-tw:電腦; 计算机=>zh-hk:電腦; 计算机=>zh-mo:電腦;" }, -- 大陆亦常用“电脑”,故用单向
{ original = "memory", rule = "zh-cn:内存; zh-tw:記憶體;" },
{ original = "port", rule = "zh-cn:端口; zh-tw:埠;" },

--洛普利宁 2021年3月11日 (四) 06:14 (UTC)

建议公共转换组这样语法糖,排版整洁而不减功能。各位对格式是否有意见,比如函数名、I( 内容 )是否要留空格。--YFdyh000留言) 2021年3月11日 (四) 08:07 (UTC)
目前修改Module:CGroup/泰國人名Module:CGroup/People后未见异常。鉴于只是格式调整且易于回退,如果3日内无反对,计划手动转换当前的公共转换组模块到此格式(不含模板和重定向)。--YFdyh000留言) 2021年3月11日 (四) 12:43 (UTC)
@YFdyh000:这个太好了!PS:I会不会容易被看成小写的l?PPS:只输入一个参数时,能否视作输入参数乙?--洛普利宁 2021年3月11日 (四) 16:02 (UTC)
那就用Item,沒必要短到難以理解。另外original似乎沒有用處,應該可以改成註解以減少回傳的資料量。--Xiplus#Talk 2021年3月12日 (五) 01:49 (UTC)
original用在CGroupViewer。--Xiplus#Talk 2021年3月12日 (五) 01:58 (UTC)
用I出于local的函数必定在开头,理解不难。用Item也好。@Lopullinen:代码编辑器模式下的模块编辑器,I是等宽字体,好像不太容易看错。不太明白是省略哪个参数,请提一下例子。--YFdyh000留言) 2021年3月12日 (五) 04:44 (UTC)
@YFdyh000:original可以不填,比如{ type = "item" rule="zh-hans:大宇资讯; zh-hant:大宇資訊;" }, -- 修正過度轉换。當然這個需求不大重要,寫個公司英文名填充參數也没問題。I用Apple設備在編輯介面比較慘,但是一個字母的確有助于進一步壓縮長度。反正編輯者都是模仿抄寫的,I具體有什麽内涵也不緊要,當隨意起的名字就行;所以在想能不能换一個區分度比較大的字母(比如H)。--洛普利宁 2021年3月12日 (五) 05:28 (UTC)
Lopullinen啊对,想过这个情况(但后来忘了),值得考虑一下。T的区分度较高,但因字形就改用语义更模糊的T可能不合适,以及应不需要极力压减长度。H感觉更晦涩难懂了。1. 单加一个R或者Rule函数?2. 用if判断如传入""。3. Item(nil, "zh-...."), 就可以了,例子见Module:CGroup/Les_Misérables。--YFdyh000留言) 2021年3月12日 (五) 05:54 (UTC)
YFdyh000那Item就好。(爲什麽我不習慣首字大寫,不過無所謂了)--洛普利宁 2021年3月12日 (五) 06:08 (UTC)
您一提醒也感觉不符常见的命名法。但小写有点像变量,大写开头也整齐,所以还是首字母大写吧。--YFdyh000留言) 2021年3月12日 (五) 06:28 (UTC)
試驗了下,看{{CGroupViewer}}似乎是OK的。另外CSS能不能把目錄搞成每個二級目錄换一行?想用{{horizontal TOC}}壓縮目錄長度,結果又做的太超過了。--洛普利宁 2021年3月12日 (五) 18:19 (UTC)
感觉不容易调出令人满意的效果。模块:CGroup/Games/sandbox/doc当前这样吗,感觉还是挺乱的。如果二级标题有合适前缀,次级标题有缩进,可能更好一些。--YFdyh000留言) 2021年3月12日 (五) 20:02 (UTC)
YFdyh000模拟分号/冒号语法那样的样式吗? 感觉没啥好办法--洛普利宁 2021年3月12日 (五) 20:07 (UTC)
安排了冒号。标点旁有奇怪的空格没解决。如果用顿号,四五六...级标题的显示效果会变奇怪,得另修。规则暂未预防影响其他目录。--YFdyh000留言) 2021年3月12日 (五) 20:35 (UTC)
這樣挺好了。標題文字本身也太長,我還需要縮短一下。--洛普利宁 2021年3月12日 (五) 20:40 (UTC)
────────────────────────────────────────────────────────────────────────────────────────────────────@Lopullinen:如果您希望改目录版式,建议新开一个话题,方便继续讨论。--YFdyh000留言) 2021年3月16日 (二) 01:50 (UTC)
YFdyh000不确定有多少转换组是一堆二级目录带一堆三级目录的。小转换组目录本来就没几个。ITMusic等的大转换组是按ABCDEFG分的,普通的{{horizontal TOC}}也够用。怀疑这种目录格式都没有什么泛用性……--洛普利宁 2021年3月16日 (二) 04:31 (UTC)
做個記錄:有些機器人可能會用到,例如咱家的(e.g., Wikipedia:字詞轉換處理/公共轉換組/*)。如果真要處理,麻煩最後請統一所有相關頁面,這邊才好重寫程式。 --Kanashimi留言) 2021年3月13日 (六) 00:36 (UTC)
@Kanashimi:应该是都搞定了,模板保护的Unit和IT组提交了编辑请求。Unit和Medicine组多加了一个ItemD函数。WP:CGROUP我加了一些说明。过程中遇到没想过的desc属性,不过用的不多。以及original后置等写法,总之现在改成一样了,考虑过是否{o:''}之类的简写,但这样简写就不好读、意义不大了,也很容易语法出错。快弄完才想起AWB,不过我估计AWB不能提示语法出错。如果大规模,也可以JSLT提取。用到的部分正则表达式见注释。--YFdyh000留言) 2021年3月16日 (二) 01:42 (UTC)
@YFdyh000:直接統一成這樣好了,會更簡潔且不用特殊處置:
local function Item(o, r, d) 
    return { type = 'item', original = o, rule = r, desc = d };
end
這個語法糖應該要寫入說明文件中(已完成),要不然有人又創造了其他用法,cewbot就讀不懂了...(cewbot採用JavaScript來解析lua。這邊基本上必須以JavaScript重寫所有函數,包括 Item()。) --Kanashimi留言) 2021年3月16日 (二) 08:59 (UTC)
Module:CGroupViewerModule:NoteTA都沒有看到使用desc的地方,究竟在哪?--Xiplus#Talk 2021年3月16日 (二) 10:29 (UTC)
原先就有的……memo用? --Kanashimi留言) 2021年3月16日 (二) 11:08 (UTC)
看起來可以用註解代替就好。--Xiplus#Talk 2021年3月16日 (二) 12:20 (UTC)
@YFdyh000:若無其他考量,例如必須在某個地方呈現描述,或許就改成註解即可?  --Kanashimi留言) 2021年3月16日 (二) 21:23 (UTC)
我没意见。印象中很久以前MediaWiki:Gadget-noteTA.js可以为规则追加自定义描述,但没能找到相关代码,可能早已失效。--YFdyh000留言) 2021年3月16日 (二) 22:03 (UTC)
看起來似乎沒有其他意見。那就改了。 --Kanashimi留言) 2021年3月19日 (五) 06:48 (UTC)
目前可以使用這份AWB設定檔進行批量替換。--Xiplus#Talk 2021年3月19日 (五) 09:14 (UTC)
@Kanashimi:格式以Module:CGroup/Medicine作為範本行嗎?--Xiplus#Talk 2021年3月23日 (二) 10:25 (UTC)
OK --Kanashimi留言) 2021年3月23日 (二) 10:36 (UTC)
已全數按此範本轉換完成。--Xiplus#Talk 2021年3月26日 (五) 08:10 (UTC)
说起来,电子游戏专题先前有人在问为什么NoteTA早就变成模块实现了,仍然还有转换组不超过10个、单独项目不超过30个的限制。我看这个限制能否有办法去除? --Milky·Defer 2021年3月17日 (三) 16:30 (UTC)
@MilkyDefer:所以这个限制体现在哪里?--YFdyh000留言) 2021年3月18日 (四) 12:32 (UTC)
@YFdyh000Module:NoteTA#L-59Module:NoteTA#L-90--Milky·Defer 2021年3月18日 (四) 12:36 (UTC)
目前模块:NoteTA应该是转换组和规则是各`for` 30个。赞成作软限制,例如应用100个规则、20个组,对超过50个规则和10个组的条目各列一个维护分类(如NoteTA转换组过多的页面、NoteTA转换规则过多的页面)以维护和整合规则。--YFdyh000留言) 2021年3月18日 (四) 12:47 (UTC)

能否將「新冠肺炎、新冠病毒、新冠疫苗」納入繁簡自動轉換或轉換組?[编辑]

根據WP:CC19,已經明文規定條目內文是不能使用「新冠肺炎、新冠病毒、新冠疫苗」的,不過目前看到還有許多條目大量使用(如:2019冠狀病毒病中國大陸疫情2020年3月中國),手動轉換也耗時,能不能將「新冠肺炎、新冠病毒、新冠疫苗」列入繁簡轉換的行列?--Nrya留言) 2021年5月22日 (六) 17:49 (UTC)

繁簡轉換並非用作修正,而且極有可能導致過度轉換,故不支持。--【和平至上】💬 2021年5月22日 (六) 19:42 (UTC)
那寫入轉換組呢?--Nrya留言) 2021年5月23日 (日) 03:28 (UTC)
附議。不知為何現在有不少編者希望使用轉換來修復錯誤/瑕疵/格式問題。--Yangwenbo99 2021年5月23日 (日) 08:58 (UTC)
同上,有過度轉換的問題。之前我留意到中國大陸用戶很活躍地進行手動替換,那就證明用戶逐個條目手動替換不是艱難的工作,因此好像也沒有納入繁簡自動轉換或轉換組的必要。SANMOSA Σουέζ 2021年5月24日 (一) 00:52 (UTC)
  • 這不就走回頭路了嗎。--Temp3600留言) 2021年5月24日 (一) 03:55 (UTC)
  • 用AWB轉換即可---Koala0090留言) 2021年5月25日 (二) 09:15 (UTC)