维基百科:大语言模型
此頁是關於人工智能、大型語言模型產生內容的論述,不是维基百科的核心方针或指引。 此頁僅代表部分编者关于社羣規範或維基百科的觀點,尚未得到充分共識。有些论述得到社群中多数编者的认同,而有些只代表少数编者的意见。 |
| 本頁簡而言之:大语言模型创作的内容不应当直接作为条目内容、来源使用,也不应当用于直接与人沟通,用它辅助编辑维基百科时要人工复核并主动披露。 |
| “ | 大語言模型的可靠性、理解力、還有知識範圍,都是有限的。因此,人必須要監督其產出。 | ” |
| ——麥可·奧斯本, 牛津大學的機器學習专业教授[1] | ||
大語言模型(又称大型語言模型,简称LLM)是使用人工神經網路生成文字的電腦程式,其中又以ChatGPT、Gemini、豆包最为常见。这类工具既可以帮助我们完成很多日常工作,又可能因为其自身缺陷,给他人带来困扰。
在日常讨论中,很多人会使用“AI”或“聊天机器人”之类的说法,本文主要讨论其文字内容部分。如无特殊说明,本文所说“LLM”或“大语言模型”,也包括这类常称为“AI”的文字生成工具。
虽然大语言模型发展若干年,看起来已经可以像人类一样思考和表达,然而,在维基百科,编者应当保持严谨的态度,遵守方针指引,让大语言模型在不危害百科全书权威性、不扰乱站务的前提下发挥它应有的价值。
相关内容方针
[编辑]可靠来源、非原创研究、可供查证
[编辑]维基百科条目不得包含原创研究,即未发表的事实、争论、觀點、推论和想法。以及对已发表材料进行的未发表分析、综合或总结,并产生或暗示新的结论。为了证明您未添加原创研究,您必须能够引用可靠的、已发表的来源。这些来源应该与条目主题直接相关,并直接支持所呈现的材料。
写入维基百科的内容须要能被读者在可靠来源中得到验证。维基百科不发表原创研究,其中收录的内容需要有既已发表的材料作为依据和支持,而不能仅由编辑者认定“真实正确”。编辑者应为条目中的内容及其引用提供可靠来源,否则,这些内容可能被移除。
| “ | 簡而言之,生成式AI輸出的「幻覺」和偏見源於其訓練資料的性質、工具設計著重於基於模式的內容生成、和人工智慧技術的固有限制。隨著生成式AI系統日益融入各領域的決策過程,承認並應對這些挑戰至關重要。 | ” |
| ——"When AI Gets It Wrong", MIT Sloan School of Management, AI basics[2] | ||
大语言模型虽然思维模式已经很接近人类,但其本质上仍然是基于概率的电脑程序。它能像人类一样思考,是因为学习了大量来自互联网网站和线下文献的各种内容,而这类内容鱼龙混杂,有经典著作,也有一般讨论和垃圾内容。因此大语言模型可能会生成“看似一本正经,实则胡说八道”的内容。在用户持续诱导下,大语言模型甚至有可能为了响应用户而生成荒谬或虚构的内容,例如让一个安全机制不足的模型去论述“吃玻璃渣子对健康的好处”,模型可能真的会帮你写出一篇“学术著作”。另外美國技術雜誌《快公司》測試ChatGPT時,要求它產生一篇有關特斯拉上一個財務季度的新聞文章,結果產生出來的數據全部錯誤。[3]
基于以上原因,大语言模型生成的内容不能视为可靠来源。另外也很可能属于原创研究——由机器代替人类发表的原创研究。
大语言模型生成的内容,除了来源不可靠和原创研究问题之外,还可能违反了可供查证方针。生成的内容中,其参考文献可能是虚构的,线上链接点进去是404页面,而线下的参考文献,可能到了图书馆找到这本书之后才发现是子虚乌有。
中立的观点
[编辑]所有维基百科条目以及其他百科式内容必须以中立的观点书写,在尽可能没有任何偏见的前提下,平等地表达出任何曾在可靠来源中发表过的重要观点。
大语言模型生成的内容,在語調方面可能看似中立,实质上可能带有偏见。这种偏见可能并非来自语气本身,而是编者以非中立方式提问、模型本身未能按照中立观点来平衡材料或者模型被设定了政治正确的安全机制。在中华人民共和国,还可能因为网络审查,其模型本身就带有强烈的政治立场。這個問題在生者傳記方面尤為迫切。
侵犯著作权
[编辑]您为维基百科所贡献的任何资料都将依照知识共享 署名-相同方式共享 4.0协议(CC BY-SA 4.0)和GNU自由文件授權條款(GFDL)公开发行。因此如果您有意参与的话,您必须授权使用该许可证,那意味着: - 您拥有该材料的版權,譬如您是该材料的原创作者,或
- 您通过某种允许使用CC BY-SA 4.0的渠道取得该材料,例如该材料属公有领域(in public domain)或者该材料本身就是在与CC BY-SA 4.0兼容的条款下发行

大语言模型生成的内容可能侵犯著作权。目前各国对模型生成内容的版权认定情况并不统一。虽然维基百科所遵守的美国法律认定版权只保护“人类作者的原创作品”,但由于编者添加内容情况复杂,难以认定是否完全没有人类作者参与,因此维基百科社群常采用保守的做法,即默认版权状态不明。
合适与不合适用法
[编辑]维基百科依赖志愿者来贡献、审核和修改各类内容,这需要耗费大量人力。一个行为良好的编者,应当尽力保证自己编辑的质量,避免给他人带来麻烦,更要避免因自己问题而让他人“收拾残局”。因此,如果利用LLM辅助编辑,应确保自己的编辑不会给他人增加额外负担。
建议做……
[编辑]了解大语言模型缺陷
[编辑]编者应充分了解大语言模型的各类局限性,包括但不限于:
- 在专业领域可能会生成看似权威,实则漏洞百出的内容,其参考文献也可能是“幻觉”而非真实文献。
- 在争议问题上,模型可能会迎合用户的立场,给出不中立的回答。
- 受原始语料和模型机制的局限,模型往往难以把握一些复杂事务的全貌,例如事件背景、沟通语境,以及观感、语气等非文字信息。
- 维基百科是大语言模型训练材料的一部分,正如维基百科条目不能以维基百科作为来源那样,维基百科也不应该以大语言模型内容作为来源。
- 维基百科高度重视版权,而目前大语言模型生成内容的版权仍处于争议状态。
如果编者不够充分了解这些缺陷,又缺乏相关领域知识,那么很可能难以察觉问题,陷入大语言模型生成内容的“陷阱”,可能还会引发他人对编辑能力的质疑。
仅仅作为辅助工具
[编辑]编者应当明确大语言模型的定位:只是辅助工具,绝不能代替自己思考和动笔。
由于AI发展迅速,其能力已经足以胜任很多日常工作。在人工充分介入并承担最终责任的前提下,完全可以靠机器来减轻一些负担,例如:
- 修饰语句、检查语法、检查常识错误等;
- 帮助理解、总结复杂材料,协助消化参考文献、维基站内讨论等复杂内容;
- 利用大语言模型形成大纲,为自己进一步完善提供灵感或角度;
- 处理一些机械的操作,例如改写文字、生成表格等;
- 让模型就复杂问题提出建议,为自己提供决策思路,但绝不能代替自己判断;
- ……
英語維基百科編者Rory Jaffe在線上報紙《The Signpost》表示極為反對使用大型語言模型編寫条目,但提出一個例外,表示大型語言模型產生的內容可以作為一個基本条目結構/輔助工具,然後再慢慢去找來源編寫。[4]
人工逐字逐句复核
[编辑]大语言模型经常会有这样一种现象,就是内容“看起来非常合适”,但藏在其中的个别字句是事实错误的,而且外行很难看出。因此,如使用大语言模型的内容,务必逐字逐句地复核。
如果不希望将精力花在复核上面,那么建议自己动脑思考,用自己的话复述,AI生成内容仅仅用来启发思路,绝不拿来复制粘贴。
主动披露编辑
[编辑]如使用大语言模型工具编辑时,應當於编辑摘要标记使用的工具。可以的話,最好标明其版本。这适用于所有命名空间。
在英文维基百科,曾經有人提案將「披露大语言模型输出的编辑」提升至正式方针,虽然社群無法就詳細的揭露格式、方法与后续行動等程序方面的细节達成共識,导致未能成案,然而编者对“應當披露使用大语言模型的編輯”观点本身是认同的。英文维基百科及中文维基百科都曾出现因滥用AI工具而被封禁或禁制的案例。
建议不要做……
[编辑]不要直接用模型输出写条目
[编辑]有些编者看到大模型输出内容,觉得内容写的不错,于是不加思索或稍加修改,就直接将内容粘贴到条目当中。然而这种行为很容易被有经验的用户识别出来,而且,由于前述大模型的缺陷,在条目加入未经严格审查的内容,可能会将不可查证甚至真实错误的内容加入到条目中。相关编辑可能会被巡查人员回退。情节严重时,可能会被视为破坏或扰乱行为。
为了负责任地进行编辑,请勿直接将大模型输出内容粘贴到条目中。
不要用模型输出内容沟通
[编辑]绝对不应该直接用大模型输出内容与他人沟通!
在部分人看来,AI生成内容已经属于令人不适的内容。如果连自己的表达都是机器输出,更会被社群普遍认为缺乏基本的尊重——既然如此,那我们为什么还要和您沟通,而不是直接和机器沟通呢?
滥用大模型进行沟通,不仅容易引发他人反感,甚至可能会因为扰乱而导致自己被禁言。
如果本人认为自己因沟通或表达能力不足,希望借助大语言模型的帮助,可以考虑以下做法:
- 参考AI工具给出的意见,但所有回复内容都是自己亲自思考和编写的;
- 坦诚地表达自己的困难。如需附上相关内容,应避免直接把模型输出当作自己的发言,并避免因留言篇幅过长影响他人阅读。
不要在自己不熟悉的领域使用大语言模型
[编辑]前面已经提到,大语言模型内容需要人工逐字逐句复核,而进行复核的前提是,编者有足够的知识和能力去驾驭它们。
对于一个不熟悉物理的编者,他虽然可以很容易生成一篇看起来可靠的物理条目,但他会很难发现其中潜藏的错误。对于一个不熟悉编程的编者,他可以很容易用大语言模型来生成程序代码,但是他也会因为缺乏编程经验,难以保证程序不会产生副作用。
因此不要在自己不熟悉的领域使用大语言模型。
不要在未经许可情况下高速编辑
[编辑]如果未经许可,请勿利用大语言模型进行机器人式编辑(WP:MEATBOT)。在条目命名空间内利用大型语言模型协助高速编辑,会导致其他编者难以巡查和复核,增加大量站务负担。
请勿在维基百科条目空间测试大语言模型编辑。如有技术研究需求,请利用沙盒、用户空间或测试维基等不影响正常百科全书运行的方式测试。
如果发现了疑似大语言模型生成的内容……
[编辑]条目
[编辑]對於疑似由大型語言模型由所產生的內容,先檢查是否有真实來源證明。
如果确实可供查证,可以协助补充来源、清理文字、修正語氣[a]。
如果沒有,可考虑:
- 回退到历史版本
- 将生成内容直接移除,并建议在编辑摘要、条目讨论页或作者讨论页说明原因
- 或者掛上{{AI-generated}}或{{fact}}模板。
如果条目的所有版本均存在问题,可以選擇以下作法:
沟通与讨论
[编辑]如果有人用大语言模型生成的内容与人沟通,建议提醒其用更加适当的做法表达。如果因AI生成内容影响了正常讨论,可使用{{Collapse AI top}}、{{Collapse AI bottom}}将其隐藏。
对于濫用大语言模型的用戶,可以考慮以{{Uw-ai1}}與{{Uw-ai4}}的警告模板警告。
附注
[编辑]參考來源
[编辑]- ^ Smith, Adam. What Is ChatGPT? And Will It Steal Our Jobs?. Context. Thomson Reuters Foundation. 2023-01-25 [2025-10-05].
Large language models have limited reliability, limited understanding, limited range, and hence need human supervision.
- ^ When AI Gets It Wrong: Addressing AI Hallucinations and Bias. MIT Sloan Teaching & Learning Technologies. [2025-05-25] (美国英语).
In short, the “hallucinations” and biases in generative AI outputs result from the nature of their training data, the tools’ design focus on pattern-based content generation, and the inherent limitations of AI technology. Acknowledging and addressing these challenges will be essential as generative AI systems become more integrated into decision-making processes across various sectors.
- ^ How to trick OpenAI’s ChatGPT
- ^ en:Wikipedia:Wikipedia Signpost/2023-02-20/News and notes#AI takeoff begins: the first wave of bullshit