维基百科:Google搜尋和數量

维基百科,自由的百科全书
在谷歌上搜索字母“a”产生了超过120亿次的链接。但这并不能决定字母“a”的关注度,让编者单独为它写一个维基条目

谷歌搜索及其搜索结果可以帮助判断一个物品是否符合关注度指引.  

判断一个主题的关注度指引是决定一个主题是否应该有关于自己的维基百科文章的一部分。其中最大的谬误之一,就是认为仅靠谷歌搜索的结果就可以用来评估关注度。利用文章或主题的标题或关键词进行谷歌搜索,就成了所谓的“谷歌测试”。人们可能很容易的认为,仅仅因为谷歌搜索产生了大量的点击量,就认为一个主题是值得注意的,或者因为搜索产生的点击量很少而不值得注意,或者因为根本没有产生任何点击量而认为是骗局。虽然这样的搜索确实是一个非常有用的起点,但它们本身并不能决定是否符合关注度指引。

一个晦涩难懂的17年代的哲学理论,在许多广受推崇的老书中都有引用,但在谷歌搜索中可能不会出现。但是,没有Google点击率并不意味着这个理论不引人注目,也不意味着这个理论就是个骗局。事实上,根据维基百科的方针,这个理论可能是值得注意的,因为它在多个可靠来源中都有描述。另一方面,一个真人秀选手的名字可能会产生成千上万的Google点击率——粉丝聊天页面和博客文章中关于他或她的性生活的内容——但这些都不是可靠的来源

在进行普通的网络搜索时,有可能会出现大量的点击量。最有可能的是,其中大部分都不能算作可靠的来源。Google NewsGoogle BooksGoogle Scholar提供的结果更有可能是可靠的来源,但前提是这些点击率能够得到验证,并且通过阅读文章或书籍,确认这些点击率都是可靠来源。虽然所有这些可能都不能在Google网站本身就能看到,而且很多都是预览,但搜索至少可以显示出这些来源的存在。

搜索结果[编辑]

几乎所有使用电脑或手机的人都会在某些时候使用搜索引擎甚至是全平台搜索引擎。有很多种搜索引擎,如BingYahoo搜索,以及最受欢迎的Google搜索,每天估计产生54亿次的搜索请求。[1]Google使用算法根据个人偏好调整搜索引擎结果页(SERP)[2] ,除非关闭个人搜索标准,否则每个人的搜索结果不会产生原始结果,而是根据用户的偏好产生特定的结果。

谷歌搜索引擎[编辑]

除了上面列出的谷歌搜索平台(Google News、Google Books和Google Scholar)之外,还有Google Trends英语Google TrendsGoogle Maps Pack英语Local search (Internet)(谷歌本地三包业务列表)和Google Arts & Culture项目。

为什么Google的结果会产生误导?[编辑]

为什么仅仅使用谷歌搜索的数字可能会对关注度的判断产生误导(“有204,00个搜索结果”)有各种各样的原因。原始搜索结果的数字往往会被夸大,并且结果输出包含许多变量,从而产生大量的点击率。

虽然维基百科努力向世界免费提供知识,但谷歌并没有遵循公益性的商业原则,而是依赖广告。2014年谷歌数据库规模估计为10 EB(1 EB=10亿GB),现在很可能远远超过了2019年估计的615亿网页[3]左右的规模,2013年每天创造估计2.5万亿字节[4]的数据,这个数字现在很可能已经远远被低估。

广告[编辑]

几乎所有的谷歌搜索结果都遵循一个主题,那就是广告。2017年,谷歌的广告业务带来了1108亿美元的收入[5],这要归功于各种服务,如Adwords(作为拍卖系统的专有广告服务)几乎是谷歌所有的网络属性中的一部分。其也包括AdSense计划、Ad Manager和Google Ad Manager 360等。许多企业的收入完全依赖广告服务。通过Google Ads功能,企业通过竞价选择词汇(关键词)来让自己的企业在搜索结果排序中排名靠前。“谷歌搜索功能”主要分为内容类型和增强型两种。影响企业排名的一个主要因素是搜索引擎优化(SEO),大多数有网站的企业都会在一定程度上使用SEO。如果不通过个性化,那么搜索结果就会因人而异,从而给出对于维基百科的错误搜索结果。

相关性[编辑]

尽量减少大点击率或“个性化搜索结果”的方法是在搜索查询的结尾添加“&pws=0”[6]。这将“关闭”个性化搜索结果[7],如个人搜索历史、习惯、当前地理位置等个性化因素。还有其他的URL修饰符也可以使用[8]

Google搜索不是参考资料[编辑]

在页面存废讨论中,引用Google搜索Google News搜索的结果,并且说:“看看所有的结果,有你的引用来源”或“Google点击量两千次,一定很显著!”已经成为页面存废讨论中的惯例。然而,Google提供了网上能找到的一切,其中绝大部分绝不是可靠的资料来源,Google News转载了大篇幅的资料,这些资料不一定可靠,不一定与文章主题相关,也不一定与AFD关闭时还在那里(注意,在网上找到的新闻文章,即使网站停刊,完整的引用,注明作者、标题、报社名称等仍然有效。但是,一个光秃秃已经失效的网址可能会使网上的新闻源失去作用)

因此,如果使用Google找到的来源,与正在存废讨论的主题相关,很好!但要引用你找到的确切的参考文献或来源,而不是对着Google搜索的点击率数字含糊其辞,这个庞大的数字证明这篇文章的主题是显著的、可验证的、值得爬上帝国大厦的。反之亦然:不要在AFDs中争论“谷歌点击率为零,一定是不显著的”。

维基百科不是词典[编辑]

维基百科不是字典。词典的重点是词或短语,完全按照其标题进行论述,一般不会偏离这个标题。维基百科作为一部百科全书,其目的是讲述一个人、群体、地点、对象、事件或概念。其中的任何一个或多个标题或词组都可能被称为“维基百科”,而且任何这样的标题都可能有不止一种含义。虽然维基百科的每一篇文章都有一个标题,但不是标题定义主题,而是其中包含的信息定义主题。

像谷歌这样的搜索引擎关注的是单词或短语,就像一个人可能会输入的文章标题一样。例如,如果一个人想了解关于油画的信息,他/她可能会在搜索引擎中输入“油画”这两个词(引号)。这很可能会产生大量出现“油画”两个字的网站。众所周知,很多网站的点击量都是关于油画的。但查询也可能会产生这样的网站:“她在吃着橄榄油色拉,画着树的画,听着音乐。”这句话中连续出现“油、画”这几个字,因此,会在这样的Google查询中出现。但是,它与油画没有任何关系。

如果你在搜索引擎中输入“正在跑圈”这个短语,你会得到一些包含这些词的点击量,而这些词恰恰是连续的。这个句子的片段可能会出现在一个网站上,上面写着“他在当地的赛道上跑圈”。但这并不意味着应该有一篇题为“他在跑圈”的文章。

在谷歌上搜索“如果”这个常用词,会产生几十亿的点击量。在维基百科上,标题“if”并没有定义“if”这个词。相反,它导致的是一个消歧义的页面英语if,显示了一长串的主题,包括许多歌曲,碰巧被取名为“if”或首字母为IF。尽管如此,常见的if这个词的含义还是被限制在词典条目中,只能在WikiDictionary上见到。

许多术语有多种含义[编辑]

许多单词、短语和其他单词的组合都有不止一个意思。例如,“4:30”这个词对大多数人来说可以指时钟上的时间,也可以指圣经中的经文。但用这两个例子中的任何一个来写文章,都不适合用这个确切的标题。4:30的标题是一部电影的名字。并非所有的Google搜索4:30都会产生与这部电影相关的网站。尽管如此,4:30在维基百科上只是这部电影。

Astro Boy这个词有很多用途。它主要是作为一部电视连续剧而闻名,但也有一个消歧义页英语Astro Boy (disambiguation)列出了这个标题的其他用途。如果在Google上搜索这个词],不清楚有多少个结果涉及到哪个意思。

不是所有的网站都是可靠的来源[编辑]

谷歌搜索可能会产生数百、数千、甚至数百万的点击率,而这些点击率的确切标题是文章的标题,或者是由关键词衍生出的其他网页。但是,只有符合可靠来源的网站才能被用来使主题具有关注度并验证信息的准确性。其他大多数网站都不符合外部链接添加标准,更不用说引用了。

许多网站,而且往往是大多数网站都没有做到这一点。有许多网站的目的是为了销售产品或服务。维基百科不是一个广告空间,这样的网站链接将违反维基百科的广告政策。其他的网站包括博客自媒体维基百科的克隆,以及其他非中立或可验证的信息来源。

要找到真正可靠的信息来源,最好的方法不是通过谷歌搜索,而是通过谷歌新闻、书籍和学术搜索。即便如此,这并不意味着任何一个搜索结果数字都具有关注度,也不意味着在搜索中找到的所有信息源都是可靠的,无论对那篇文章还是对任何文章。尽管如此,符合标准的信息源还是比较容易找到。

不是所有的资料来源都能提供深入的报道[编辑]

即使你确实找到了一个或多个按某种标准被认为是“可靠”的消息来源,但这并不自动意味着这些消息来源足够好,可以支持某个主题。比如说,如果你想写一篇关于某条街道的文章,你可能会发现很多琐碎地提到那条街道的新闻文章,而这些文章很可能对编修其他主题很有帮助。当然,Googling一下就能找到这些文章。它们甚至可以帮助佐证另一个主题的关注度。但是,由于这些琐碎的提及,它们并不能给这条街带来关注度。

页面存废[编辑]

页面存废讨论中显示文章值得保存的理由时,指出“点击率”列表并没有错。如果寻找他人帮助打捞文章,这其实是个好主意,但仅凭Google搜索结果并不能成为保留的理由。

三个最好的来源[编辑]

比简单地列出谷歌搜索点击率更好的方案是找到三个最好的来源英语WP:THREE,这三个来源都是可靠的,提供独立深入英语WP:SIGCOV的报道。贴出这些或把他们添加到文章中。

列举Google搜索结果[编辑]

看完之后,可能有人会认为,把谷歌搜索的结果罗列在存废讨论中是一件坏事。其实完全不是这样的。列出它们实际上可能有助于挽救一篇文章不被删除。最好的做法可能是,将该搜索取消个性化或以原始搜索结果输出。虽然Google的结果通常不会决定或打破这种情况,但它们可能会对其他人做出必要的改进,以挽救文章不被删除,或者仅仅是同意去做应该做的事情。

提供Google结果列表的编者自己可能无法进行必要的改进。这样做是不需要的。但是,其他人看到这些结果,可能就能解决这个问题,甚至提到这些更具体的来源,即使他们自己没有添加来源(见WP:HASREFS英语WP:HASREFS)。

参见[编辑]

参考资料[编辑]

相关链接[编辑]