本页使用了标题或全文手工转换

用户代理

维基百科,自由的百科全书
跳转至: 导航搜索

计算机科学中,用户代理英语:User Agent)指的是代表用户行为的软件(软件代理程序英语Software agent)所提供的对自己的一个标识符。例如,一个电子邮件阅读器就是一个电子邮件客户端,而在会话发起协议(SIP)中,用户代理的术语指代的是一个通信会话的所有两个终端[1]

在很多场合,用户代理作为一个主从式架构的分布式计算系统中的通信所用网络传输协议客户端而行为。特别是在超文本传输协议中指定要求发起请求的客户端软件要使用一个“User-Agent”请求表头,即使在客户端不由用户操纵的时候。SIP协议(基于HTTP)沿用了这一用法。

用户代理识别[编辑]

当一个软件在一个网络协议进行操作时,它通常向它的operating peer提交一个特定的字符串来标示自己,该字符串通常包含了其应用程序类型、操作系统、软件供应商……等等,有时还会包含软件修订版本等信息。在HTTP、SIP以及SMTP/NNTP[2]协议中,这个识别是通过user-agent头字段传送的。
网络机器人英语Internet bot,例如网络抓取工具,通常也会在用户代理的字符串中包含bot的操纵者的联系信息,例如一个URL或一个电子邮件地址,以便网站管理员可以用来联系操纵者。

在HTTP中,User-Agent字符串通常被用于内容协商,而原始服务器为该响应选择适当的内容或操作参数。例如,User-Agent字符串可能被网络服务器用以基于特定版本的客户端软件的已知功能选择适当的变体。

通过使用robots.txt文件的可以设置网络抓取工具对网站的部分访问与否,而其设置标准之一就是用户代理字符串。换句话说,借由robots.txt文件的设置,可以让网站不能被特定的浏览器访问。

可能隐私问题[编辑]

与许多其它HTTP请求标头一样,在User-Agent字符串内的信息构成了客户端发送给服务器的信息的一部分,由于该字符串可以因用户不同而有很大程度的差异。[3]

格式[编辑]

根据Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content.第5.5.3章和Hypertext Transfer Protocol -- HTTP/1.1第14.43章,用户代理的格式如下:

  • User-Agent = product *( RWS ( product / comment ) )

例如你的产品叫做WikiBrowser,你的用户代理字符串就可能是WikiBrowser/1.0 Gecko/1.0。“最重要的”产品组件被最先列出。这个字符串的部分如下所示:

字符串 说明
WikiBrowser/1.0 产品名称和版本
Gecko/1.0 排版引擎和版本。

但不幸的是,在浏览器大战期间,很多网络服务器的配置只给被识别为某些版本的Mozilla的客户端发送需要高级功能的网页。

因此,绝大多数网页浏览器使用的User-Agent值如下:

  • Mozilla/[version] ([system and browser information]) [platform] ([platform details]) [extensions]

例如,iPad上的Safari使用的就是下述:

Mozilla/5.0 (iPad; U; CPU OS 3_2_1 like Mac OS X; en-us) AppleWebKit/531.21.10 (KHTML, like Gecko) Mobile/7B405

这个字符串的组成如下:

字符串 说明
Mozilla/5.0 伪装成Mozilla排版引擎的浏览器以达到兼容
(iPad; U; CPU OS 3_2_1 like Mac OS X; en-us) 浏览器所运行的系统的详细信息
AppleWebKit/531.21.10 浏览器所使用的平台
(KHTML, like Gecko) 浏览器平台的细节
Mobile/7B405 被浏览器用于指示特定的直接由浏览器提供或者通过第三方提供的可用的增强功能。这方面的一个实例是Microsoft Live Meeting,它注册了一个扩展以使Live Meeting服务知道该软件是否已经安装上,这意味着它可以为加入会议提供一个简化的体验。

用户代理欺骗[编辑]

各种网页浏览器的流进程度在整个Web的历史上一直在变化,而且有些网站不是根据万维网联盟(W3C)或者互联网工程任务组(IETF)所制定的统一标准的方式设计,而是设计只能在特定浏览器下显示。 网站通常探测浏览器版本的代码,根据用户代理调整其页面设计。换句话说,在流进程度不高的浏览器上,即使它们可能有能力处理它,不会收到较复杂的内容,更甚者,在极端情况下,拒绝全部内容[4]。因此,有很多浏览器有伪装或欺骗其标识字符串的功能,让服务器发送不同的内容。例如,Android上的浏览器识别自己为Safari以增加兼容性。[5]

其它HTTP客户端程序,如下载管理器离线网页浏览器,通常有能力更改用户代理字符串。

垃圾邮件机器人英语Spambot网络爬虫经常使用假的用户代理。

在网页设计师中流行“任何浏览器可见”[6],鼓励开发者设计网页时,能让网页在任何浏览器都能有一样好的浏览结果。

用户代理欺骗的结果之一是可能令收集到的网页浏览器的使用分布不准确。需要注意,用户代理欺骗可能违反某些法律法规、损害他人利益[7]

用户代理嗅探[编辑]

用户代理嗅探(User Agent sniffing)指的是网站在特定用户代理下查看时展示不同内容的技术。在互联网上,这将导致在特定浏览器下浏览某些网页时显示的是截然不同的站点。这方面一个有用的例子是Microsoft Exchange Server 2003的Outlook Web Access功能。当在Internet Explorer 6(或更新版本)查看时,比起在任何更旧浏览器中的相同页面,会有更多功能被显示,因为旧的浏览器无法渲染相同内容[来源请求]。用户代理嗅探大多被认为是不好的做法,因为它鼓励浏览器特定的设计而且由于无法识别的用户代理标识而惩罚新的浏览器。相反,W3C推荐创建标准的HTML标记,[8]允许在尽可能多的浏览器下正确的渲染,且测试特定的浏览器特性而不是特定浏览器版本或品牌。[9]

专门针对手机的Web站点,如NTT DOCOMOi-mode或者沃达丰Vodafone live!英语Vodafone live!门户网站,通常严重依赖于用户代理嗅探,由于移动浏览器通常相互之间差异巨大。在最近几年中,[何时?]在移动浏览领域已作出了很多发展,然而很多并不拥有这些新技术的旧的手机仍然在被广泛使用。所以,手机门户网站经常依赖用以浏览它们的手机种类而产生而产生截然不同的标记代码。这些差异可以很小,如,调整某些图像的大小以适应更小的屏幕,或者相当大,如,以WML渲染网页而不是XHTML

加密强度表示法[编辑]

在美国创建的网页浏览器,如Netscape NavigatorInternet Explorer,在用户代理字符串中使用字母U, I和N以指定加密强度。直至1996年,美国政府允许了通过长于40位密钥的加密被出口为止,供应商推出不同浏览器版本,各自具有不同加密强度。“U”代表美国(为具有128-位加密的版本);“I”代表国际—浏览器具有40-位加密且可以在全世界任何地方被使用—而“N”代表(事实上)“没有”(没有加密)。[10]随着出口限制的解除,绝大多数供应商支持了256-位加密。

参见[编辑]

参考[编辑]

  1. ^ RFC 3261, SIP: Session Initiation Protocol, IETF, The Internet Society (2002)
  2. ^ Netnews Article Format. IETF. November 2009: sec. 3.2.13. RFC 5536. 
  3. ^ Peter Eckersley. "Browser Versions Carry 10.5 Bits of Identifying Information on Average", Electronic Frontier Foundation, 27 January 2010. Retrieved 25 August 2011.
  4. ^ Burstein complaining "... I've been rejected until I come back with Netscape"
  5. ^ 存档副本. [2011-08-09]. (原始内容存档于2011-08-06). 
  6. ^ "Viewable with Any Browser" campaign
  7. ^ 乐视浏览器有意更改UA被判构成不正当竞争. 人民网. 中国知识产权报. [2017-10-17]. 
  8. ^ Pemberton, Stephen. W3C Markup Validation Service. W3C. [2011-10-18]. 
  9. ^ Clary, Bob. Browser Detection and Cross Browser Support. Mozilla Developer Center. Mozilla. 10 February 2003 [2009-05-30]. 
  10. ^ Zawinski, Jamie. user-agent strings (obsolete). mozilla.org. 1998-03-28 [2010-01-08]. 

外部链接[编辑]