Google 翻译
| 此條目需要更新。 (2017年7月9日) |
网站类型 | 翻譯網站 |
|---|---|
| 语言 | 778p(~100) |
| 持有者 | |
| 创始人 | |
| 网址 | translate.google.com(國際版)translate.google.cn(中國版) |
| 商业性质 | 是 |
| 注册 | 否 |
| 推出时间 | 2006年4月28日(统计机器翻译)[1]
2016年11月15日(神经机器翻译)[2] |
| 现状 | 活躍 |
Google翻譯(英語:Google Translate)是一項由Google於2006年開始提供的翻譯文段及網頁的服務。[3]與其他網站巴別魚、美国在线及雅虎使用SYSTRAN引擎不同的是,Google使用自己開發的翻譯軟件。至2015年6月,Google翻译稱每天需要處理超過1000億筆字詞[4]。2016年,Google翻譯正式引入Google神經機器翻譯系統。截至2021年3月,僅英語和拉丁語之間的翻譯之外,其他語言翻譯均引入Google神經機器翻譯系統[5]。
Google翻譯提供即時翻譯功能(即時輸入即時翻譯),使用者可以在左邊的輸入欄位輸入文字,翻譯結果會即時在右邊的結果框顯示。將鼠標移到翻譯結果文字上可以看到其對應的原文。此外,Google翻譯亦提供朗讀功能(包括原文和譯文),使用者亦可查看日文的羅馬字、漢字的漢語拼音,甚至韓文羅馬字表記法等等。
與其他自動翻譯工具類似,Google翻譯亦有其自身功能侷限。雖然用戶可以通過其幫助來大致理解以外文書寫的文章大意,但Google翻譯服務無法提供準確的譯文,也不能提供可用於出版的內容,例如,它經常會不依據上下文來翻譯詞彙,而且會在翻譯時不遵守語法規則,這是因為其機器翻譯算法與傳統的基於語法分析的算法不同,採用的是基於統計分析的算法。而Google翻译的质量也与语种有关,当源语言是一种欧盟语言,而目标语言是英语时,往往质量较好。2010年的分析显示,法语到英语的翻译相对準確[6],2011年和2012年的分析显示意大利语到英文的翻译同样相对準確[7]。2021年,加州大学洛杉矶分校医学中心(UCLA Health)的一項研究表明,英語翻譯至西班牙語的準確率有94%,英語翻譯至亞美尼亞語的準確率只有55%[8]。然而,当所翻译的文本较短时,其他规则法机器翻译(rule-based machine translation)却表现得更好,这在中文到英语的翻译中尤为明显[6]。
使用较广泛的语言都有“朗读”功能,对多中心语言而言,朗读采用的口音取决于所在地区,例如:
- 英语:美洲、亚太(香港、马、新除外)及西亚大多使用美国英语(女声),其餘均用英国英语(女声),但澳洲、新西兰和诺福克岛使用一种特殊的大洋洲口音(女声),印度使用印度口音(女声)。
- 法语:除加拿大使用魁北克口音(女声)外,其餘大部分地區使用标准欧陆口音(女声)。
- 西班牙语:美洲(除美国)使用美洲西班牙语(女声),其餘大部分地區使用卡斯蒂利亚西班牙语(
女声,已改成男声)。 - 标准汉语:繁体使用國語(女声),简体使用普通话(女声)。
- 葡萄牙语:除葡萄牙使用本国口音(女声)外,其餘大部分地區使用聖保羅口音(女声)。
孟加拉语:除印度使用印度口音(女声)外,其餘部分地區使用声孟加拉国口音(男声)。(已改成與印度相同的女聲)
方法[编辑]
Google翻譯採用的翻譯方法稱作“統計機器翻譯”,具體而言,採用的是基於Franz-Josef Och參加2003年美國國防部高級研究項目局(DARPA)的機器速度翻譯競賽時獲獎的研究成果。Och現在領銜Google機器翻譯小組。
根據Och的說法[9],若想要開發一個可用於翻譯一對全新語言對的統計機器翻譯系統,必須做好如下的數據基礎蒐集才能有保障:一個擁有百萬的單字數量級別的雙語文本語料庫(或者其平行庫集合),以及屬於這兩種語言的單語語料庫,各自得擁有十億以上的單字。然後,用於翻譯這一對語言的機器翻譯結果就會通過這些數據產生的統計模型而得出。
為了獲取這種海量容量的語言學資料,Google採用了聯合國文檔作為語料庫內容來源。[10]由於同樣的一份聯合國文檔通常會有屬於六種聯合國官方語言的譯本,因此,Google如今就擁有了一個相當於經人工翻譯了兩百萬單字的七種語言的語料庫。
而這一點很可能就是Google翻譯之所以一開始專注的是開發英語和阿拉伯語、中文之間的翻譯系統,而非英語和日語或英語和德語這兩對語言之間的翻譯系統的原因。因為阿拉伯語和中文屬於聯合國六種官方語言,而日語、德語不是。
翻译语言[编辑]
目前Google支持翻译108种语言(若將中文繁簡體視為不同的"語言",則為109種"語言")。
2008年5月以前(按开始提供的时间顺序排列)[编辑]
2008年9月25日开始[编辑]
2009年1月30日开始[编辑]
2009年6月19日开始[编辑]
2009年8月25日开始[编辑]
2010年1月25日开始[编辑]
2010年5月13日开始[11][编辑]
2010年9月25日开始[编辑]
2011年6月21日开始[13][编辑]
2012年2月22日开始[编辑]
2012年9月开始[编辑]
2013年4月开始[编辑]
2013年5月开始[编辑]
2013年12月开始[编辑]
2014年12月开始[编辑]
2016年2月开始[编辑]
2020年3月开始[编辑]
正在开发的语言[编辑]
这些语言还没有被Google翻译支持,但在翻译社群中有提供。[16]
- 阿萨姆语
- 粤语
- 切罗基语
- 宗卡语
- 瓜拉尼语
- 库尔德语(索拉尼),也称中库尔德语。
- 罗曼什语
- 西西里语
- 塔玛哲特语(tzm)
- 藏语
- 沃洛夫语
- 阿法尔语
- 阿拉贡语
- 博杰普尔语
- 博多语
- 布列塔尼语
- 车臣语
- 恰蒂斯加尔语
- 吉汤加语(Chitonga,尚比西語 Zambezi)
- 吉大港语
- 卢欧语
- 迪维希语
- 多格拉语
- 迪尤拉语
- 伊多语
- 埃菲克语
- 埃桑语
- 丰语
- 嘉华语
- 哈里亚纳語
- 伊努克提图特语
- 卡姆巴语,Kikamba (基坎巴语)
- 基库尤语
- 林加拉语
- 卢巴加丹加语
- 摩揭陀语
- 曼尼普尔语
- 马尔瓦里语
- 米南佳保语
- 黑山语
- 莫西语
- 尼日利亚皮钦语
- 尼瓦尔语
- 北萨米语
- 北索托语
- 奥克语
- 奥罗莫语
- 邦板牙语
- 萨德里语
- 萨莫吉提亚语
- 塞拉诺语
- 茨瓦纳语
- 亚维语
- 南恩德贝莱语
- 苏贾普尔语
- 刚果斯瓦希里语(民主刚果,swc)
- 提格雷尼亚语
- 卢巴開賽语(Luba-Kasai,西盧巴語 Western Luba,齊鲁巴語/奇卢伯语 Ciluba/Tshiluba)
- 文达语
- 瓦尔哈迪-那加普里语
- 聪加语
- 茨瓦语
- 桑塔利语
- 克什米尔语
計劃开发的语言[编辑]
停止开发的语言[编辑]
- 卢欧-阿乔利语(Luo)(Acholi 阿乔利语)
- 奥里贝什文(2015年11月推出,2016年2月删除)
有朗读服务的语言[编辑]
机械朗读[编辑]
人声朗读[编辑]
女声
- 阿拉伯语
- 丹麦语
- 德语
- 俄语
- 法语
- 菲律宾语
- 芬兰语
- 高棉语
- 古吉拉特语
- 菲律宾语
- 荷兰语
- 捷克语
- 卡纳达语
- 罗马尼亚语
- 孟加拉语(印度)
- 缅甸语
- 尼泊尔语
- 挪威语
- 葡萄牙语
- 日语
- 瑞典语
- 僧伽罗语
- 斯洛伐克语
- 泰卢固语
- 泰米尔语
- 泰语
- 泰卢固语
- 土耳其语
- 泰卢固语
- 乌尔都语
- 乌克兰语
- 西班牙语(美洲口音)
- 希腊语
- 匈牙利语
- 印地语
- 巽他语
- 印尼语
- 爪哇语
- 英语
- 越南语
- 中文
男声
整合[编辑]
瀏覽器[编辑]
划取翻译功能是现代浏览器的重要基础功能,翻译的集成意味着打破文化壁垒,Opera和Firefox的翻译插件亦是利用谷歌翻译API作为扩展程序的核心外部接口。不过当下许多浏览器厂商,在浏览器大战背景下,出于激烈竞争,已经做出了一站式服务,例如Windows10中自带的MicrosoftEdge,微软专门为此定制了浏览器插件版的微软必应翻译。
字典軟件[编辑]
开发者可以利用谷歌提供的API,对软件集成联网翻译功能。这些软件通常是通过集成翻译功能,实现对原有用途的用户需求满足,所完善而来。例如阅读软件、在线资料搜索时集成的WebJS小程序,由于信息技术的普遍应用和入口之争以及成熟度,目前已不再有着垄断地位,也就不存在增加翻译功能需要收费或是插广告,除非是态度问题,否则一般会作为硬性标准。
掌上翻译程序/电子词典[编辑]
当今智能手机和平板电脑平台上,亦有很多基於Google翻譯而衍生成的翻译软件。不但在今日动则几十M的软件膨大趋势下做到了体积小巧,而且可以下载离线字典调用,甚至可以翻译屏幕上光标停按的部分。
于中国大陆之现状[编辑]
2014年5月31日起,Google所有服务(各个IP段)在中国被大规模干扰至今[19],但因为翻译及地图网页版服务有域名后缀为.cn的入口,并且使用了专门设立在中国境内的服务器和IP地址,所以翻译及地图网页版仍然能正常服务。
2017年3月29日起,中国大陆用户可以直接使用Google翻译(手机版)而不需要使用代理。在此之前,翻译需使用代理而无法直接翻译,但下载离线翻译包后可使用离线翻译进行翻译。[20][21]
逸事[编辑]
Google翻译曾经内置有一个小彩蛋,在输入特定文字后让程序朗读,可以输出Beatbox的效果。[22]目前该彩蛋已经移除。
爭議[编辑]
谷歌翻譯有些名字存在人名翻譯的問題,例如把輸入的英語文本翻譯成中文文本,黃瑾瑜(Nigel Ng)被翻譯為「奈杰尔·吴」(黃的閩南語泉州腔跟吳的粵語類似),黃明志(Namewee)被翻譯為「納威」,駱家輝(Gary Locke)被翻譯為「盖里·洛克」等。
參見[编辑]
參考資料[编辑]
- ^ Orch, Franz. Statistical machine translation live. Google Research Blog. April 28, 2006 [December 1, 2016].
- ^ Turovsky, Barak. Found in translation: More accurate, fluent sentences in Google Translate. The Keyword Google Blog. November 15, 2016 [January 11, 2017].
- ^ Google Translate. [2019-01-24]. (原始内容存档于2016-02-14).
- ^ 世界滿溫情~Google日翻1千億字 翻最多的竟是我愛你. ETtoday新聞雲. 2015-06-24 [2015-06-27]. (原始内容存档于2019-12-11).
- ^ See which features work with each language. [July 9, 2017].
- ^ 6.0 6.1 Comparison of online machine translation tools. (原始内容存档于2011-02-10).
- ^ Microsoft Bing Translator and Google Translate Compared. [2013-08-29]. (原始内容存档于2013-11-07).
- ^ 谷歌翻译大型翻车现场:请服用“反坦克导弹”来缓解疼痛.
- ^ 於2005年機器翻譯峰會上的主旨演講
- ^ 存档副本. [2009-01-06]. (原始内容存档于2021-01-18).
- ^ Five more languages on translate.google.com. Google. 2010-05-13 [2010-10-11]. (原始内容存档于2016-05-27) (英语).
- ^ Veni, Vidi, Verba Verti. Google. 2010-09-30 [2010-10-11]. (原始内容存档于2020-11-09) (英语).
- ^ Google Translate welcomes you to the Indic web. Google Translate Blog. [2020-10-10]. (原始内容存档于2020-12-30).
- ^ Tutmonda helplingvo por ĉiuj homoj. Google. 2012-02-22 [2012-03-17]. (原始内容存档于2016-03-05) (英语).
- ^ 时隔四年,谷歌翻译新增5种支持语言:维吾尔语在列. IT之家. 2020-02-27 [2020-03-21]. (原始内容存档于2020-03-21).
- ^ Translate Community: Help us improve Google Translate!. [2016-06-07]. (原始内容存档于2017-09-15).
- ^ https://www.kamloopsthisweek.com/online-petition-asks-for-cree-language-to-be-added-to-google-translate-1.24284888
- ^ https://www.huffingtonpost.ca/entry/google-translate-cree-indigenous-language_ca_6035242ac5b67c329620c3e3
- ^ Google透明度報告(資訊公開報告). Google. 2014-05-31 [2014-07-08]. (原始内容存档于2017-05-15).
- ^ 不翻墙也能用了 谷歌翻译优化了中国用户体验. [2017-03-29]. (原始内容存档于2017-03-30).
- ^ 等了八年!谷歌这项重磅服务今天终于可以用了!. [2017-03-29]. (原始内容存档于2017-03-30).
- ^ Aamoth, Doug. Check Out This Google Translate Easter Egg. Time. [2019-09-25]. (原始内容存档于2018-05-04).
外部链接[编辑]
- Google Translate (页面存档备份,存于互联网档案馆)(英文)
- Google Translate on Google Play(页面存档备份,存于互联网档案馆)
- Google Translate on App Store (页面存档备份,存于互联网档案馆)
- Google translate, statistical machine translation live(页面存档备份,存于互联网档案馆)
- Teach You Backwards: An In-Depth Study of Google Translate in 103 Languages(页面存档备份,存于互联网档案馆)
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|