Apertium
Apertium是一个机器翻译平台,由西班牙政府和加泰罗尼亚自治政府拨款支持阿利坎特大学开发,为一个以GNU通用公共许可证条件发行的自由软件。
Apertium原是OpenTrad (页面存档备份,存于互联网档案馆)计划中其中一个机器翻译引擎,原意为关系密切的语言之间互相翻译。不过现在Apertium已经发展到可以为分野较大的语言之间翻译。要创立一套新的语言翻译系统,只需将有关语言的相关资料,即字典与文法规则,放入既定的XML格式便可。
阿利坎特大学与维戈大学、加泰罗尼亚理工大学、 Pompeu Fabra大学合作,Apertium现已有下列语言的相关资料:西班牙中的罗曼语族语言如西班牙语、加泰罗尼亚语和加里西亚语、英语、葡萄牙语、法语、奥克西唐语以及罗马尼亚语。
Apertium是一种转化原则法的机器翻译系统。字词翻译时会用有限状态置换器,词性辨别时会用隐马尔可夫模型。
Apertium目前(2020年12月)的稳定版本支持51组语言之间的互相翻译。[1]
历史
[编辑]Apertium起源于项目OpenTrad中的其中一个机器翻译引擎,该项目由西班牙政府资助,由阿拉贡大学的Transducens研究小组开发。它最初设计用于在密切相关的语言之间翻译,但最近已经扩展到处理更多的语言对。若要创建新的机器翻译系统,你只需要以良好规定的XML格式开发语言数据(字典,规则)。
为此开发的语言数据目前支持(稳定版本)阿拉伯语,阿拉贡语,阿斯图里亚斯语,巴斯克语,布列塔尼语,保加利亚语,加泰罗尼亚语,丹麦语,英语,加泰罗尼亚语,世界语,法语,加利西亚语,印地语,冰岛语,印尼语,意大利语,哈萨克语,马其顿语,马来西亚语,马耳他语,北萨米语,挪威语,奥克西唐语,葡萄牙语,罗马尼亚语,塞尔维亚克罗地亚语,斯洛文尼亚语,乌尔都语和威尔士语。
项目参与了2009,[2] 2010,[3] 2011,[4] 2012,[5] 2013[6]和2014[7]年版的Google Summer of Code及 2010,[8] 2011,[9] 2012,[10] 2013,[11] 2014,[12]2015[13]及2016[14]年版的Google Code-In。
相关条目
[编辑]- 机器翻译应用软件的比较
- 机器翻译
- Matxin
参考资料
[编辑]- ^ Apertium. wiki.apertium.org. [2020-12-21]. (原始内容存档于2021-01-13).
- ^ Accepted organizations for Google Summer of Code 2009. (原始内容存档于2016-04-25).
- ^ Accepted organizations for Google Summer of Code 2010. (原始内容存档于2016-04-04).
- ^ Accepted organizations for Google Summer of Code 2011. (原始内容存档于2016-04-01).
- ^ Accepted organizations for Google Summer of Code 2012. (原始内容存档于2016-04-03).
- ^ Accepted organizations for Google Summer of Code 2013. (原始内容存档于2016-04-03).
- ^ Accepted organizations for Google Summer of Code 2014. (原始内容存档于2016-04-27).
- ^ Accepted organizations for Google Code-in 2010. (原始内容存档于2016-03-03).
- ^ Accepted organizations for Google Code-in 2011. (原始内容存档于2016-04-01).
- ^ Accepted organizations for Google Code In 2012. (原始内容存档于2016-04-03).
- ^ Accepted organizations for Google Code-in 2013. (原始内容存档于2016-04-03).
- ^ Accepted organizations for Google Code-in 2014. (原始内容存档于2016-04-27).
- ^ Accepted organizations for Google Code-in 2015. (原始内容存档于2016-04-12).
- ^ Accepted organizations for Google Code-in 2016. (原始内容存档于2016-04-12).
- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79-86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.