用户:Floweronhead/沙盒3

影像翻译（Image translation）是指将影像或照片中的文字翻译的技术，例如：海报、看板、餐厅菜单、告示牌、文件或萤幕截图等。光学字元辨识（optical character recognition）的技术可以抽取出影像的文字，然后这些文字会翻译成想要的语言，然后使用数位影像处理的技术，将原图处理成一张文字被翻译过的新图。影像翻译也和机器翻译的研究领域相关。

概述

机器翻译的研究让文字的翻译变得更加简便，而光学字元辨识技的进展让人们可以翻译影像中的文字。在2004年，日本的手机第一次引进光学辨识的技术，让使用者可以透过镜头将拍到的文字抽取出来。而且，抽取出的文字可以被进一步处理，被储存成网址的URL连结，或是拿来使用在电子邮件或简讯。

近年来，移动设备的硬件有长足的进步，相机的画质提升而且自动对焦的技术也被开发，让使用手机进行文字的扫描变成可能。于是，影像翻译的技术出现了，让使用者在扫描出影像中的文字之后，还能够进一步将文字翻译成他们想要的语言。越来越多的相关应用也开始出现，例如：Word Lens^[1]。在这个程式被Google取得之后，它成为了Google翻译行动app的一部分。

另外，随着影像处理技术的同步发展，人们可以将影像中的文字替换成翻译过后的文字，而处理成一张全新的照片。^[2]

历史

影像翻译的展来源自于光学字元辨识的进步，由于需要进行光学字元辨识的记忆体和运算量比以往减少许多，让移动设备也能够进行文字的扫描。

第一个声称可以用移动设备的相机镜头"阅读"文字的是International Wireless这家公司。他们在2003年发布了CheckPoint和WebPoint这两个软件。前者可以用来辨识发票的文字，后者可以辨识被印出来的网址连结，并在装置上开启该网站。^[3] 在2005年九月，NEC和日本的Nara科学研究机构发布一个新的软件，让使用者可以用手机进行文字的扫描，而且这个软件可以扫描整页的文件。然而，这两家公司宣布他们不会在2008年底之前发布这份软件的商用版。

到了2008年四月，Nokia发布了Shoot-to-Translate应用程序，可以将装置拍摄到的影像中的文字抽取出来并翻译。这个应用程序只提供中文和英文之间的翻译，Nokia那时也表示他们正在开发名叫Multiscanner的产品，希望能够提供52种语言之间的翻译。^[4] 在2014年五月，Google取得了Word Lens的使用权，让视觉和语音的翻译品质有了显著的进步，让移动设备可以立刻地翻译扫描的的文件或是图片。在2018年八月，一家印度公司开发了ImageTranslate，它可以辨识、翻译影像的文字，并且重新生成一张文字被翻译过后的图片。

现今，常见的影像翻译服务由以下几家公司所提供：

Google翻译
ImageTranslate^[5]
Yandex^[6]

References

^ WordLens Tm: wiki. [2019-03-23].
^ ImageTranslate Tm: website. [2019-03-23].
^ International Wireless, Inc. Reads Personal Checks with Cell Phones. - Free Online Library. Thefreelibrary.com. [2012-02-24].
^ [1] 互联网档案馆的存档，存档日期April 12, 2009，.
^ ImageTranslate. [March 23, 2019].
^ Yandex ocr translate. [March 23, 2019].

[:0-1] WordLens Tm: wiki. [2019-03-23].

[2] ImageTranslate Tm: website. [2019-03-23].

[3] International Wireless, Inc. Reads Personal Checks with Cell Phones. - Free Online Library. Thefreelibrary.com. [2012-02-24].

[4] [1] 互联网档案馆的存档，存档日期April 12, 2009，.

[5] ImageTranslate. [March 23, 2019].

[6] Yandex ocr translate. [March 23, 2019].

[1]

[2]

[3]

[4]

[5]

[6]