随着AI应用在智能手机落地,手机翻译已经成为了很多人的刚需,而在手机翻译中,目前做的最好最完善的,当属华为。
最新发布的华为Mate30 系列在全屏翻译的基础上,又带来了滚屏翻译。只需三个步骤,即可实现多屏内容实时翻译:
1、双指长按屏幕内容;2、点击“【全屏翻译】;3、点击【滚屏翻译】。
据了解,EMUI10 全屏翻译解决了外文翻译的难题,但是如果想要翻译多屏内容,需要一次又一次进行全屏翻译的操作。
随着内容长度的增加,操作的繁复还会使阅读的连贯性降低。如此一来,滚屏翻译便派上了用场。
据悉,EMUI10 滚屏翻译支持各种应用、十种语言、多屏内容的翻译。使用小艺语音口令 “帮我翻译屏幕”或双指按压屏幕即可使用。
按照官方说法,当你浏览一篇长文章需要翻译时,系统会先将其滚动截屏,形成一张原文的长截图,然后对长截图进行切分、文本检测、翻译、排序、去重、拼接,最后以同样的图片和翻译完成的文字,再次呈现在你的面前,这就是滚屏翻译。
在对长截图进行初步处理的过程中,会用到OCR,即光学字符识别(Optical Character Recognition)技术。也就是对原来长文章形成的长截图上的文字,进行识别提取,将它们提供给后续的机器翻译环节使用,也就是完成了长篇源文字提取的过程。
从技术原理上为检测和识别两段式算法框架,涉及中、英、日、韩、俄、西、法、德、意、葡十种语言识别能力,包含多个运行于NPU(Neural-network Processing Unit,神经网络处理单元)的深度模型。
翻译得准不准,依赖于OCR识别的准确性;翻译得快不快,依赖于OCR处理字符速度的快慢,而这些主要取决于华为Mate30 系列的NPU算力。