据9to5google消息,最新版本 Chrome可以自动为网络上没有任何识别标签的图片创建描述。
对于有视力障碍的人在网上阅读时,需要使用屏幕阅读器转换成语音或盲文输出。虽然网站对图片标签的要求越来越高,但网上有许多图片缺少alt文本。因此,诸如chromevox屏幕阅读器只能输出“图像”、“未标记的图形”或文件名语音。
为此,Chrome给出的新解决方案是将未标记的图像发送到谷歌服务器。并通过一些机器学习模型,包括寻找文本、识别对象等技术分析照片。
有的模型可以在图像中查找文本,包括图片特有的标志、标签和手写单词。其它模型则可以识别出训练过的物体,如铅笔、树、穿西装的人或直升机。最复杂的模型还能用完整的句子描述图片的主要内容。
在大多数情况下,这些模型会将最简单的答案将提供给用户的屏幕阅读器,如果不能识别信息将返回“没有可用的描述”。
目前,这个“从谷歌获取图像描述”的功能已经测试了几个月,谷歌已经创建了 1000 万个描述,每天还以数十万个速度增加。