微软的视觉人工智能应用现在可以在安卓上使用了。这款应用可以帮助盲人或弱视人士扫描文件和货币,并描述他们周围的环境。
微软周一表示,该公司正在将其视觉人工智能应用扩展到安卓系统。这款游戏目前已在Google Play商店上架,支持18种语言,并计划在明年扩展到36种语言。
“视觉人工智能”能够描述一个人周围的环境,旨在帮助盲人和弱视人士完成阅读邮件、识别产品和听照片描述等任务。用户用手机对准摄像头,拍一张照片,然后就会听到描述。
该应用程序针对不同的任务有不同的分类。例如,短文本功能会在出现在摄像头前时大声朗读文本。“人物”功能将识别你周围的人。货币函数将识别货币。“场景”功能可以让你听到对你拍摄的场景的描述,你可以在屏幕上移动手指来听到不同物体的位置。人工智能还可以阅读手写文字和识别颜色。
这款应用已经可以在iPhone和iPad上使用。安卓和iOS版本都包含了更新后的功能,比如提供更多细节的照片描述,以及对扫描过的文件提出问题的选项,比如菜单上有什么,或者收据上某件商品的价格。你也可以让它总结一篇文章。
“全球有超过30亿活跃的安卓用户,将‘看得见的人工智能’引入这个平台,将使更多的盲人和低视力群体能够在日常生活中使用这项技术,”‘看得见的人工智能’创始人萨奇布·谢赫在一篇博客文章中说。“随着更多版本的推出,客户反馈将继续对未来版本的Seeing AI应用程序的新人工智能增强功能至关重要。”
近年来,谷歌(Google)和苹果(Apple)等其他科技巨头也发布了针对盲人或弱视用户的功能。谷歌的Lookout应用程序可以帮助人们用手机的摄像头识别物体和阅读文件,而Pixel上的Guided Frame则使用音频线索和触觉来帮助人们自拍。苹果的Point and Speak功能会在人们指着它的时候大声读出文本标签,iPhone和iPad上的门检测功能可以帮助盲人或弱视者在到达一个新地方时找到门。