您的位置:计世网 - IT制造

科技有爱:视障用户也能“看到”图片了

(来源:TechWeb)

【TechWeb报道】近年来,随着互联网技术快速发展,以大数据、云计算、人工智能为代表的新一代前沿科技,正以前所未有的能量,改变着我们的日常生活。外国朋友对中国“新四大发明”,羡慕到不行,而身处科技浪潮下的中国人,却早就习以为常。

然而,在你我享受科技“红利”所带来便利的同时,一个庞大的群体,却常常被人忽略:数据显示,目前中国有约1300万视障者,占总人口的1.2%到1.3%。除此之外,中国还有千万级别的读写、听力、言语障碍人士。

1

和每位普通用户一样,他们也身处于这个数字化、信息化的时代,他们也需要使用电脑、手机,并通过互联网工作学习、购物娱乐。让科技“雨露均沾”、让我们不再“不一样”、实现“信息无障碍”,这已成为亟待解决的重要课题。

值得欣慰的是,这类“千人千面”的用户需求,正逐渐被社会各界和广大互联网企业所关注。同时,受益于人工智能等新技术的不断创新,也为无障碍交流的实现,在技术开发和场景落地等环节创造了可能。目前,在无障碍化交流领域的科技创新,得到了全球科技公司的普遍重视。

比如针对视觉方面,苹果为失明或弱视人士开发的Voice Over(旁白)语音辅助功能,其iOS内置的屏幕阅读器以朗读的方式,为有需要的朋友在操作设备时提供语音播报,用画外音为“爱心”导航。

对于听力障碍用户,谷歌此前也提供了一种类似“屏幕字幕”的功能,帮助用户在需要查看含有语音的页面时,可不依赖于音频输出,由系统自动甄别声音后,在屏幕上转化为实时字幕,用文字记录“爱心”。

2

国内方面,越来越多的中国互联网科技企业,也正在为全球网络信息无障碍事业贡献着各自的一份力量。比如较早着手于信息无障碍功能改造的腾讯,旗下产品和技术团队就尝试将图片识别、文字识别等人工智能,赋能于实际的应用场景,帮助障碍用户更好感受互联网生活。

去年手机QQ通过腾讯优图实验室提供的OCR技术,对“文字提取”功能进行无障碍沟通优化,帮助障碍用户通过手机QQ“扫一扫”功能,识别图片上的文字内容并进行语音播报。它还可以识别阅读实体书、药物说明等更多图片及文本,这对于视障用户或视力下降的老人来说,科技成为了他们的贴心“助手”,让障碍用户享受到更多的社交乐趣。

不仅如此,刚刚上线的最新安卓版QQ空间APP中,新增加的“图片语音即时描述”功能。它主要运用腾讯AI Lab的“图像描述生成”技术,该强化学习算法曾在MS COCO相关类别的顶级国际挑战赛上超越微软和谷歌排名第一,机器能将图片识别成一句文字描述,让AI去理解图片内容,并用较为通顺的语言朗读出来。这也是QQ空间在无障碍社交领域的一次新的尝试,让视障用户借助科技的力量理解图片,让图片自己“说话”。

3

为了让无障碍功能更实用、体验更好,在功能上线前,QQ空间邀请视障用户测试体验,并在上线后持续收集视障用户使用过程中给到的反馈和建议,不断进行功能优化。一位视障小伙伴内测体验后表示:“其他人可能没什么感觉,甚至认为参考性不大,但对我而言却仿佛打开了一扇全新的大门。之前我对于一般熟的好友动态,只会通过文字揣摩他要表达的意思,关系好的才会评论问图片是什么?而以后这一步基本可以省掉,在也不必让好友描述配图了。”

确实,在这个产生巨大价值,蕴含无穷想象的信息化时代,互联网已经成为驱动社会进步的重要动力。这股前所未有的科技变革中,每个人都应该能够使用网络,并畅享网络带来的便利,对于你我普通之人来说用处不大的设计,却可能是让他人连接世界的重要桥梁。

除了视觉和听觉障碍,还有更多存在着运动缺陷、认知障碍、功能性损伤的朋友,探寻他们的个性化需求,帮助他们方便快捷地、无障碍地获取信息,这将是全球互联网科技公司未来实现社会价值的全新课题。

尽管“Accessibility”(无障碍功能)难以拼写,却不一定难以实现。随着互联网边界的无限拓展,用户必将呈现出不同维度的多样化诉求。而让网络信息无障碍,让爱与希望无障碍,无疑是不可阻挡的必然趋势。

文章评论

关注作者的人