有 1700 万人,想听图片开口说话

财富   2024-12-03 20:11   浙江  
你有没有想过,盲人怎么用手机?

他们用手机主要靠听文字。

但当越来越多信息用图片来表达,他们会错过很多重要信息。

那图片可不可以听?

蚂蚁工程师程长军(花名:整型)利用业余时间,用蚂蚁自研的百灵大模型开发了一个全新读图 AI,在开了旁白模式的手机上,视障用户点中一张图片,就会听到这张图片的“自我介绍”。

这个 AI 小创新,在今年 6 月获得了一年一度“蚂蚁黑客松大赛一等奖,几个月后,它被支付宝里“天天秒杀、“消费圈等几个受欢迎、图片量大的小程序接入。眼下,每个月有近万名视障用户在支付宝上听“会说话”的图片。

程长军给这个 AI 能力起名“看见”。

他说,盲人看不见我们,我们也经常看不见他们。因为看不见,所以不知道他们的痛点是什么。所以,“看见”的意义,从来都是互相的。看见了,就懂了。就像那些盲人按摩师傅一样,痛点找到了,问题就能解决。

今天是国际残疾人日,在中国有 1700 万视障人士,期待更多能“看见”他们,也让他们“看见”的产品和技术,让科技人人可享。

蚂蚁集团
我们努力,为世界带来微小而美好的改变
 最新文章